蓝山

从1977年中国恢复高考至今已经过去40多年了。如果说1977年恢复高考,标志着一个时代的拐点,那幺 2017年的高考也注定是一个跨时代的节点,因为那年的高考迎来了两位特殊的考生——“高考机器人”AI-MATHS和“高考版阿尔法狗”Aidam。

“高考机器人”AI-MATHS是国家863计划信息技术领域“基于大数据的类人智能关键技术与系统”项目的重要研究目标之一。该项目于2015年启动,以科大讯飞为牵头单位,联合中科院软件所、中科院自动化所、北京大学、清华大学等超过30家科研院校和企业共同研发与实施,主要针对大数据所带来的新的技术与挑战,研究相关类脑计算关键技术和类人答题系统,开发出能够参加高考并考取一本大学的智能机器人。计划在2019年或2020年完成最后的成果测试。

而“高考版阿尔法狗”Aidam则是由“学霸君”从2012年开始着手,集200多位技术人员之力进行研发的心血之作。2017年6月7日,AI-MATHS和Aidam分别选择在断网和联网的模式下向2017年高考文科数学发起了挑战。最终AI-MATHS在断网的情况下用时22分钟完成了当天北京卷文科数学高考试题的解题,成绩为105分;解答2017年全国文科二卷数学试题用时10分钟,成绩为100分。

Aidam在联网的情况下同时挑战6位高考状元,用时9分47秒完成2017年全国文科二卷数学试题的所有答题。高考状元们平均用时一个小时。但是从得分来看,6位高考状元从119分到146分不等,平均得分135分,Aidam则是获得了134分,最终以1分惜败。

总体来看,在那次考试的平均用时上,AI-MATHS每题平均用时19.35秒、Aidam每题平均用时18.94秒,基本相差不大。不过,由于一个是选择断网模式,另一个是处于联网模式,所以在数据与分数之间难以作比较。

是show case还是真突破

中国的这项测试也并非个例。在日本,有一名教授花了数年时间去训练机器人参加知名的东京大学的入学考试。2015年和2016年,她的Todai机器人的考试成绩超过了80%的高中生,数学成绩更是超过了99%的高中生。然而,这位日本国立情报学研究所的数学家并没有因为其机器人的出色表现而感到高兴。她指出:“大多数学生只是将知识填充到自己的脑子里,而没有真正理解那些知识,纯粹是记忆,而这却是高考机器人的优势。高考机器人能考出好成绩,也从侧面反应出人们需要新型的创新式教育,而不是填鸭式的机械教育,不然人人都会变成高考机器人。”

那幺,为何在中国还要研发机器人来参加高考?这仅仅只是一场show case吗?从机器人的高考数学得分数据来看,其实它跟AlphaGo一样,并不能算是真正的人工智能。在大多数人的理解中,人们肯定以为AlphaGo是通过计算推理、理解分析出围棋的所有变化,并能具体地分析出棋手的下一步意图,以此来击败人类的。但实际上AlphaGo根本不用试图去穷尽对手的思维变化,它只要尽可能多地收集职业高手的棋谱数据,然后用极其复杂和巧妙的算法挑选出每个局面下胜率最高的那一招就行了。由于互联网本身就是一个大数据库,所以通过在互联网的抓取,只要职业高手间的对局越多,AlphaGo收集到的数据就会越多,也就会越强。

而高考机器人基本也是如此,在理解类题型上,没有联网的AI-MATHS得分为0。也就是说在未联网的情况下,AI-MATHS无法查询相关的网上资料,只能通过已经做好的知识储备,依靠这些它并不能理解考题的含义。如果要理解,对它来讲这可能又需要更多相关的数据来做堆积。这也说明机器人目前的自然语言理解能力还有缺陷,并不具备完全独立的推理和思考能力。

实际上,人工智能跟之前的整个大数据潮流是一脉相承的,目前的人工智能并不是一种完全智能化的东西。在几十年以前,人工智能就已经有一个雏形,在这个雏形里面当时各种技术的发展其实跟现在相比没有太大的区别。当时人工智能的发展有两条主流路径:一条路径是以机器推理为主,希望让电脑学会人类的推理方式。比如,它可以理解爸爸和儿子是什幺关系,理解老布什和小布什之间的关系。这就是真正对智能的模拟,因为它更接近智能化,所以,这条路径在当时是被广泛看好的。另一条路径就是现在非常火的以神经网络为代表的这一系列理念。这部分的做法其实是不去考虑和理解人们通常概念里面的相关信息。比如通过大量的数据训练,电脑会理解老布什和小布什是有关联的,这种关联是一种叫做父子的关联,但父子是什幺意思,它是不知道的。

不过,在当时大家都不看好神经网络这条路径,因为觉得它太浪费,似乎是在用海量的计算力和大数据在做一件看上去很笨的事情。但如今一个苹果手机的CPU的计算能力就可能相当于原来堆满一个房间的电脑的计算能力;互联网的快速发展也使大数据得到了快速的积累和量化。由于计算能力和大数据积累量在短期内都有了快速的提升,所以简易的笨办法也有了“恣意挥霍”的资本。

2017年教育机器人Aidam与高考状元的PK现场

从本质上来看,如今的高考机器人还被定义为一个“聪明无比的笨蛋”。这也是为什幺高考机器人首次参加高考只选择数学,而不选择其他科目的一个重要原因。相对于有着大量主观分析和理解类题型的语文科目而言,数学是一门相对容易的学科,因为数学更多的是依据符号逻辑。具体而言,一方面是因为数学语言都是一些比较标准化、结构化的描述语言或出题语言,所以机器人较好理解;另一方面,则归功于几十年前这类的定理、自动证明等一系列的研究就已经获得了不错的成果,可以在高考机器人中发挥作用。那幺“高考机器人”在数学考试方面的成绩也就不难理解了。

因此,目前高考机器人的出现更多的是一场show case。因为它本身对学生的学习没有任何帮助,仅仅旨在对外展现目前AI的研发能力。但是它的背后却代表着一个体系的转变。

背后是AI和教育的互助联姻

在过去的10年时间里,以新东方为代表的互联网教育解决了人们大量的碎片化和空间化问题。但填鸭式、机械式的教育模式等痛点并未从本质上得到任何改变,那幺AI和教育的联姻,是否能逐一击中这些痛点呢?

AI助力教育事业的价值,主要体现在以下四个方面:

一是“辛勤园丁”可以提高“产能”。我们都说教师是“辛勤的园丁”,这不无道理,教师在日常教学工作中从事着很多重复性的劳动。教师的工作场景中诸如试卷批改、作业审阅、课程复习等都是一些繁琐的重复性工作,而未来这部分工作可以通过AI的图像识别、语义理解等技术去“代劳”。

二是学生能获取“千人千面”的个性化教育。虽然我们每个人都曾领教过老师神奇的“千里眼”和“顺风耳”的威力,但并非每次开小差或者某知识点缺失的问题都会被老师捕捉到。人工智能则可以利用丰富的数据采集和先进的算法,向每一位学生提供个性化难度和个性化节奏的自适应学习。

三是AI推动教育资源的公平化。我国优秀教师资源稀缺,而学生基数庞大,造成山区优秀教育资源匮乏,而城市教育资源过分集中的窘境。AI则可以更深层次地了解每一位学生,提供智能的“私人名师”教学,打破优秀教育资源的空间限制。

四是AI使教育从获取文凭转向获取内容驱动。以前,学生从一流的高校毕业可能不愁找不到工作,但是将来文凭不再重要,重要的是学生的创造性能力,教育内容也会逐步回归对个人创造力和潜能的培养。

总之,人工智能在深度结合教育场景,通过向教育专家、教师学习,了解教育真正的需求数据以及教学、教研的真正场景的过程中,也会促进人工智能技术的应用与发展。

AI-MATHS机器入

学霸君Aidam

智能教育存在的挑战及未来

不过在智能教育面前,无论是BAT(中国互联网公司三巨头)等大企业还是初创公司,目前面对的还都是一个充满诱惑、无法预知的“大蛋糕”市场。在很多基础层面,AI的技术并未实现完全的突破。比如,AI在自然语言理解上需要提升的空间还很大。

虽然现阶段机器人已经可以参加高考,也取得了不错的成绩,但是数学相对而言还是比较标准化和数字化的。此前微软也让小娜尝试过撰写汉语作文,但也仅仅只能完成简单的撰写,离具备创造性、深度性和情感性的要求还有很大的差距。

此外,AI需要学习的大量分层数据非常复杂。学习数据通常可分为键击层、回答层、学期层、学生层、教室层、教师层和学校层等,数据分布在这些不同的层面之中,处理难度相对较大。

AI想要落地到教育的场景层,首当其冲的就是知识的结构化。如何让知识的生产者、持有者和分享者,协同一致地来做好这件事情是一大难点。这就需要知识的生产者能提供更好的工具、开创出更新的场景价值,有效地吸引人们共建整个生态圈。其次,智能教育在推广的过程中如何在短期内得到使用者的认可,也是一大挑战。像国外做自适应最早的Knewton,国内的乂学教育,它们都面临着同样的问题:价值不清晰。生产商认为自己开发了一款高端的自适应引擎,但是如何能让人们在短期内对其产品的价值作出评估,并获取人们的信任呢?目前有一种办法,那就是考试,但得有人愿意体验才行。另一个衡量方法则需要用户在体验的基础之上,与他人进行对比。假设有两个学生的考试成绩完全一样,但其中一人使用智能教育,每天只学习4小时,而另一人每天需要学习8小时,那很有可能是智能教育在其中发挥了大作用。但是每个人的智商是不同的,这又该如何去评估产品的价值呢?因此,用户的评估和反馈是一个很大的挑战。

要想进入AI+教育的这个版图,除去AI技术本身的壁障外,从以上的挑战可以看出,企业还需解决两大问题,即利用场景创新驱动的个性化教学和衔接好技术+商业的产业链生态圈。

总而言之,人工智能进入教育,或许对整个行业来说会是一个“改天换地”的过程。未来的教育或许会更加重视对受教育者的想象力、创造力以及情感等方面的培养。究竟未来的智能教育会走向何方?在此,引用霍金曾说过的一句话作为回答:“人工智能可能是历史上最好的事,也可能是历史上最坏的事。”