林晖物流 英语流利说首席科学家林晖:人工智能让教育更“懂你”

2017-09-25
字体:
浏览:
文章简介:英语流利说联合创始人兼首席科学家林晖在TAB(Tech and Business)教育科技论坛上就人工智能对提升教育效率,以及AI老师的研发等方面做了非常有价值的分享.以下是林博士的分享内容精选:大家好!很高兴参加上海TAB教育科技论坛,我叫林晖,我是英语流利说的联合创始人兼首席科学家.我在美国读博士期间做的是机器学习的理论研究,在自然语言处理方面做了一些应用,后来加入谷歌美国总部做语音识别方面的研究.我们团队从2012年创立英语流利说,然后开始看教育领域.今天想跟大家分享一下我是如何看待人工智

英语流利说联合创始人兼首席科学家林晖在TAB(Tech and Business)教育科技论坛上就人工智能对提升教育效率,以及AI老师的研发等方面做了非常有价值的分享。

以下是林博士的分享内容精选:

大家好!很高兴参加上海TAB教育科技论坛,我叫林晖,我是英语流利说的联合创始人兼首席科学家。我在美国读博士期间做的是机器学习的理论研究,在自然语言处理方面做了一些应用,后来加入谷歌美国总部做语音识别方面的研究。我们团队从2012年创立英语流利说,然后开始看教育领域。今天想跟大家分享一下我是如何看待人工智能技术在教育领域的应用。

一、引题—教育的公平与效率

自从人类出现文明以来,教育就是一个社会话题。在最早的时候,教育可能还只是少数人才拥有的权利,只有贵族才能接受教育。到了20世纪教育得到了普及,开始成为大多数人的需求和权利。但教育的普及也带来一个问题,当教育开始走向公平化以后,还存在一个效率问题。如果把教育做成类似大锅饭、一碗水端平的状态,其实很难保证每个人受教育的质量。

首先,我们来看看今天“教”的效率是怎样的。以英语举例,按国际上面通用的英语衡量标准,从英语初学者到英语流利需要花的学习时间需要1000到1500小时,而我们中国人从小学到中学、再到大学,花了多少时间学习英语呢?大概超过5500个小时,但结果是超过90%的人仍然没有办法用流利的英语进行交流,这说明在英语的“教”和“学”方面效率是很低的。

另外,中国学生的课业负担是非常重的,晚上十点前能完成作业已经是不错的了。现在有拍照答疑类APP,大家这些APP出现请求的峰值是在几点吗?后台数据显示是在晚上十一点。也就是说到了晚上十一点,眼看作业做不完了,就开始拍照、搜题、找答案,从这里可见学生的课业负担真的很重。

我们应该思考,孩子们真的需要做这么多题、花这么多时间吗?以中学数学为例,一个学生在整个中学生涯做的数学题可能是几十万道,平均每个考点做了几十道题。那么真的需要做这么多题吗?这里面的效率有没有可能提升?

提升效率的简单思路就是做个性化教学。也就是说在教学的过程中老师知道这个学生是哪一个知识点薄弱,然后针对性这个知识点做提升训练,只把时间花在薄弱的地方,而不需要浪费时间在已经掌握知识点上,这样学习效率自然就提升了。

但是个性化教学必须要有一个专门的老师盯着单一学生,而且还得清楚的知道这个学生当前的状态,然后做一对一的教学,或私教。私教有可能解决个体效率问题,但当我们把走向教育公平性的时候,私教是没有办法解决群体的教学效率问题的,因为学生数量总是超过教师数量,我们现在中国有大概超过两亿左右的学生,而在职老师还不到一千万。这个数量差距非常大,因此也不可能给每个学生都配一个老师。

而且需要注意的是:并不是每一学生做一对一教学之后学习效率都会提升,因为私教对老师的要求还是很高的,只有好的老师才能教出好的学生。有时候虽然形式上是一对一教学,但是老师可能并没有很好的教学,也可能不懂教学或者不是特别好,这样的话学生的学习效率也不一定能够提升。

最经典的或者说最有意思的所谓一对一私教的例子,就是亚里士多德和亚历山大,最好的老师教出最好的学生,他们很早的时候就是师徒关系,采取的是一对一教学。老师的质量其实是很重要的,一对一教学想要提升学习效率也需要非常好的老师才行。问题是我们现在先不说数量的悬殊做不到一对一,即使这个数量可以匹配,也存在着老师的教学质量如何保证的问题。

接下来就引入了我今天要讲的主题:怎么解决教育效率的问题。其实光靠人力是没有办法解决教育数量和质量问题的,我们需要借助机器,借助人工智能,也就是我们正在做的做一个AI私教,一套智能教学系统。这其实是一个很自然的思路,人解决不了的难题就造一个机器代替人做,同样在教育领域这个事也不是什么新鲜的idea。

其实在20世纪60年代就已经有人有这种想法了,而且还做出消费级产品。据说这个叫做“教学机器”的产品在两年内还卖出了两万多台。

在那个时候他们用类似打印机的技术给每一个人定制一个做题的过程,你前面做题的对或错会影响学习者下一道题的展现,这个在60年代就有了,但到今天我们来看其实并没有普及,也并没有说明人工智能的私教在我们教育领域已经变成很普遍。

二、优秀教师应该具备的能力:(1)懂学科、(2)懂学生、(3)懂教学

人工智能现在是很火的话题,那今天人工智能的技术在教育领域的应用是否比20世纪60年代做得更好呢?我们现在能否用人工智能来替代一个老师?而且不是替代一个普通的老师,是替代一个很好的老师,这件事情现在的技术能够做到吗?要回答这些问题,就必须先弄明白一个优秀的老师应该具备哪些能力。我觉得优秀老师至少应该具备三个方面的能力:(1)首先懂学科,这是最基本的要求;(2)懂学生;(3)懂教学。

首先,优秀教师要懂学科。教授某一学科的老师肯定需要对此学科精通,学科知识一般存在教师的大脑里面,通常也会通过教材和习题的方式呈现出来。其次,优秀教师要懂学生。懂学生是教师能够因材施教的基础,教师得清楚所教学生有关学科知识点的掌握程度,也要清楚学生当前的学习投入程度,并且知道学生目前的情绪状态,这些方面做好了之后再来做教学。

最后,优秀教师还得懂教学。做好教学是教师工作最难的部分,其中涉及到教学内容编排,适当的给学生进行鼓励引导,同时还要为学生做好督学答疑。所以,我们用人工智能打造所谓的AI老师时,也希望从这三个方面来评估AI老师。

三、人工智能发展阶段:(1)计算智能-能存会算,(2)感知智能-能听会说、能看会认,(3)认知智能-能理解、会思考

人工智能经历了几个发展阶段。第一个阶段是计算智能,最早的人工智能其实就是计算机,它能存会算。第二阶段是感知智能,即人工智能已经能听会说,而且能看会认,今天真正产生巨大技术突破就是一块,特别是计算机视听方面的技术,在很多方面机器已经做得比人好了。第三阶段是认知智能,希望人工智能会理解、会思考,这也是想达到的最终极的状态。

四、AI老师的目标也是懂学科、懂学生、懂教学

对应到我们造AI老师时,懂学科对应计算智能方面,即把知识数字化、用计算机存下来,这个技术相对简单。懂学生对应感知智能方面,需要AI听懂学生,看到学生的情绪状态,评估学生的学习效果。懂教学对应认知智能方面,需要AI能够针对学生个体做好教学内容编排、引导学习,并且可以做出合理答疑。

接下来,我将和大家分享一下英语流利说利用人工智能设计英语AI老师的实践经验。AI英语老师是英语流利说APP里面内置的一个核心课程,现在我们还是用三个维度来分析我们研发的英语AI老师。

第一个维度是懂学科,它涉及到内容模型和知识图谱。AI老师要先懂得英语这门学科,这里面涉及到内容模型。我们在设计AI老师的时候非常关注学习英语的效率问题,因此引入了先进的RHR层级递归认知理论,它主张听说优先、强调练习、模态多样。

人类学习语言的时候不仅仅是单方面的刺激,还有视觉、空间感官,需要结合人脑认知方面的启发。根据这样的理论,我们花了很大精力制作课程内容。内容模型就是把学科内容给数字化,为此我们确实做很多事,比如说创造了6300 的原创插画、33000 的口语表达、32000 的真题测试等等。

做学科数字化的常用方法是做出学科知识图谱,知识图谱可以告诉我们这门学科的知识框架,做个性化教学的时候就需要把知识图谱跟教学内容关联起来。从英语流利说的研发经验来看,做一个知识图谱,把内容和知识图谱关联起来,是非常耗时的。

而知识图谱,尤其对英语这门学科来说,更多的是一项技能,所以我们用深度学习的技术,让AI自动学习知识图谱。有关注AI相关领域的朋友应该听过这件事,谷歌让它的AI去看一千万张的视频截图,看图之前并没有告诉AI任何概念,AI在看完一千万张图片后,自己学到了人脸的概念。

同样的我们让流利说的AI只看数据,并没有告诉AI这套课程背后的理论,AI自动从大量数据里面学到了这些内容背后的知识关系。这就是数据的力量,这就是新的人工智能技术的力量。

第二个维度是懂学生,这涉及到学生模型。英语AI老师需要具备的第一个能力是听懂学生,也就是语音识别能力。在语言教学过程中,其实AI最难任务也是做好语音识别。因为它要面临一个不确定的维度,即语言学习者的水平参差不齐,英语水平好的人自然好识别,但是水平中等、甚至较差的学生识别的准确性就很难把握。

英语流利说借助于数据和新的深度学习技术已经在语言识别领域取得巨大成绩。在过去几年中我们积累了大量的中国人说英语的语音数据库,它可能是世界上最大的带标注的中国人说英语的语音数据库。

我们有超过4200万的用户,他们每天都在我们APP上面花很长的时间学习,给我们贡献大量的数据,利用大量的数据我们打造出我们的语音识别引擎。

我们跟世界上所有开放的顶尖语音识别引擎做比对,包括谷歌、microsoft和国内的大公司,检测结果显示英语流利说的语音识别引擎效果是最好的。基于精准的语言识别后,再给学生找错误,并从各个维度对他的口语进行评分。

去年苹果的全球高级副总裁Philip Schiller访问了英语流利说。他很有兴趣的现场试用了我们评分系统。有意思的是我们评分引擎没有给他满分,而是告诉他有一个单词发的不好,那个词是ARE,他试了两遍都没有把那个词读标准。

当时气氛还蛮尴尬的,因为他是美国人,不应该在这个方面犯错的。大家正尴尬的时候,他说“这个引擎真是太准了,我是波士顿口音,波士顿口音会习惯性的把R后面的元音给漏掉。”当时我根本不知道什么是波士顿口音,只是觉得他很nice的给我们一个台阶下。但后来我再查维基百科,发现确实波士顿口音会把R后面的原音省略掉,而我们的引擎也在当时非常敏锐的抓住了他口音上的问题。

去年发布的雅思流利说,集中反映了我们最先进的口语评分、反馈的技术。了解雅思的人会知道雅思口语考试是和真人互动,雅思考官坐在那跟你一对一的聊天,然后根据你的回答做各个维度的评分,包括发音、语法、语用、流利度连贯性。雅思流利说是第一个能够对这样的口语考试进行仿真而且做自动评分的引擎。我们的AI系统已经超过了真人考官的水准,因为雅思考官评分一致性是92%,而流利说的AI评分一致性达到了96%。

第三个维度是懂教学,这涉及到教学模型。刚刚提到有很多教学手段,其实有些已经可以通过产品化实现的,比如说鼓励引导和学情数据呈现。我们AI老师会即时反馈给学生一些成就感,通过声音、分数给学生一些鼓励和引导,并通过数据反馈学习程度,进而帮助你更好的有目标感。

流利说也在尝试做更深度的研究,我们用了一个深度增强学习技术来做教学模型,这个图是我们教学模型的框架。我们有两个AI,一个是模拟学生的AI,一个是模拟老师的AI。

AI老师跟AI学生在不断对弈过程中提升自己的教学能力、教学方法。学生AI依赖于数据量,学生反馈的数量越大,学生AI就能够越模拟得更好。相应的AI老师就可以24小时×7天式的跟AI学生互动。

综合来说,我们打造一个会教英语的AI老师是围绕懂学科、懂学生、懂教学三个方面的AI相关技术。在懂英语方面用了知识图谱提取技术、内容数字化技术;懂学生方面用了识别、评测方面的技术;教学方面用了深度学习、自适应学习方面的技术。

“懂你英语”实现3倍提升英语学习效率

我们请了四百位志愿者做测试,而在使用我们的课程之前,我们用ETS做第三方测试。在学完我们课程以后再做一次ETS测试,我们发现AI英语老师实现了3倍提升学习效率。根据国际通用的标准,提升一个级别需要100个小时,而用流利说的AI老师教学只花36.5个小时效率提升了3倍。

虽然英语流利说在AI老师方面的尝试取得一些成绩,但往前看挑战依然非常多的。主要的挑战还是在教学这一块,怎样让AI老师不但能够编排做好的内容,还能够真正的给学生做一些真人老师才能做的事情,比如好的老师可以给学生产生情感反馈,这些都是机器、AI技术目前相对比较薄弱的地方。

但是我们相信随着技术的发展,在这些方面AI也能够逐渐的走强,我们也会在这个方面做更多的投入,因为我们相信技术会改变教育,而教育会改变未来。