遇见好产品:带你摸清英文口语评测技术的门道

一个好产品能最大程度地满足用户需求,一个教育的好产品能获得学生的喜欢与家长的信赖,有了好产品,才有更好的教育。

环球网教育频道联合知更鸟网特别推出了大型访问栏目《遇见》,一起遇见好产品。

小编有幸采访到了驰声创始人林远东,一起聊聊驰声的强大口语测评技术。

人物介绍——

林远东,语音评测技术专家,驰声创始人&CEO,本科毕业于清华大学,硕士毕业于剑桥大学,曾任英国标准协会(BSI)全球新业务总监。为充分了解语言教育,林远东曾担任剑桥大学工程系语言中心中文教师,2007年创建驰声团队,随后归国产业化,至今已参与建设了超过上百个语音评测相关项目和产品,荣获“苏州工业园区科技领军人才”荣誉称号。2015年带领驰声加入网龙网络公司,在网龙构筑教育生态系统的大平台上,持续为学习者高效提升学习体验而奋斗。

小编:您在剑桥大学创立了驰声团队,为什么一开始选择做评估发音能力的软件?

林远东:我从清华毕业后,就去了剑桥攻读硕士学位。2005年,我进入英国标准委员会(BSI)担任全球新业务总监,闲暇时间为BSI的高层教授中文,却意外的发现外国人对学习中文有强烈的需求,为此,我从BSI辞职回到剑桥担任中文老师,学习中文教育的那些事儿。

这两年在剑桥教中文的经历,确实很有益,也是驰声立下要用智能语音评测技术改变语言学习方式目标的起点。

第一年,我花了大量工夫备课,中规中矩的课堂教学效果惨淡,期末时学生到堂率仅剩20%。

第二年,我请来一位知名的中文老师录制了教学视频,结合团队正在研发的智能语音技术做互动,让学生在机房先自学,再开口练习。我在课堂上再结合错题,重点讲解。这样的授课方式效果不错,期末班级到堂率高达90%。

剑桥大学智能语音实验室在国际全行业最高规格的赛场上屡屡夺冠,驰声智能语音评测技术正是起源于此。这两年的教学经历使我坚信:智能语音评测打分技术在语言教育方面的价值,不仅可以节省教师人力、提高教学效率,还能驱动教学方式的变革。

科技改变生活,更成就梦想。

驰声团队在英国创业期间,获得了英国政府优秀高科技企业奖、威尔士政府优秀高科技项目奖、剑桥大学最佳商业计划奖等殊荣。2008年,驰声团队正式回国设立总部,亦被认定为国家高新技术企业,并屡屡获得中国最具商业价值人工智能公司TOP50、优质教育技术服务商等荣誉。

回想刚创业时,有人开玩笑“几年后,就可以想想古巴的沙滩,蓝天白云,波涛汹涌”。可是,这份事业,我们一干就是10几年。办公室越来越大,团队成员从几个人扩充到百来号人,一起奋斗的小伙伴,从少年变成了大叔,而公司也从用技术帮助外国人学中文,拓展到用英文口语评测技术帮助全球132个国家和地区、每天过亿人高效学习英语。

驰声前进的步伐是越来越快了。

小编:请您介绍一下驰声,它的核心优势在哪里?

林远东:英语口语从前只能被称为素质教育,在中国教育版图里永远是“游击队”。

2014年9月,国务院发布的《国务院关于深化考试招生制度改革的实施意见》,高考外语科目拥有了两次考试机会。随后,上海、北京等地相继发布了各自细则。随着北京、上海正式把英语口语考试纳入中高考的范畴,更是推动K12口语考试教育培训市场井喷式发展,并一步步变成素质教育和应试教育并重的市场。

K12口语考试的存在与普及,让整个市场潜力无穷,虽然玩家将越来越多,但要进入这个行业的门槛也注定将越来越高——

1、算法。即便不计资本、人力投入,再高效的情况下,一套语音评测技术至少需要9-12个月的时间才能搭建出来合适的算法。

2、数据。数据之于人工智能技术,相当于汽油之于汽车。要知道,建立一个实验室语音引擎只需要100个小时,而做到业界顶尖也仅需5000个小时的数据,而驰声在十年间与优质客户合作,平均每月有80亿录音人次、每年积累700万小时的语音数据,并用数据反哺引擎,从而使引擎持续保持领先地位。

强大算法和庞大数据积累,正是驰声的核心竞争力。

驰声入行早、扎根深、专注更专业,是智能语音界最热衷创新的公司之一。平均每年都会发布新技术,业界首个评估中文发音能力、声调能力、定位声韵母的SDK都出自于驰声。再比如,驰声去年发布了业界首个开发题型多维度评估的评测内核,这意味着,驰声不仅是中国能为口头作文、看图说话、翻译题等口语开放题型评总分的少数几家公司之一,还能为内容、发音、流利度等细分维度一一评分,给予学习者更丰富、更全面、更客观的评价反馈。

驰声将中英文口语评测技术做成标准化、跨平台的模块,智能诊断纠错技术可以诊断出学习者每个细微的错误发音,评分准确率远超同行业。

在语音评测技术授权(API)领域,驰声占据了中国市场的半壁江山,为新东方、VIPKID、Person等知名教育公司提供技术支持,因而驰声享有“中国语言教育产品的智能语音工具包”的美誉。

驰声技术还有另一个美称——“考试级口语评测引擎”。2012年,驰声开始站上中高考的舞台,评测技术受各地教育局和考试院的信赖,多年来,驰声服务了广州、成都、沈阳、银川等多地的小升初、中职、中考、高考等英语听说考试的机考机评项目,是中国屈指可数真正有中高考实施经验并且评分性能受官方认可的语音技术提供商,累积服务百万考生。

小编:驰声专注了语音评测技术12年,与其他公司的技术相比有何突出特色?

林远东:当然,在人工智能领域,驰声一直追求用技术改变人的学习方式,提高学习效率。

以前,语音技术更多只是做到打分,完成了评分闭环。但是只有口语打分,并没有从本质上提升学习效率,因为并没有告诉学习者哪里犯了错,犯了什么具体错误。

驰声语音评测实验室的做了一项研究,调取大量的录音数据发现,大部分学习者在短时间内练习同一个内容,第1次错和第10次错、甚至100次错的地方往往是一样的。我们总结85%的语言学习者,总是在重复犯错。

那么,如何才能捕捉到发音错误?驰声研究团队发现,音素(phone)是根据语音的自然属性划分出来的最小语音单位,直观呈现学习者的实际发音序列,并与标准音标进行比较,进而发现错读、漏读、多读的音素,这样最为直观高效。

于是,2018年,驰声推出可以“看见”发音错误的诊断纠音内核,真正做到以评促教、以评促学。该内核采用音素级发音评价,通过漏读、多读、错读三种算法,可以检测出学习者在发音练习过程中的微小错误。更重要的是,新内核突破了市面上大多评测引擎只能提供发音得分的瓶颈,可通过直观呈现学习者实际发音的音素序列,让发音问题“看得见”!

可直观呈现学习者实际发音音素序列

思考未来,我们认为人工智能技术的发展,都脱离不了这“三步走”的框架,第一步是建立标准,第二步是个性诊断,第三步是反馈指导。

未来,驰声也将继续沿着这个方向布局,加大对语音识别和语音评测的基础研究,让技术与教学深度结合。

小编:驰声未来发展的前景是什么?

林远东:驰声的使命是“消灭哑巴英语,提高学习效率”,通过研发和推动智能技术的应用快速广泛地改变人们学习的方式,让学习变得自然、高效,并实现技术的最大价值!

在智能语音技术评测领域,相对于通用引擎,我认为做好细分领域的个性化“小”引擎和“细”服务,才能比同行更胜一筹。

比如,早在几年前,驰声推出了第一个细分领域的个性化“小”引擎——专属于学龄前至小学阶段的儿童英文口语评测引擎。

推出儿童口语评测引擎是因为小朋友英语发音和成人有诸多不同之处:

1、声学特征方面:音调高、发音不饱满;

2、韵律特性方面:单词之间停顿时间长。由于学龄前儿童口腔肌肉发育尚未完善,唇、舌、牙齿配合不够灵活,容易多读、漏读,句子中的升降调、停顿等也不如成人容易掌握。

为此,驰声通过自适应的方法训练了专属于儿童的评测引擎,特定的打分参数使得评测结果更贴近老师对儿童的评价标准,因而该引擎在市场上大获好评,被众多客户所接纳采用。

驰声现在在做中高考人机对话考试和评分服务,发现不同地区有不同的评分标准,通用引擎难以满足严肃严苛的高考评分需求,同样必须要根据不同地区、不同专家打分标准定制评分引擎。

未来人群的细分、地域的细分将会是很长时间的主流。整个教育技术的市场随着个性化和自适应学习时代的来临,小引擎、细服务必不可少,谁的技能打穿了整个行业,谁就能占领市场。

以上就是本次采访的主要内容。遇见好产品,让我们一起期待下一个好产品的故事。

相关新闻

    接下来

      推荐阅读