853
微软
微软亚洲研究院:语音识别技术里程碑:错误率降至5.1%,超过专业速记员
原标题:语音识别技术里程碑:错误率降至5.1%,超过专业速记员
2017-08-22 | 作者:微软亚洲研究院
编者按:语音识别是众多研究团队和企业正在努力攻克的技术高地,有关识别准确率的竞争和比较从未停止。去年,微软率先实现语音识别系统5.9%的低错误率,在Switchboard对话语音识别任务中已经达到人类对等的水平。
最近,微软语音和对话研究团队负责人黄学东宣布微软语音识别系统错误率进一步降低到5.1%,此次突破堪称是语音识别行业新的里程碑,准确率超过专业速记员。本文译自“Microsoft researchers achieve new conversational speech recognition milestone”,查看论文。
8月20日,微软语音和对话研究团队负责人黄学东宣布微软语音识别系统继微软对话语音识别技术达至人类专业水平,开启人工智能新征程之后再次取得重大突破,错误率由5.9%进一步降低到5.1%,可与专业速记员比肩。此次突破大幅刷新原先记录,并在语音识别行业树立新的里程碑。
在微软转录系统达到5.9%的错误率之后,其他研究人员在此基础上分别进行研究,采用了更多参与的多转录程序,成功在语音识别准确性道路上更进一步。
这两次研究转录的都是Switchboard语料库中的录音,Switchboard是一个电话通话录音语料库,自上世纪90年代以来一直被研究人员作为测试语音识别系统的样本。语音识别测试任务包括对陌生人对话交流中的不同话题,比如体育和政治方面的讨论,进行从语音到文字的转录。
研究人员通过改进微软语音识别系统中基于神经网络的听觉和语言模型,在去年基础上降低了大约12%的出错率,同时引入了CNN-BLSTM(convolutional neural network combined with bidirectional long-short-term memory,带有双向LSTM的卷积神经网络)模型,用于提升语音建模的效果。并且,系统中以前就在使用的从多个语音模型进行综合预测的方法,如今在帧/句音级别和单词级别下都可以发挥效果。
除此以外,研究人员还对整个对话过程进行历史记录分析,预测接下来可能会发生的事情,进一步加强识别器的语言模型,使其能够有效适应对话话题和语境的快速转变。
微软认知工具包Microsoft Cognitive Toolkit 2.1(CNTK)在研究过程中表现突出,研究人员充分利用CNTK探索模型架构和优化模型的超参数。此外,微软对云计算基础设施(特别是Azure GPU)的投资,也帮助提升了训练模型、测试新想法的效果和速度。
实现识别准确率上的“人类对等”是语音识别领域过去25年来一直奋力追求的研究目标,微软始终坚持深耕语音识别,并力争将新技术最快、最好地运用到Cortana、Presentation Translator、Microsoft Cognitive Services等微软产品和服务中,让用户能够亲身体验新技术的魅力。微软的研究团队非常高兴可以看到每天有数百万的用户在使用这些产品,未来将更加努力,创造出更具突破性的工作成果。
Presentation Translator:利用语音识别实现多语言观众实时翻译演示文稿
在语音识别领域,业界和学术界有许多研究团队都有重大进展,微软研究团队在行业的整体发展下同样获益良多。尽管目前在Switchboard 语音识别任务中实现了5.1%的低错误率,事实上语音研究领域仍然挑战重重,例如嘈杂环境、录音距离较远场景下的语音识别,方言识别,有限训练数据条件下的语音识别或较少人使用的语言的语音识别,这些距离达到人类相近水平还相差甚远。而且,计算机学会将语音转换为文字并非语音识别的终点,让计算机能够理解其中的含义和目的才是道阻且长。从语音识别到话语理解,将会是语音相关技术的下一个重要前沿。
最后更新:2017-10-07 22:44:17
上一篇:
微软AI聊天机器人公开吐槽自家Win10不如7好用
下一篇:
微软小冰3年聊了300亿条对话,我首先想到的却是赵本山
win10 AMD Mobility Radeom HD5000显卡驱动蓝屏
전국지역 키스 출장샵 추천 http:kiss36.com ☜홈페이지클릭!
zune非正常删除后无法重新安装
Windows 10 Insider Preview
深陷出售传言的HTC Vive再次中枪 微软MR宣布支持Steam平台
Win764位系统安装不了4.7和4.8的ZUNE,必须停止安装,因为未安装所需的“zuneR
MSE自动删除了U盘里面的文件,如何恢复文件?
有没有适用于windows8.1的第三方杀毒软件。
关于检测WMI恶意脚本
Windows Defender 错误代码 0x8050800d
相关内容
获取insider preview版本出错 错误代码:0x800bfa07
hhukapi.dll,程序丢失怎么办
原来的【文本和其他项目大小调整的高级选项】界面咋没了?
无法获取Insider Preview 内部版本 错误代码 0x800bfa07
Windows 10,Windows Defender\Scans文件夹占用空间过大
windows10 *64 16215更新时下载过程中失败,代码 0x80240034
安装16226.1000更新时出现一些问题,但我们稍后会重试。
注册表值hklm\software\3fd8f8eac是什么
defender服务无法自动启动
Microsoft AntimalwareMicrosoft 反恶意软件 试图更新签名时遇到错误。
热门内容
Android Studio 3.0发布,支持 Kotlin;微软开源深度学习库MMLSpark;敏捷开发?真的假的?
微软Surface Note概念手机,三星Note 8的杀手?
微软2018财年Q1财报:游戏业务收入仅增长1%
微软高管解读财报:云计算业务发展良好 为客户创造巨大价值
聚焦场所体验与本土文化表达,微软Microsoft马其顿办公设计
微软也来搞折叠屏手机,有望明年推出,打开秒变平板电脑!
微软枪车球中“车”的代表,《极限竞速7》视频评测
微软的Kinect停产了,但它为今天的VR/AR做了很多贡献
微软一季度财报:游戏业务盈利增长显着
微软买断未来15年GE风力电厂能源:供应数据中心