阅读600 返回首页    go 阿里云 go 技术社区[云栖]


剑桥AI公司:7天精通一门新语言,未来将学会7000种语言

11月11日,剑桥AI公司Speechmatics正式上线其机器学习平台Automatic Linguist,能在一周内掌握一门新语言。该平台沿用剑桥大学研发的技术,能够识别并应用语言中的不同模式。目前,该平台能够识别28种语言,实现从语音到文字的准确转录。

2a49d62f223cf47727f7d94aae47bcabd6ab34d7

图示: Speechmatics将28种语言逐渐加入其系统中。


一个大公司客户要求Speechmatics两周内学会印地语,该公司发布了一个系统,根据测试,该系统比市场领先者的错误率少23%。

Speechmatics首席执行官Benedikt von Thüngen在接受Cambridge Independent采访时表示,“印地语非常简单。我们发现它在发音方面与英语非常相似,所以我们可以使用一个叫做‘适应’的过程。它从我们拥有的不同数据集中学习。”

“每种语言都有各自有趣的地方。韩语、土耳其语、芬兰语、德语等语言都是粘着构词,词语结合起来构成新的词汇。这是一个有待解决的有趣问题。”

“越南语、汉语等变调语言,也是一个很有意思的挑战。要教会系统去处理这些语言。”

fd93a9d49c6fb63e12bc6dec01c55cac2d0cf5ab

Speechmatics首席执行官Benedikt von Thüngen。


语言识别的传统路径要经过繁琐、昂贵的人工过程,专家要手动收集、清理海量数据。这是一个一次性系统,因此只关注使用最广泛的几种语言才算经济实用。

但是经过剑桥大学博士、Speechmatics首席技术官Tony Robinson数十年对神经网络的研究,Speechmatics可以通过识别基本声音和语法结构,在一天之内掌握一门语言的基础。

7d9ca2d8dc0e5841af3277791ad16c6cf9aa6e66

剑桥大学博士、Speechmatics首席技术官Tony Robinson。

 

该软件的主要用途之一是为电视提供准确、实时的字幕,并增加了专业个性化词典,如足球员姓名。

Benedikt说金融机构能够使用这一技术进行通话录音,以证明合规性和对PPI不当销售进行审查。他预言:“语音将成为与设备互动的主要机制。”

该公司白皮书提到,“我们的终极目标是为所有语言提供一个语言包。鉴于世界上约有7000种语言,这将是一个雄心勃勃的目标,我们希望有朝一日能够全部掌握这些语言。”


原文发布时间为:2017-11-16

本文作者:Cecilia

本文来自云栖社区合作伙伴新智元,了解相关信息可以关注“AI_era”微信公众号

原文链接:剑桥AI公司:7天精通一门新语言,未来将学会7000种语言

最后更新:2017-11-16 14:34:26

  上一篇:go  8Manage SPM:随时随地掌控采购管理
  下一篇:go  [Phoenix文档系列] 二、数据类型