853
微軟
微軟亞洲研究院:語音識別技術裏程碑:錯誤率降至5.1%,超過專業速記員
原標題:語音識別技術裏程碑:錯誤率降至5.1%,超過專業速記員
2017-08-22 | 作者:微軟亞洲研究院
編者按:語音識別是眾多研究團隊和企業正在努力攻克的技術高地,有關識別準確率的競爭和比較從未停止。去年,微軟率先實現語音識別係統5.9%的低錯誤率,在Switchboard對話語音識別任務中已經達到人類對等的水平。
最近,微軟語音和對話研究團隊負責人黃學東宣布微軟語音識別係統錯誤率進一步降低到5.1%,此次突破堪稱是語音識別行業新的裏程碑,準確率超過專業速記員。本文譯自“Microsoft researchers achieve new conversational speech recognition milestone”,查看論文。
8月20日,微軟語音和對話研究團隊負責人黃學東宣布微軟語音識別係統繼微軟對話語音識別技術達至人類專業水平,開啟人工智能新征程之後再次取得重大突破,錯誤率由5.9%進一步降低到5.1%,可與專業速記員比肩。此次突破大幅刷新原先記錄,並在語音識別行業樹立新的裏程碑。
在微軟轉錄係統達到5.9%的錯誤率之後,其他研究人員在此基礎上分別進行研究,采用了更多參與的多轉錄程序,成功在語音識別準確性道路上更進一步。
這兩次研究轉錄的都是Switchboard語料庫中的錄音,Switchboard是一個電話通話錄音語料庫,自上世紀90年代以來一直被研究人員作為測試語音識別係統的樣本。語音識別測試任務包括對陌生人對話交流中的不同話題,比如體育和政治方麵的討論,進行從語音到文字的轉錄。
研究人員通過改進微軟語音識別係統中基於神經網絡的聽覺和語言模型,在去年基礎上降低了大約12%的出錯率,同時引入了CNN-BLSTM(convolutional neural network combined with bidirectional long-short-term memory,帶有雙向LSTM的卷積神經網絡)模型,用於提升語音建模的效果。並且,係統中以前就在使用的從多個語音模型進行綜合預測的方法,如今在幀/句音級別和單詞級別下都可以發揮效果。
除此以外,研究人員還對整個對話過程進行曆史記錄分析,預測接下來可能會發生的事情,進一步加強識別器的語言模型,使其能夠有效適應對話話題和語境的快速轉變。
微軟認知工具包Microsoft Cognitive Toolkit 2.1(CNTK)在研究過程中表現突出,研究人員充分利用CNTK探索模型架構和優化模型的超參數。此外,微軟對雲計算基礎設施(特別是Azure GPU)的投資,也幫助提升了訓練模型、測試新想法的效果和速度。
實現識別準確率上的“人類對等”是語音識別領域過去25年來一直奮力追求的研究目標,微軟始終堅持深耕語音識別,並力爭將新技術最快、最好地運用到Cortana、Presentation Translator、Microsoft Cognitive Services等微軟產品和服務中,讓用戶能夠親身體驗新技術的魅力。微軟的研究團隊非常高興可以看到每天有數百萬的用戶在使用這些產品,未來將更加努力,創造出更具突破性的工作成果。
Presentation Translator:利用語音識別實現多語言觀眾實時翻譯演示文稿
在語音識別領域,業界和學術界有許多研究團隊都有重大進展,微軟研究團隊在行業的整體發展下同樣獲益良多。盡管目前在Switchboard 語音識別任務中實現了5.1%的低錯誤率,事實上語音研究領域仍然挑戰重重,例如嘈雜環境、錄音距離較遠場景下的語音識別,方言識別,有限訓練數據條件下的語音識別或較少人使用的語言的語音識別,這些距離達到人類相近水平還相差甚遠。而且,計算機學會將語音轉換為文字並非語音識別的終點,讓計算機能夠理解其中的含義和目的才是道阻且長。從語音識別到話語理解,將會是語音相關技術的下一個重要前沿。
最後更新:2017-10-07 22:44:17
上一篇:
微軟AI聊天機器人公開吐槽自家Win10不如7好用
下一篇:
微軟小冰3年聊了300億條對話,我首先想到的卻是趙本山
win10 AMD Mobility Radeom HD5000顯卡驅動藍屏
전국지역 키스 출장샵 추천 http:kiss36.com ☜홈페이지클릭!
zune非正常刪除後無法重新安裝
Windows 10 Insider Preview
深陷出售傳言的HTC Vive再次中槍 微軟MR宣布支持Steam平台
Win764位係統安裝不了4.7和4.8的ZUNE,必須停止安裝,因為未安裝所需的“zuneR
MSE自動刪除了U盤裏麵的文件,如何恢複文件?
有沒有適用於windows8.1的第三方殺毒軟件。
關於檢測WMI惡意腳本
Windows Defender 錯誤代碼 0x8050800d
相關內容
獲取insider preview版本出錯 錯誤代碼:0x800bfa07
hhukapi.dll,程序丟失怎麼辦
原來的【文本和其他項目大小調整的高級選項】界麵咋沒了?
無法獲取Insider Preview 內部版本 錯誤代碼 0x800bfa07
Windows 10,Windows Defender\Scans文件夾占用空間過大
windows10 *64 16215更新時下載過程中失敗,代碼 0x80240034
安裝16226.1000更新時出現一些問題,但我們稍後會重試。
注冊表值hklm\software\3fd8f8eac是什麼
defender服務無法自動啟動
Microsoft AntimalwareMicrosoft 反惡意軟件 試圖更新簽名時遇到錯誤。
熱門內容
Android Studio 3.0發布,支持 Kotlin;微軟開源深度學習庫MMLSpark;敏捷開發?真的假的?
微軟Surface Note概念手機,三星Note 8的殺手?
微軟2018財年Q1財報:遊戲業務收入僅增長1%
微軟高管解讀財報:雲計算業務發展良好 為客戶創造巨大價值
聚焦場所體驗與本土文化表達,微軟Microsoft馬其頓辦公設計
微軟也來搞折疊屏手機,有望明年推出,打開秒變平板電腦!
微軟槍車球中“車”的代表,《極限競速7》視頻評測
微軟的Kinect停產了,但它為今天的VR/AR做了很多貢獻
微軟一季度財報:遊戲業務盈利增長顯著
微軟買斷未來15年GE風力電廠能源:供應數據中心