498
機器人
再也不用學外語!人工智能如何推倒文化間的語言障礙
全文總計2231字,閱讀時間大約為5分鍾
語言是文化產業進行國際拓展中最大的障礙,如今,這堵橫在不同文化間的“牆”在人工智能的推動下,正岌岌可危。
9月8日,穀歌在歐洲舉行了開發者日活動,展示了“穀歌語音助手”的許多新功能,其中最重要的是穀歌助手的翻譯模式。例如,用戶可說:“OK,Google,當我西班牙語的翻譯。”隨後,穀歌助手就會把用戶說的話翻譯成西班牙語,直到要求停止。
而號稱打敗穀歌翻譯的對手,本周也高調上線,來自德國的 DeepL,號稱打造出了“世界上最精確、語言組織最自然的機器翻譯係統”,已支持英德法西等 42 門歐洲語言。並宣布在盲測中,打敗了穀歌翻譯以及微軟與 Facebook 的NMT(神經機器翻譯)係統,挑釁意味十足。
現在人們已經習慣了日常生活中用智能翻譯軟件,但基於工業的智能語音和翻譯服務,是一項全新的熱點。因此人工智能深度嵌入產業底層架構和商業服務,開始於近兩年席卷全球。在這波AI的熱潮下,包括百度、騰訊、阿裏、有道、科大訊飛在內,都在AI+語音產業展開布局、戰火勐烈。
人工智能挑戰傳統翻譯,AI+語音率先斬獲民用市場
現在,人工智能+語音相關的民用產業的很大一部分重心轉向了翻譯,語言文字的生產和翻譯在很久以前就是機器學習的一大障礙。早在上個世紀50年代,IBM就已經對機器翻譯進行了深入的探索與研究,但直到90年代,這類翻譯工具才進入大眾的視野。
進化到現在,為應對市場對於精準翻譯的需求,以Google為代表的一票科技企業已經推出了神經機器翻譯(NMT)。神經機器翻譯技術在翻譯文本時讓機器更關注整個句子而不是其中的一些成分,通過把這些成分用最自然的方式組合起來,從而得出最佳的翻譯結果。當人工智能技術應用到這個過程中時,神經機器翻譯就可以從其他已完成的翻譯中分析學習它們的結構,學習它們在語序等細微問題上如何做出調整。
當前,神經機器翻譯係統翻譯出的文字有90%都有語法上的小錯誤,但這些錯誤不明顯,不足以讓受過教育的翻譯者感到緊張。許多語言學家和翻譯人員都可以鬆一口氣了。但不可避免的是,隨著神經機器翻譯係統的進一步發展,技術性的內容,那些有著嚴格標準和術語使用規範的內容,可能更容易被機器完美地翻譯出來,並且不需要太多後期的人工編輯。人工智能在產業上的巨大效應和對於人類一些職業的替代性作用已經開始爆發性顯現。
智能語音市場規模達百萬億,高價值導致行業壟斷嚴重
據工業和信息化部電子科技信息情報研究所數據顯示,2012年以來,全球智能語音產業規模持續快速增長。2013年,全球智能語音產業規模整體達33.7億美元,同比增長38.1%;2014年較2013年同比增長41.0%,產業規模大幅提升。預計到2017年,全球智能語音規模將達112.4億美元。
但智能語音市場在帶來高價值的同時,也將導致行業的壟斷。從全球範圍來看,僅有少數廠商在語音市場具有競爭力,一類是傳統語音技術廠商,擁有長期技術和用戶積累,如美國的Nuance公司,但近年逐漸衰落,而讓位給互聯網巨頭。另一類是以IBM、微軟、穀歌、蘋果等為代表的IT巨頭,憑借在互聯網端的優勢迅速搶占語音信息流入口。
早在2009年,Nuance公司占有全球語音識別市場約69%的市場份額。在2012年,Nuance的市場份額下降到62%,Nuance、穀歌、微軟、蘋果、IBM、科大訊飛五家企業占據市場份額超95%。2013年,Nuance市場份額下降到51%,而穀歌依靠其在互聯網和移動互聯網領域的優勢,市場份額由16.9%上升至28%;蘋果、微軟、科大訊飛以4.7%、4.4%、4.3%的市場份額分列第三、第四、第五位。可見智能語音行業的寡頭壟斷特征十分明顯。
此外,隨著智能家居已從概念向商業化階段發展,語音控製和交互將是智能家庭的一大趨勢。根據市場研究公司Juniper發布的數據,2018年全球智能家居市場規模將達710億美元。以蘋果、三星、海爾為代表的消費電子廠商和以穀歌、小米、樂視等為代表的互聯網企業開始紛紛推出智能家電產品,為智能家居市場打前站。而智能家居的發展也將帶動智能語音服務的快速增長。
AI+語音技術產業鏈時代,商業創新如何實現?
隨著人工智能時代來臨,語音技術公司的春天又來了。圍繞 AI 的公司戰略如雨後春筍,智能語音技術的應用成為它們打開市場的首要選擇,幾乎每個月都會有數款語音交互機器人發布。除了硬件,語音服務平台也迅速被建立。而在這個產業領域中,在產業鏈的各個層級都有著商業創新的機會。
從產業鏈上遊來看,芯片一直都是一個高度利潤化的產業。在語音識別這一塊,可以做做語音的處理芯片。比如iPhone使用的Cirrus Logic在語音處理這一塊的算法做得非常好,它解決了語音降噪、方位識別上的關鍵問題。有了芯片作為載體,就可以基於傳統芯片的商業模式去掙錢。Cirrus Logic 推出的 CS44130 可以為整個音頻信號鏈提供芯片,包括模擬或、數字輸入和揚聲器喇叭輸出之間的各個部分。它精小的設計可以大大簡化產品的設計。
往產業鏈下遊走,在芯片下遊的語言服務模塊也有賺錢的機會。如今的產業鏈分工是非常細的,很難再有像過去的飛利浦、西門子這樣的大公司,核心的部件、全器件的研發,一直到最終的產品都是由一家公司來做。在分工很細的情況下,芯片公司不可能再去做一個產品,也很難再去做一個模塊,中間其實需要的是一個做陣列的公司:把產品以一個模塊的形式提供,同時不僅僅做一個 PCB 板把芯片放上去,而是把算法結合在裏麵,體現出附加值。
最後,語音終端產品也有賺錢的機會。比如類似亞馬遜Echo這樣的語音終端產品,以國內來講目前京東和訊飛正在做。不過,真正有機會的創業公司是能夠去開拓一個新的市場領域的。就智能語音音箱來說,這是一個長期存在的行業和產品。在這方麵,創業公司往往擁有更大的機會,因為初創企業可以開辟新的產品品類。
文:王晗 編輯:軒轅鏡
最後更新:2017-10-08 02:51:09