閱讀512 返回首頁    go 機器人


人工智能助力下,“世界語”真的有可能誕生嗎?

有語言溝通的障礙,自然就有翻譯,而如今翻譯作為一種古老的職業也正在麵臨一種新的溝通輔助形式的衝擊,那就是機器自動翻譯。

題記:12月21日,在“百度機器翻譯技術開放日”上,百度技術委員會聯席主席、自然語言處理部技術負責人吳華博士向到場嘉賓介紹了百度機器翻譯的最新進展。百度在1年多前發布的,基於領先的人工智能、神經網絡及自然語言處理技術的世界上首個互聯網NMT係統,可謂引領機器翻譯進入神經網絡翻譯時代。這一成果刷新了業界對於機器翻譯潛能的估值,也掀起了人們對於全球溝通介質的重新審度。

1887年,處於維多利亞時代尾聲的世界,第一次工業革命帶來的世界曆史上的第一次全球化正進入高潮。盡管在大多數地區,這種全球化伴隨著血腥的戰爭與殖民,但全球化正如一股不可抵擋的洪流席卷著世界的每一個角落。

在這一年,波蘭籍猶太人柴門霍夫博士創造了一種新的語言,並希望其也能隨著全球化浪潮而傳播,消除國際交往中的語言障礙,這門語言就是“世界語”。

人類無縫溝通曾經的希望

這個毫無根基的語言借助曆史的大趨勢迅速傳播,甚至在民國初年傳入中國之後,被蔡元培、魯迅、巴金等人推廣傳播,進入數十所大學的課程列表。

簡單易學是這種語言最大的特點,有人曾表示學會世界語隻需要150小時,而說好世界語也不過需要1500小時,是最容易學習的外語之一。但這種語言本身也存在很多問題,作為一種新生語言,全球隻有2000人把世界語作為母語,這導致了世界語在傳播上缺少足夠的根基,更多的是被很多人當做興趣來學習,而非一種實用性的語種。加之目前掌握世界語的人分布過於分散,使得這一語言很難被人們頻繁使用和傳播。

回顧世界語的曆史,從風靡一時到隻有2000人作為母語的沒落,這一語言可以說是伴隨著全球化的進程起起伏伏,盡管如今鮮有人知曉,但世界語無疑是文化融合的先驅。

而時至今日,盡管以英美為代表國家的全球化進程將英語推向世界,成為目前最為通用的交流語言,但英語也依然沒有實現世界語當初的理想——消除國際交往中的語言障礙,因為尚有70%的人不會說英語,在30%會說英語的人中,還存在大量非英語母語國家的人不能熟練使用英語。

古老但擁有新希望的機器翻譯

有語言溝通的障礙,自然就有翻譯,而如今翻譯作為一種古老的職業也正在麵臨一種新的溝通輔助形式的衝擊,那就是機器自動翻譯。不同於世界語,盡管目的同樣是消除語言障礙,但機器自動翻譯並不會改變人們原有的母語,隻是在人與人之間搭建一個溝通橋梁。

但機器翻譯並不是一個新鮮詞,早在1949年,美國數學家Warren Weaver就在其發表的《翻譯備忘錄》中正式提出了機器翻譯的思想。而在5年之後的1954年,美國喬治敦大學則在IBM公司的協同下第一次進行了機器翻譯的試驗,拉開了機器翻譯實際研究和應用的序幕。可以說機器翻譯同樣也有著70年的悠久曆史,那我們為什麼會說機器翻譯正在完成世界語當初韋靜的事業——消除語言溝通障礙呢?答案是人工智能的應用。

在過去,由於機器自動翻譯結果在準確性和通順性上的問題,很多時候這種翻譯結果更多的隻是能讓用戶知道大概意思,很難實現真正的“信達雅”。由人類親手創造的語言變化極其靈活,哪怕同一單詞,在不同地域,文化,語境甚至情緒裏的意義也迥然不同。但隨著人工智能的應用,機器自動翻譯與人工翻譯的差距正在縮小。

以目前在人工智能+翻譯上走的比較遠的百度為例,百度翻譯所采用的技術是基於神經網絡的機器翻譯(Neural Machine Translation,簡稱NMT)技術,這一技術的使用讓機器翻譯在多場景、長對話中的應用表現得更出色。

而在百度采用NMT技術之前,基於短語的統計機器翻譯(SMT)方法是業界主流,這一模型最早成型於2003年,當時愛丁堡大學的Koehn提出短語翻譯模型,加之同時期Franz Och提出的對數線性模型及其權重訓練方法,使得機器翻譯較此前有了極大的進步,並一直沿用至今。

在基於短語的統計機器翻譯(SMT)時代,最大的問題就是翻譯內容讓人感覺像是多個短語或單詞拚湊,而非一氣嗬成的一句話,以百度為代表的互聯網公司開始應用基於神經網絡算法的NMT技術,目的就是為了解決這個問題,讓機器模擬人對語義的理解,從而給出通順的語句翻譯。比如百度在2016年5月推出的自動寫詩功能,就是利用了基於深度神經網絡的翻譯模型,可以將詩歌韻律、平仄規則、語義完整性甚至意境都考慮進去,得出的結果也自然不是那些平常會讓我們哭笑不得的“直譯”。

可以說,百度在2015年采用NMT技術取代傳統的SMT是開創了業界先河,做了第一個吃螃蟹的人,效果也顯而易見,目前百度可以支持全球28種語言、756個方向的相互翻譯,並成功應用到拍照翻譯、跨境、出境遊電商等多個場景。而代表國外先進翻譯技術的穀歌在2016年3月才宣布“穀歌翻譯將會利用深度學習為用戶提供服務”。

機器翻譯會帶來新的“世界語”麼?

隨著機器翻譯的發展,關於機器翻譯是否可以帶來新型世界語的討論也在國外開始出現。不過這種可能性或許並不存在。因為機器翻譯本身的價值並不是創造一種新的語言,而隻是消除了原有不同語言之間的溝通障礙,起到彌縫的價值。

事實上,如今的機器翻譯能夠在越來越多的場景中應用,未來的人類似乎也不需要一種通用語言,而是可以自由的使用本民族的母語。事實上,但凡涉及多語言應用場景,無論在線教育,互聯網金融,還是傳媒和跨境交易,機器翻譯都可自如嫁接。

比如在出境遊場景下,百度翻譯推出了一個新功能——拍照可以翻譯說明書、路牌、菜單,這一功能解決了用戶出境遊時語言不通,需要一個個單詞或短語查詢翻譯的痛點,隻需一拍照就直接給出翻譯結果。

盡管此前微信和有道詞典等產品也推出過拍照翻譯功能,但更多還是針對單詞和短語的翻譯,在說明書、旅遊指南等長內容翻譯上表現一般,甚至是無法實現翻譯,百度基於NMT的新翻譯技術則並不存在這一問題。

我們可以預見到的是,隨著語音識別和語義理解技術的提升,機器翻譯取代部分同聲傳譯的功能,實現實時的對話翻譯並不是不可能的事情。

機器翻譯的出現使得地球上任何一個角落的人享有平等、便捷、自由信息和服務成為可能,可以說,隨著技術的進步,機器翻譯正在實現當初世界語的願景——全球無障礙溝通。

版權聲明

本文僅代表作者觀點,不代表久刈立場。

未經許可,不得轉載。

最後更新:2017-10-08 01:44:54

  上一篇:go 人工智能工程師,是如何讓機器人變得更聰明的?
  下一篇:go 智能投顧是理財行業的未來!人工智能是必然趨勢