【AI手機三國殺】三星Bixby闖入戰場,AI功能集成顛覆人機交互
受三星電子中國研究院邀請,新智元昨天走訪研究院,了解三星的人工智能,並搶先體驗了三星主推的AI技術——三星Bixby中文版部分功能。Bixby實現了對手機的多模態智能操控,以Bixby Vision、Voice、HOME、Reminder的“分身”,從對聽到的語言進行語義理解、對眼睛看到內容進行視覺理解、對上下文及環境的理解,為用戶提供“最強智能手機交互體驗”。
因為AI,智能手機界最近發生了很多事情:蘋果iPhone X掀起的人臉解鎖熱潮尚未散去,此前更有華為在手機上AI炫技——先是搶先一步發布麒麟970芯片,搭載專用神經網絡處理器NPU(也即寒武紀1A),號稱圖像處理速度是三星S8的20倍,蘋果7P的4倍;接著發布Mate 10,智能識別多達13種場景和物體(人臉除外),以及與微軟合作在手機上的神經網絡翻譯——更不用說穀歌的Pixel 2,這家業界公認的AI第一巨頭推出的智能手機,不但一個鏡頭就搞定景深攝影,而且手機上Google Assistant的聲音是DeepMind WaveNet技術在支持。
那麼,全球最大手機廠商的三星在做什麼?
“作為全球ICT領軍人物,三星怎麼可能沒有AI黑科技?”
在前天的小型媒體見麵會上,三星電子中國研究院院長張代君如是說。就在剛剛ICCV 2017多人體姿態識別競賽中獲得第一名的三星,去年在研發上的投入是127億美元,全球34個研發中心,7個設計中心。長線投資鋪展開來的結果,三星也在語音、自然語言、圖像、生物識別認證等一係列AI子領域開花落地。
“三星有個‘2020夢想’,我們提前3年實現了‘全球半導體第一’,剩下的就是在AI領域實現突破。”張代君說。
三星電子中國研究院成立於2000年,是三星電子在華投資設立的第一個研發機構,從15年前開始投入AI技術研究,非常敏銳地把握了多種AI技術產業應用的時機。2013年,鄧力博士與Hinton合作,首次將深度神經網絡應用到大規模語音識別並獲得成功,在實踐中顯著提高了機器對語音的識別率,隨後不久,三星電子中國研究院便開始全麵引入深度學習。2014年,三星手機加入了采用深度神經網絡模型的相冊分類功能,隨著深度學習的迅速發展,目前三星智能機中S-Gallery的圖像搜索和管理得到進一步增強。“我們就是想知道,AI到底能給手機帶來什麼變化。”三星電子中國研究院常務史媛媛說
三星電子中國研究院院長張代君展示三星Bixby
“最強手機智能交互體驗”,用Bixby控製和連接一切
雖然亞馬遜Echo/Alexa開啟了智能音箱引領的智能硬件新時代,但手機或許仍然是未來AI的最大應用場景,如果有一個手機能把所有最強悍的AI功能集大成,那無疑將成為一個強大的樞紐和入口。 而三星無疑就是這樣認為並切身立行的。
“作為全球最大的手機和家電廠商,三星的目標是使用AI技術讓硬件更加智能,並在這種結合之中,產生新的智能。”張代君說:“自然語言交互時代已經全麵來臨,我們要提供最強的手機智能交互體驗。”
而這種最強手機智能交互體驗的核心,便是三星Bixby——三星主推的人工智能技術。雖然是通過語音來激活,但Bixby的定位絕非僅限於語音助理。“Bixby有Voice、Vision、Home、Reminder,總之你能通過手機連接的一切,都能用Bixby控製和處理。”張代君介紹說。
這次體驗活動的重點,則是即將正式上線的Bixby中文版語音功能。而被三星中國的研究人員戲稱為“Mr. Bixby”的張代君院長,為了讓Bixby中文版更加智能、順暢地識別、適配用戶發出的語音指令,帶領三星的工程師在算法的優化、工程實現上做了無數次迭代研發,在中文的語義、語境等方麵也花費了很多精力。在演示中,研究人員共展示了“點(touch)、看(vision)、說(voice)、筆(pen)”四大交互方式,並以旅行為場景,展示了三星在生物識別認證、視覺智能、場景智能以及智能語音等AI技術應用。
在生物識別認證領域,三星已經率先在今年的旗艦機型S8/S8+以及N8手機上實現了麵部識別和安全虹膜識別,並給客戶保留指紋識別的方便性,全部采用自主研發的技術。對於人臉+虹膜+指紋識別的“三位一體”,史媛媛表示,功能做到“全,是旗艦產品應有的態度”。在智能語音交互方麵,三星設計了Bixby專用硬件HARDKEY,用戶能夠通過按鍵,從語音控製轉化至視覺和文字控製。
此外,當應用程序啟動Bixby時,用戶可以通過Bixby完成所有可通過傳統界麵(觸屏或者文本指令)進行的任務。同時,Bixby可以了解應用程序當前情景和狀態,並繼續執行當前任務。
在現場,研究人員使用語音功能進行自拍,用中文語音命令手機在拍攝過程中“把皮膚調成最好”、“把照片中的眼睛調到最大”,“好,把這個發朋友圈”,一係列動作即時順暢地完成。“我們要解決自然語言交互可能出現的很多問題。”史媛媛說,即使提供的信息不完整,也能夠理解用戶的意圖。
研究人員還展示了用語音將APP圖標在手機屏幕上隱藏並在隱藏狀態下調起使用。“三星手機有成千上萬個功能,最複雜的功能我們也能通過語音來做到,一聲直達。”史媛媛說。
深度整合展現對硬件的控製力,隻有做過的人才能體會有多難
據介紹,三星Bixby的核心是用戶與手機交互的新方式,因其具備高度理解能力,用戶通過語音實現對手機多種功能的貫穿操控。針對當前三星手機內置的原生APP,Bixby語音能夠做到“可點即可說”的操作方式轉變。“隻要是能夠點擊的,我們都可以用‘說’的方式來做到”。三星電子中國研究院首席研究員劉亞強表示。對於第三方,目前三星與主流APP巨頭也已進行深度合作,同時歡迎更多第三方APP進行深層合作,完成更豐富的用戶體驗升級。
“用戶看到的可能很簡單,但這展現了Bixby與三星硬件的完美融合,”劉亞強首席感歎:“深度整合才能創造奇跡,但隻有做過的人才能體會做到這點有多難。”
“我們哭過、吵過、打過(差點),都是為了達到更好的用戶體驗。真的是太瘋狂了,我們自己把自己都感動到了。”劉亞強說:“但客觀地講,光憑我們的努力是無法做到的,正是因為三星有強大的硬件以及AI技術的深度積累,我們才有可能做到這種深度整合。”
被研究人員如此評價的Bixby中文版,憑借語音、視覺、提醒以及主頁功能,將展現出怎樣的人機交互方式,無疑令人分外期待。對於國內用戶而言,Galaxy S8、S8+,Note8將很可能成為率先支持Bixby中文語音的產品。
張代君 三星電子中國研究院院長
張代君先生現任三星電子中國研究院院長。他與他領導的團隊立足於中國本地的先行技術、商用化技術研發以及產品服務,為三星電子提供了堅實的技術保障,為中國本地以及全球向提供差異化產品服務。
張代君先生已投身人工智能、無線移動通信核心技術研究和開發領域20年時間,成功領導和管理多輪新技術創新到產品商業化的轉化。張代君先生於2013年加入三星並擔任三星電子中國研究院(北京)院長職務,憑借對產業技術發展方向的極佳判斷力,準確把握行業趨勢,將三星電子中國研究院成功的引向當下最前沿的人工智能以及下一代移動通信領域的發展浪潮中,在全球各大學術會議以及競賽中獲得了優異的成績,成為了三星電子全球重點人工智能研究機構以及下一代通信研究機構。在張代君院長的帶領下,三星電子中國研究院將會走向以AI、5G為核心技術的全球一流研發中心。
當前張代君先生主要負責領導三星電子中國研究院在視覺智能、語音語言交互、大數據挖掘、下一代無線通信,以及本地智能服務等領域的技術戰略、產品管理以及項目運營, 特別領導了三星電子智能交互產品Bixby中文版的研發與商用,帶領著800餘名員工不斷的進行創新和突破。
張代君先生1997年畢業於電信科學技術研究院並獲得工學碩士學位,並在2007年獲得中歐國際工商管理學院(CEIBS)高級工商管理碩士學位(EMBA); 2009年~2013年,擔任意法-愛立信中國區總裁(Senior Fellow);2002年~2009年,擔任北京天碁科技CTO,具備了深厚的技術背景以及管理經驗。
原文發布時間為:2017-10-27
本文作者:聞菲
本文來自雲棲社區合作夥伴新智元,了解相關信息可以關注“AI_era”微信公眾號
原文鏈接:【AI手機三國殺】三星Bixby闖入戰場,AI功能集成顛覆人機交互
最後更新:2017-10-27 15:33:44