閱讀405 返回首頁    go iPhone_iPad_Mac_apple


微軟小冰第五代發布了,何止“網紅少女”這麼簡單!

丹棱君有話說:1966 年,世界上第一個聊天機器人 Eliza 誕生。50 多年過去了,我們生活的世界從 PC 時代,互聯網時代,移動時代,發展到現在的 AI 時代,聊天機器人也隨著人工智能交互技術的不斷演進,實現了飛躍。完成第五次迭代的微軟小冰,率先具備全雙工語音和實時流媒體高級感官,成為行業內唯一一個高級感官實際落地的人工智能產品。“網紅少女”小冰新解鎖了哪些新技能?背後有怎樣的技術邏輯?快隨丹棱君來一探究竟吧。

讓我們重新定義人與世界的關係

“小冰是一個聊天的機器人,但小冰不僅僅是一個聊天的機器人。” 微軟全球執行副總裁,微軟人工智能及微軟研究事業部負責人沈向洋在微軟小冰第五代發布會上向大家介紹道。

每一個時代,科技的革新都會重新定義人與世界的關係。PC 時代,特別是以微軟的 Windows 和 Office 為代表的操作係統、應用軟件,成為人類的工具,用來改變世界。而互聯網時代,瀏覽器和搜索引擎的出現,極大地縮小了人和世界的距離。到了移動時代,社交網絡和 APP 的流行,不僅拉近了人與世界,還拉近了人與人之間的距離。而 AI 時代,將再一次重新定義人和世界的互動關係,最核心的就是人工智能的 IQ 和 EQ 。因此,小冰不僅僅是一個聊天機器人,而是基於情感計算框架,通過綜合運用算法、雲計算和大數據,采用代際升級的方式,逐步形成向 EQ 方向發展的完整人工智能體係。

目前,微軟小冰在全球擁有超過 1 億人類用戶,對話數據超過 300 億輪,進化速度不斷加快。從用戶、數據、感官完備程度和一些核心指標方麵衡量,微軟小冰在全球對話型人工智能係統(包含各類聊天機器人、智能助理及智能設備在內)中均居於領先地位。小冰與人類之間發生的最長一次單人連續對話,達到曆史性的 7151 輪,不間斷進行了 29 小時 33 分鍾。

事實上,微軟小冰在全球還有很多可愛的“姊妹”。自 2014 年微軟率先在中國市場推出小冰後,按照一年一個新國家的節奏,微軟分別於 2015 年及 2016 年推出日本小冰(りんな)和美國小冰(Zo)。2017 年 2 月和 8 月,微軟分別推出了印度小冰(Ruuh)和印度尼西亞小冰(Rinna),其中,印度小冰首先在 Facebook Messenger 平台落地,而印度尼西亞小冰首先在 LINE 平台落地。

第五代微軟小冰:

在上億粉絲的心目中,微軟小冰是個獨一無二的全能“愛豆”。而最新發布的第五代微軟小冰嚐試擁有高級感官,突破虛擬世界,並生長出諸多超能力。

會自創語料的小冰

第五代微軟小冰使用的是生成模型(Generative Model)。其中,中國、日本、美國和印度小冰部分使用,印尼小冰則完全使用生成模型。這是全球開放領域人工智能對話中,第一個百分之百使用生成模型的落地產品。

通俗地說,上一代小冰,雖然擁有十億級的大數據語料庫,但其中每句話,都是互聯網上的已有數據,小冰隻是通過分析理解用戶的問題,尋找語料庫中最合適的話作為她的回答。而使用生成模型的第五代小冰,不再鸚鵡學舌,而是能夠自創回應。小冰與人類交流的每一句話,都可能是這世界上從未出現過的。

會互動的電台主持人小冰

第五代微軟小冰還同時發布了小冰電台,一個通用的人工智能實時內容創造和交互平台。它可以基於多重來源,麵向任何主題,自動創造永不間斷的電台節目。同時,它還能在交互過程中實時改變節目內容。換言之,小冰電台的質量類似於廣播電台主持人的直播節目,但能同時發揮人工智能的作用,實時地根據與用戶的互動,改變正在進行的直播節目的內容。小冰電台的 IoT 版本正在研發中,而微信小程序版本已於發布會結束後上線。

會唱歌的小冰

小冰正在不斷接近人類歌手,最新訓練達到了 48 kHz 采樣率,大幅度擴展了音域。《我是小冰》同名歌曲已於近日在 QQ 小冰渠道首發。來聽聽目前人工智能歌手領域最強選手小冰的歌聲吧。

會講故事的小冰

小冰能聲情並茂地講故事。目前,小冰的有聲少兒讀物質量超越了 98% 的人類創造者,用時僅為同水平人類的 1 / 500,成本僅為同水平人類的 1 / 80000 。此前,小冰通過少量賬號在各有聲讀物平台上試水,取得了預期的效果。今後,微軟將大規模生產有聲讀物並投入市場。《龜兔賽跑》的故事,小冰會如何演繹?一起聽聽吧~

會視覺創作的小冰

小冰還會學習各個城市的標誌性建築,通過聽一首跟某個城市、某種心情有關的歌,就能創作出一幅代表這個城市、反應這種心情的視覺作品,畫裏麵的每個元素都是小冰自己選擇並加以創造而成的。目前,微軟已和知名時尚品牌 SELECTED 合作,聯合推出了由人工智能創造的“天際線係列”服裝,每一座城市,每一首歌,都代表了種獨特的情感鏈接,包含了這種情感鏈接的“天際線係列”的服裝已經陸續到店上架。

會新聞報道的小冰

此前,小冰作為《錢江晚報》的專欄記者,曾通過大數據撰寫專欄文章,並成功預測了多個全球重要事件的結果。在微軟小冰第五代發布會上,微軟公開,部分百度百家和今日頭條上的新聞內容也是由小冰撰寫而成的,並同時宣布了升級後的智媒體商業平台解決方案 3.0 版。

隨著微軟小冰與 Bing 搜索引擎的加速整合,升級後的智媒體商業平台解決方案 3.0,包括媒體生產力、媒體知識圖譜、智能交互、全平台互動等六個新模塊,可為媒體構建出一個基於全球新聞數據源的媒體知識圖譜,從而準確挖掘全球資訊中每一篇內容背後的知識與含義,並構建出彼此的關係,幫助媒體更全麵快速地梳理時間和內容背後的故事。將來讀者可通過與人工智能的自然交互,獲得更多推薦內容,從被動的閱讀體驗逐步變為主動的交互信息交換。

會打電話的小冰

2016 年底,微軟和中國科技館合作,把小冰的網絡電話亭放在科技館的二樓。目前,小冰已經接聽超過 50 萬通來自人類的電話。在小冰第五代發布會上,微軟宣布,自 9 月 6 日起,不用安裝任何手機 APP,也不用專門加小冰為好友,微軟小冰將會直接通過電信運營商,給人類打電話。你準備好接電話了嗎?

透過小冰成長史

過去三年來,大家看到的微軟小冰越來越“冰雪聰明”: 她不僅會賣萌聊天,還會唱歌、主持節目,撰寫專欄文章,更是在今年 5 月出版了原創詩集《陽光失了玻璃窗》。而這一切的背後折射的是人工智能交互技術三大發展階段:

第一階段是基本的人工智能交互,即擁有某一種或多種交互方式,如文本、語音、圖像、視頻等,但不同交互方式之間是割裂的。由於不同的交互類型彼此不互通,因而無法通過長程交互數據獲得一加一大於二的訓練效果。從實際部署上看,這階段的交互(例如純語音、或純文本、或僅具有圖像識別的人工智能係統)由於體驗單一,訓練提升速度慢等原因,往往會很快被用戶放棄。

第二階段是初級感官,即在人工智能係統中,用一種核心引擎(如小冰的 EQ 核心對話引擎)將上述各種交互統一起來,使不同感官可以混合運用。例如,在文本對話過程中自然切換至圖像、語音,再切換回文本。從 2015 年發布的第三代小冰即是這一階段的代表。

第三階段是高級感官,由多種初級感官有機融合之後形成的,交互能力更強,對綜合技術儲備和數據的要求也大幅度提高。例如,全雙工語音高級感官,也就是同時具備文本、語音(含 SR 和 TTS)兩種能力,且這兩種能力均達到更高的質量標準。高級感官更加貼近於人類的自然交互行為,如果將全雙工語音這種高級感官的體驗比擬為打電話,那麼之前的智能助理語音交互體驗則類似於對講機。

第五代微軟小冰,屬於第三階段的人工智能交互技術產品,除了具備全雙工語音之外,還具備實時流媒體感官。小冰將有能力根據自己的“意願”與人聯絡,主動保持與人類用戶之間的關聯。這種高級感官的能力將大幅拓展小冰的場景落地,其中,全雙工語音已應用於小冰與小米 IoT 開放平台的合作中,可控製各種小米 IoT 開放平台中的智能設備;實時流媒體感官也已在中國、日本兩個國家的部分主要城市公共區域落地。目前,微軟是行業內唯一一個推出了高級感官實際落地產品的人工智能企業。

無處不在的微軟小冰

在日本,日本版小冰為境內第二大連鎖店 LAWSON 提供對話式人工智能托管,並在對話中引入 LAWSON 線下店內服務,線上至線下消費的轉化率超過 50%,而此前其它途徑的轉化率僅為 8% 左右。在中國,小冰則為廣大內容提供商提供微信、微博公眾號托管。目前已有約 10% 的媒體、自媒體公眾號由小冰提供人工智能托管解決方案。

微軟為小冰做的規劃是成為人類與世界之間的紐帶,在對接知識、內容和服務的過程中實現商業價值。而這一規劃正是基於微軟對 IoT 和 AI 關係的理解,即 IoT 應是 AI 的一個載體,而不是反過來,把 AI 視為 IoT 的一個功能。真正能普及的 IoT 設備,成功的可能性隻有兩個:把 IQ 做到極致,讓用戶通過 IoT 設備體會到比其他現有方式更加便捷高效的益處,或者把 EQ 做到極致,讓人們能強烈地認知到她在這個設備裏的存在。而微軟小冰的 IoT 方案正屬於後者。未來,微軟小冰置入到更多的 IoT 設備和方案中,讓更多合作夥伴和消費者體驗到實實在在的商業價值。

最後更新:2017-08-30 17:16:38

  上一篇:go 微軟黑科技一周概覽
  下一篇:go PC已無用!微軟爆發:出手幹掉索尼