151
機器人
機器人導購,刷臉簽到,菜鳥鑒別藥材真偽……百度開放了哪些AI能力?
我們正在進入人工智能+的時代。在成都,許多科技創業公司都有結合人工智能拓展產品能力的想法,但不管是對開發者本身能力、對大數據持續獲取能力以及對行業理解方麵,人工智能仍存在技術壁壘,這就為巨頭提供了建立AI開放平台的機會。
百度正在提供AI開放平台為開發者提供幫助。10月26日,百度AI開發者實戰營第二站走進成都,數名百度資深AI工程師介紹了百度機器人視覺技術、識圖技術及應用、UNIT語言理解與交互技術以及百度深度學習平台PaddlePaddle,並與成都地區的數百名開發者分享了不同領域的落地案例。
百度AI技術生態部技術經理謝永康解讀了最近發布的“燎原計劃”,百度宣布擬在2018年招攬500多家生態合作夥伴,培養超過5000名人工智能人才,遴選60多家創業公司進入AI加速器,並投資其中的優秀者,通過技術、客戶、營銷等資源幫助開發者成功,共同構建AI全鏈條的行業生態。
百度也開啟了AI開發者扶植計劃,並正式啟動AI加速器第一期報名,將重點麵向pre-A或A輪需要借助AI為業務升級或AI領域創業公司,輸出技術、客戶、營銷、企業運作和投資支持等多個層麵的資源。
這場活動展示了很多在實際場景中有價值的案例。待虎哥細細講來。
百度AI視覺能力
百度AI開放平台新增了圖像識別、圖像搜索等AI視覺能力。
1、人臉識別讓刷臉簽到、會員管理更方便
在現場展示區,百度開放了人臉會場簽到解決方案,參會者隻需在報名時上傳個人照片,即可“刷臉入場”。
虎哥報名時留了個心眼,傳了張沒戴眼鏡的照片上去,簽到時戴著眼鏡想考驗一下百度AI,結果居然是秒過。看來技術成熟度比較高了。用這種技術做會議創建、報名、刷臉簽到一站式管理,能為管理方提供極大便利。而且人臉識別功能可以用於大量的領域。
人臉檢測可廣泛應用於身份認證:通過離在線混合活體檢測,判斷用戶為真人,這就避免了用人臉照片冒充或者用三維建模人臉冒充;通過公安身份圖像與真人圖像比對,判斷用戶是否為本人,從而完成在線用戶身份核真檢驗。目前這項技術已經應用於保險公司線上保險服務的身份驗證中。
通過人臉識別快速錄入人臉信息,用戶通行時隻需刷臉即可完成身份驗證進門。可應用於門禁考勤或者景區檢票係統,大大縮短了檢票時間。當然如用於全國交通樞紐站,可進一步提高通客效率。
將人臉信息對比公安信息係統,通過快速比對能找出犯罪嫌疑人,可應用於安防監控領域。
虎哥比較感興趣的是人臉會員識別解決方案,可以提供完整的會員人臉注冊、人臉自動捕獲、會員識別一整套解決方案,實現智能會員管理、到店提醒和會員營銷、提升商家服務質量和顧客消費體驗。
據說其在大型藥店中的應用,可以做到結合會員曆史消費情況,推薦合適的商品,避免藥性衝突,提升了營業效率和顧客體驗。當天虎哥就此發了朋友圈,馬上就有彩妝連鎖店麵的管理者來谘詢應用,可見其在商業上有較高的關注度。
其產品流程圖如下
2、圖像識別能讓普通人準確識別藥材
根據百度識圖技術負責人劉國翌的介紹,目前百度圖像識別能力包括通用識別、品牌logo識別、文字識別、動植物識別、菜品識別、車型識別與定損等。識圖後台大量使用深度學習技術,能夠對用戶上傳的圖片進行精準識別,並檢索後台近百億圖像數據返回相關信息。
圖像識別目前在2B端有豐富應用:在通用識別方麵可以建立圖像到文本的預設,可用於內容、廣告的推薦;菜品識別可以應用於飯店、健康管理領域;logo識別可以應用於圖像審核;動植物識別可應用於教育行業、動植物研究所等行業。
在定製化的視覺識別案例中,虎哥覺得對普通人比較有價值的是百度為中國食品和藥品研究所做的中草藥識別案例:對那些非專業人士無法鑒別真偽的藥材,係統經過AI訓練,在不需要人工幹預情況下,真偽鑒定準確率達到95%以上。
3、搜索的能力展現
基於以圖搜圖、以圖搜信息的需求,實現通用圖像識別和檢索係統,通過搜索技術可以識別上百萬種商品、藥品、人物等等。
虎哥覺得比較好玩的一點,百度AI識圖能夠查找預計相同語義且具有類似風格的圖像。這樣就能搭建相似圖片推薦、圖片素材查找、以圖搜物等類型的應用。
舉個例子,你想拍海邊的婚紗照,係統就能給你推薦許多帶有相似性的圖片,帶有碧海藍天、沙灘、婚紗等各種特性要素。
4、讓審核更輕鬆
媒體機構需要花費巨大人力資源審核圖片,最頭痛的還是視頻內容審核,工作量很大,但百度識圖的技術可以針對圖片和視頻內容進行多維智能審核,其中包括有各種敏感內容,虎哥覺得這項功能在未來對內容平台開發者來說很實用。
在視頻比對檢索方麵,可以精確搜索所屬視頻,以視頻快速搜索包含相同片段的視頻。
5、人體分析服務即將開放
如圖所示,這一功能可以做到對圖像和視頻數據內的人體屬性識別,包括性別、衣著、是否帶眼鏡、顏色等維度,實際應用中,在商業場所可以用來分析人流量和構成。
關於百度視覺AI方麵的能力開放,9-10月已經開放8項識圖能力,包括圖像主題檢測、菜品識別、車型識別、logo商標識別、植物識別、動物識別,相同圖搜索、相似圖搜索。
而11-12月將開放人體分析、數萬類物體和場景識別、商品搜索、定製化圖像識別平台,未來會聚焦重點場景,與各行業合作夥伴合力構造行業解決方案。
機器人視覺解決方案
百度機器人視覺負責人包英澤著重介紹了百度AI開放平台最新上線的機器人視覺解決方案。擔任北京漢光百貨蘭蔻專櫃一日導購的“小度機器人”,運用的就是百度機器人視覺解決方案。
百度機器人視覺解決方案采用硬件開源、軟件開放的形式為開發者提供全方位一站式服務,包括硬件模組和機器人SDK兩部分。
硬件方麵,百度自主研發的立體慣性相機模組配置了兩個全局攝像頭和一個傳感器,開發者可根據需要調整雙目的距離。曆經三次迭代,可以進行規模化生產。
機器人SDK提供視覺慣性SLAM、障礙物檢測、平麵2D建圖等離線功能,以及人臉、文字、物體等雲端識別功能。
通過百度機器人視覺解決方案,機器人可以更好地“看懂”這個世界,像人一樣擁有觀察感知能力。開發者可在自己的機器人產品中安裝百度相機模組,模組輸出的圖像和傳感器數據輸入百度機器人視覺SDK。
SLAM視覺慣性算法將為機器人提供高精度的實時定位;由雙目圖像經過深度神經網絡獲取的圖像經過深度神經網絡,可以為機器人提供準確完整的障礙物信息,讓機器人安全自由地行走;同時,連接到百度雲端API,機器人還擁有人臉識別、OCR(文字識別)、物體識別等功能。
包英澤表示,“不同於市麵上所有別的機器人視覺模組,百度機器人視覺是市麵上唯一既有導航定位(SLAM),也有物體識別(人臉識別、物品識別、OCR識別)的機器人視覺SDK,並且是唯一軟硬件都開源的視覺模組。”
目前,百度機器人視覺已經在百度AI開放平台開放試用,開發者可體驗這一軟硬一體的機器人視覺技術解決方案。
對話交互產品——UNIT
百度UNIT技術負責人孫珂展示了一段場景:開車中對著手機說“去清華大學西門”,手機便會自動開啟導航。在導航過程中,詢問到達時間、詢問路況等都可以通過語音來實現。
這背後就是語言理解和交互,孫珂說:“實現自然語言理解與交互,需要雄厚而完備的技術積累和數據積累,對於很多開發者來說,存在不小的困難。”
很多互聯網產品和應用開始嚐試引入對話式的人機交互方式。而UNIT(理解與交互技術)便是為了解決這種交互形式而生,為第三方開發者提供對話係統開發平台,讓產品快速擁有對話交互能力。
UNIT技術,可應用於各類對話式人機交互場景,包括智能助手、智能家居、智能汽車、智能客服、機器人等多種領域。
舉個例子,UNIT麵向意圖辭槽的多輪交互
用戶先說:幫我訂個全聚德的十人包間(由此開始了多輪交互)。
智能客服回答:好的,您想訂什麼時間的?
用戶說:今晚6點吧。
智能客服回答:好的,幫您訂好了(這是自動澄清)
智能客服又說:需要幫您叫車麼?(這是主動引導)
類似這樣可定製的智能客服可精確匹配業務需求,並持續學習,幫助配合解答大量通用性較強的問題,大幅提升人效,可廣泛用於網站、APP、電話客服甚至線下業務窗口等場景。
學習平台——PaddlePaddle
如果你並不是AI行業的“深度學習”者,但是卻想借助AI技術幫你實現項目目標,那麼百度的分布式深度學習平台PaddlePaddle或許是個不錯的選擇。
PaddlePaddle高級研發工程師劉毅冰例舉了一個案例,三個北京工業大學自動化專業的學生,隻有自動化專業能力卻沒有AI技術能力。但是利用百度PaddlePaddle開源平台,他們研發出了一台為平穀桃農挑選桃子時使用的智能分揀機。
機器由傳送帶,推拉裝置,電路控製係統和大桃品相識別係統四部分構成。在這個過程中,深度學習發揮了強大的作用,學生們給機器分類“學習”了約6400張大桃照片。
因為模型能從各個分類的照片中自動提取影響分類的要素,並形成自己的分類邏輯,學習後的機器就能像經驗豐富的桃農一樣,快速辨別桃子的品質。
不僅如此,機器在使用中還會不斷積累並學習新的數據,提升自身的準確率。被百度AI加持了的機器,能極大的解放人力。
目前機器的分桃準確率已達到90%以上,平穀桃農劉師傅在自家的桃園裏運用了這台機器,劉師傅介紹,他家的40畝桃樹,如果都用上了智能分揀機,一年能省3萬多塊錢的雇工費。
PaddlePaddle在深度學習框架方麵,覆蓋了搜索、圖像識別、語音語義識別理解、情感分析、機器翻譯、用戶畫像推薦等多領域的業務和技術。
虎哥了解到:PaddlePaddle易用性很好,單機與多機代碼完全一致,無痛從單機訓練伸展至大規模集群訓練,
通過PaddlePaddle,深度學習模型的設計更加容易,隻需關注模型的高層結構,而無需擔心底層問題。未來,程序員可以快速應用深度學習模型來解決醫療、金融等實際問題,讓人工智能發揮出最大作用。
天虎科技 羅曙馳 尚誌
最後更新:2017-10-28 00:07:33