762
技術社區[雲棲]
專訪阿裏研究員袁全:從 AI 玩《星際爭霸》談認知智能的現狀與趨勢
不同於以提升點擊率和轉化率等優化指標為主的機器學習模型,認知計算以實現算法和智能化為核心,訓練智能體的自主學習能力,以及多個智能體之間的協作和配合能力,和原來優化大數據和算法具有很大的區別。近日,筆者就認知計算、應用場景、算法優化、深度學習以及雲計算&大數據技術的關係等問題與阿裏認知計算實驗室研究員、資深總監袁全進行了深入探討。
阿裏認知計算實驗室研究員、資深總監袁全(左一)深耕細作,瞭望人工智能新征程
“人工智能時代,我們專注認知計算研究,以積累核心算法係統為首要目標”——袁全。
袁全的研究始於06年開始的個性化推薦,彼時他在IBM研究院率先研發這一新技術。在12年加入阿裏後,他主要負責手機淘寶、天貓的個性化推薦技術,包括算法、平台和產品的協同。袁全和他的團隊致力於個性化推薦算法,典型產品有“有好貨”、“猜你喜歡”等。15-16年團隊主要研究淘寶首頁的全麵個性化,在去年年中的時候,以AlphaGo為代表的人工智能、認知決策技術的升級帶來了非常多的新理念和新技術,袁全所帶領的新團隊也轉戰認知計算這一領域,目標是在人工智能時代,積累核心算法係統和能力。
挑戰與機遇並存,認知學習深入解讀
“最大的挑戰在於它是一個非常新的多種類交叉學科,涉及內腦科學、認知心理學、機器學習甚至是博弈論,是一個全新的開始”——袁全。
推薦是經典的機器學習&大數據任務,依賴於每天產生的上億用戶數據,而認知計算最核心的能力是實現算法的智能化,提升智能體的自主學習能力,對大數據依賴性會變弱。從商品推薦到認知計算這一轉變過程中,最重要的是要依靠認知科學來啟發算法的認知設計,袁全表示,因為人腦是我們唯一所知的具有舉一反三學習能力的物體,所以其中最大的挑戰就在於它是一個非常新的多種類的交叉學科,涉及腦科學、認知心理學、機器學習甚至是博弈論,是一個全新的開始。
最近袁全帶領團隊在星際爭霸遊戲中對智能體的研究,則恰好驗證了這一點。他們與倫敦大學學院計算機係汪軍教授緊密配合,發布並開源了Gym StarCraft框架,探索新的訓練智能體的方式,而不再像以前那樣僅以提升學習指標為目標,而是致力於在一個幹淨的的環境中,訓練智能體的自主學習能力,以及多個智能體之間的溝通與協作。事實上,《星際爭霸》有其自身的特點,它的搜索空間比圍棋更大,圍棋是10的100次方數量級,而完整的星際遊戲卻是10的1000次方,整整大了10個數量級。而且不同於圍棋雙方博弈的透明性,《星際爭霸》的決策是不確定性博弈,需要平衡短中長期的收益,與電商中的若幹主要問題聯係也很密切。(** 論文下載:**Multiagent Bidirectionally-Coordinated Nets for Learning to Play StarCraft Combat Games)
應用於《星際爭霸》遊戲中的雙向協調網絡(BiCNet)深度學習作為認知學習中重要推動力和實驗工具,也已演化成研究智能的一個非常重要的平台,包括越來越多的國內外高校都在用深度學習去模擬人腦結構,尤其是深度神經網絡對人腦的羅列和實現能力。當然後續也會結合其他流派的一些算法,例如結合符號主義、概率推理等,從而實現更好的學習能力。
機遇與挑戰並存,更好的學習能力往往意味著更艱難的當下。袁全表示,在應用過程中,團隊不斷改進算法等技術,以期實現更佳的效果和用戶體驗。細化到算法調優上,不僅從agent通信機製間提高通信效率,還兼顧agent個體和全體收益,智能體的反饋激勵機製優化、全局和動態信息的組合運用等,使得模型的通用性和擴展能力大大增強。
不過隨著智能發展的火爆,各種AI威脅論也隨之發酵。從團隊的整個學習過程,以及AlphaGo等例子來看,智能的學習能力確實很有可能超越人類,機器協同效率遠高於人的協同效率,很可能是一個催化要素,加之硬件和算法不斷進步,智能對人類的威脅的確可能存在。現在看來最好的方式,是開放研究、共享新技術,多方共同逼近和實現目標;同時在AI的機製設定上,多引導其往人類不擅長、解決不了的問題上進行,與人類形成良性協作,相互增強。
另外,袁全還談到了雲計算、大數據與認知學習的微妙關係。誠然,智能體的訓練對海量數據的處理能力提出了更高的要求,三者相輔相成,但是目前從很多的進展來看,小樣本學習的技術也在不斷提升,所以數據量級並非越大越好,學習能力越強的智能體對數據的依賴程度越低,這也是一個新的認知。
立足當下,美好藍圖亟待描繪
“引進智能化,理想情況就是說,每個用戶背後都會有個智能體在專注地為他服務”——袁全。
在研究認知計算的過程中,袁全的團隊由淺入深,不斷補綴;結合AI在推薦等領域的應用,袁全認為利用AI去解決推薦的驚喜性問題,是一個技術和商業的很好結合。基於AI提供用戶需要但自身並未意識到的商品和信息服務,逐步引進智能化,理想情況就是說,每個用戶背後都會有個智能體在專注地為他服務。
給初學者的建議
對於想要從事個性化推薦、認知計算、通用智能的同學,袁全表示,紮實的功底必不可少,包括基礎的編程能力和數學能力。在此之上,再根據個人的特點選擇分支:甚至是一些偏深入研究的方向,例如,受腦神經科學啟發的認知學習機製;或者選擇通用智能領域,很多做通用智能的人都具有紮實的機器學習、強化學習背景;最後是非常重要的工程和係統架構能力,這是實現智能必不可少的一點。
最後更新:2017-05-25 17:31:19
上一篇:
收錄對網站優化起到什麼作用?
下一篇:
5月25日雲棲精選夜讀:
線下活動預告:Elasticsearch廣州交流會
中小企業論壇將開幕,美國商家渴望通過天貓抓住中國貿易機會
magento 1.4 -- 推薦插件 -- 產品頁計算運費插件(Estimate Shipping on the Product Page)
2.1 Objective-C概述
獨家 | 環境大數據的應用案例及前景
Spring事務管理—aop:pointcut expression解析
雲棲大會UC開放服務專場發布U4內核2.0版本,將完整支持PWA
三極管飽和,放大,截止電壓判斷
5月19日雲棲精選夜讀:性能追求之路——MaxCompute2.0的前世今生
雲服務掀起價格戰 用戶成真正受益方