閱讀217 返回首頁    go 機器人


人工智能那麼厲害 可能會成為迄今為止最好的人類幫手

據新華社2016年7月20日報道,AlphaGo在世界職業圍棋排名上超過圍棋選手柯潔,當前AlphaGo世界排名第一。在今年三月的人機大戰中,AlphaGo戰勝韓國選手李世乭,殺入職業圍棋世界排名,名聲大噪。

1956年新罕布爾州達特茅斯學院召開的提出人工智能概念的研討會,會議四位組織者之一馬文·明斯基(Marvin Lee Minsky)教授,在今年1月24日辭世,作為人工智能最早的奠基人,如果他看到今天人工智能已經在運算量最大的棋類遊戲中戰勝人類,該是怎樣的感慨。

看過今年人機大戰實況的朋友都還記憶猶新,AlphaGo和李世乭的五盤棋下的十分精彩,棋局之上表現的是兩個世界頂級棋手的對弈。李世乭的韓國棋風展現的非常到位,從開始幾局棋爭奪幾子,到後來冒著滿盤皆輸的風險,頻繁打劫。AlphaGo被認為是一個非常可怕的棋手,單純從棋局現象上主要體現在它的深不可測和“圍棋智慧”。AlphaGo的深不可測在於,包括所有贏李世乭4局棋在內,AlphaGo在訓練過程中,之前的圍棋選手對弈,都是以幾個子取勝,最早與業餘水平的研究人員下棋是贏幾個子;與專業二段選手下棋還是贏幾個子;與退役的專業九段選手下棋仍然贏幾個子;同樣與李世乭下棋也是僅贏幾個子。AlphaGo似乎從來沒有漏出它的最強實力,總是比對手強一點點。AlphaGo不應該表現出所謂的“圍棋智慧”,因為它是機器,但它下出了如棋聖吳清源的“神之一手”也是不爭的事實。王檄九段對AlphaGo的評價是:AlphaGo更像是巔峰的李昌鎬和李世乭的加強版。韓國韓鍾振九段負責比賽現場解說,他調侃道:“作為曾經被李世乭蹂躪的棋手,我現在的心情是,李世乭什麼時候變得這麼容易對付了。”

AlphaGo如同所有人工智能程序一樣,並不知道自己到底在做什麼,它們隻是在按照指令進行計算。AlphaGo通過矩陣運算完成每一個棋局,即便它是當前最先進的人工智能,但它也無法像人一樣表達感受,不然Google會安排一個賽後采訪環節,相信這也是誰都不會錯過的。

事實上,AlphaGo的開發公司——Google DeepMind(前文中有介紹)這家早期的成立於英國的人工智能企業,後被Google收購。Google DeepMind專注於人工智能的研究,他們公司內部有很多項目並行,這次AlphaGo與李世乭的圍棋大戰,與其說是其最新人工智能成果展示,不如說是一次空前的公關宣傳。因為在其內部,選擇圍棋作為挑戰目標,就是因為圍棋是所有可以與人類對決的遊戲中最困難的一個。之前IBM的超級計算機深藍戰勝國際象棋世界冠軍卡斯帕羅夫,已經證明了計算機在這方麵的潛力,圍棋和國際象棋相比,在運算量上有了指數倍增長。為表現當前人工智能的先進程度,這是Google DeepMind選擇圍棋的原因。在AlphaGo開發的早期,Google DeepMind內部研製了數十個版本,這幾十個版本互相對弈,通過積分卡的形式篩選出較先進的版本對老版本進行替代,當然工程師會不斷對已有版本進行加強,在這個過程中,每個AlphaGo版本之間進行了數量非常龐大的棋局對弈,在完成版本之間互相篩選之後,才會進入機器與真人棋手的實驗性對弈。不管是AlphaGo版本之間還是AlphaGo和真人棋手之間,每下一盤棋,機器都學習圍棋技術,完成進化。

在職業圍棋界,相鄰段位之間,高段位選手對低段位選手之間的勝率是70%對30%,如果一個職業九段選手對陣一個職業八段選手,那麼職業九段選手獲勝的概率是70%,職業八段選手獲勝的幾率是30%。AlphaGo最早的職業棋手陪練是二段樊麾,在人類之間九段選手對人類二段選手,勝率是95%到98%,最高為98%,仍有5%到2%幾率是二段選手獲勝,但是AlphaGo在與人類二段選手的對弈中可確保100%獲勝,所以在開賽之前,Google DeepMind對於戰勝李世乭是有信心的,但因為隻有五局,也有可能根據李世乭個人發揮出現小概率事件,所以官方在一開始並沒有太過高調宣傳。

AlphaGo的核心是兩套計算機神經網絡係統。“策略網絡”(policy network)和 “價值網絡”(value network)。它們通過算法計算優勢棋步,避免出現任何“昏招”,原則上和李世乭在棋局上的考量是相同的。“策略網絡”負責減少搜索寬度,當計算機麵對棋局時,有些棋步明顯是“昏招”,比如不該給對方送子,這樣的棋步會首先摒棄掉,計算機將不會對其進行任何分析計算;“價值網絡”負責減少搜索深度,計算機會一邊推算一邊判斷局麵,當局麵明顯處於劣勢的時候,計算機會直接拋棄某些路線,避免死板的出現一條道走到黑的情況。AlphaGo就是利用策略網絡和價值網絡來分析整個局麵,判斷每步下子策略的優劣,就像人類棋手會對棋局進行判斷和推測一樣。可是AlphaGo在分析能力上相比於人類是有優勢的,比如計算機判斷未來20步的情況,就能相對準確的判斷哪裏下子贏的概率會高,而很少出錯誤,人類選手會受很多諸如精力、體力以及很多外部因素的影響,小概率的做出不明智的判斷,往往這個時候,就是一局棋勝負的關鍵。

AlphaGo能在圍棋上戰勝人類,那我們可以斷言,很多與概率有直接關係的遊戲和活動,人工智能都能完勝人類。國際象棋、橋牌、國際象棋(十幾年前人類已經被機器打敗),乃至於中國人津津樂道的麻將,這些遊戲人類通通不再是機器的對手。有人感慨,本來充滿藝術和美感的圍棋,被人工智能變成了冷冰冰的計算問題,這太令人沮喪了。這確實沒錯,很多事情在蒙著麵紗時,人們總是對其充滿了美好的想象,但是人類技術進步正是伴隨著一個又一個神秘麵紗的揭開而前進。IBM深藍打敗國際象棋大師卡斯帕羅夫的時候,很多人擔憂之後會削弱人們對國際象棋的熱情,可事實恰恰相反,世界範圍內參與國際象棋職業錦標賽的選手水平,在人工智能國際象棋軟件的訓練下達到了前所未有的高水平,喜愛國際象棋的人也比之前有了大幅提高,榮獲國際象棋大師頭銜的選手是過去的一倍以上。這就是人類的小夥伴,它讓我們變的更強。

有了這樣一個計算能力超強的小夥伴,我們似乎迎來了一個賺錢的好機會,那就是去賭場,事實上確實是這樣,在賭場中一個記憶力稍好的人就可以通過記牌賺到錢,因為像拉斯維加斯和澳門賭場是不洗牌的。如果稍微加一點計算,那就幾乎可以保證穩賺不賠。那如果帶上AlphaGo這樣的小夥伴呢,那賭場就要賠死了。事實上,賭場的經營者完全明白計算設備對他們生意的威脅,所以在這裏有好的提醒各位讀者,如果有機會去到賭場,請把你的隨身智能設備收起來,不然賭場保安會友好的將你請出去的。當然,你也不要明目張膽的拿出小本做筆算,這也會招來同樣的待遇,即便是你掰著手指做口算,隻要有記牌和算牌的跡象,賭場工作人員都會過來終止你的遊戲。財大氣粗的賭場肯能不會在乎你賭贏的那一點小錢,但你的計算行為拉低了整個牌桌玩家下注的速度,進而影響了賭場賺錢的速度,這種行為是絕對不會被容忍的。由凱文·史派西(Kevin Spacey)主演的電影《決勝21點》講述了麻省理工學院米基·羅薩教授帶著幾個數學天才少年,喬裝打扮混入拉斯維加斯,通過記牌算牌賺錢,並惹惱賭場的故事。他們為什麼要喬裝打扮,因為米基·羅薩教授早就因為他在賭場運用數學賺錢的行為,被所有賭場劃定為不受歡迎的人。真實世界中,也確有這樣的故事,斯坦福大學教授,《信息論基礎》的作者,托馬斯·科弗(Thomas Cover)就因為他算牌,被拉斯維加斯列為不受歡迎的人。

人工智能的係統成熟之後,下一步發展的方向就是應用,本質上講,除非需要人工智能作為人類棋手的陪練,否則人工智能擁有再高的棋藝對我們的實際應用意義還是很小。在將來,我們希望人工智能可以為我們解決更多的實際問題。事實上,在十九世紀五十年代,人工智能概念剛剛出現的時候,當時的計算機就為美軍的作戰信息化做了大量工作,原理跟今天人工智能的深度學習極其類似,將大量數據輸入計算機,讓計算機篩選出最優的作戰方案。如今在全球金融市場上,80%以上的股票交易都是由計算機完成,計算機負責尋找價值窪地、篩選交易策略,並高速完成交易,我們人工操作的證券交易與之相比完全不在一個層級,計算機在信息、策略、交易等各個方麵比人工操作都有明顯的優勢。當然,計算機交易係統的成本也非常高,超出了一般個人可以承受的範圍,所以當前還僅是機構在使用。事實上,人工智能大麵積接管金融交易也有風險,2016年10月7日的英鎊下跌,據以為是多家金融機構人工智能係統的拋售指令產生的連鎖效應所致。英國央行已經對此事展開調查,至本初出版仍沒有詳細調查結果公布,但這從一個側麵也反映了人工智能在迅速取代人力時的不確定性,人工智能在尋找價值窪地上的出色能力是毋庸置疑的,可如果本次英鎊下跌真如大家預測的那樣,人工智能與人類交易員在“市場感覺”方麵,還有相當的差距。

近些年來,滴滴出行和Uber的出現,給人工智能接入我們的生活服務提供了可能,我們的智能手機可以采集城市中每個人出行的時間、路線、方位等信息,將這些信息交給人工智能處理,它會為我們製定最優的出行計劃,如果類似原理的套係統被城市管理者使用,人工智能就可以有效調控城市交通,增加城市道路的使用效率。這種結合了大數據和人工智能的生活服務類應用,將有望在這幾年實現。人工智能在醫療領域的進展也非常迅速,除了我們在前文中介紹的IBM的沃森,還有很多醫療領域中專門功能的人工智能在發展。人工智能通過病例和化驗報告診斷的能力可以與中等水平醫生比肩,我們之前講過。在識別醫學影像判斷人體病變、製定外科手術細節方案(穿刺取樣深度、微創手術角度等)方麵,人工智能已經達到當前最優秀的人類醫生的水平。

如果將人工智能、機器人技術、醫學成像技術乃至虛擬現實技術融合,那將是極有想象空間的。達芬奇(da Vinci)手術機器人是當前較成熟的外科醫學機器人成果,它準確的名字應該叫“內窺鏡手術器械控製係統”,達芬奇手術機器人由三個主要部分組成:1、醫生控製係統;2、三維成像視頻影像平台;3、機械臂,攝像臂和手術器械組成移動平台。我們知道,機械的動作比人類更加精確,運用這套係統,主刀醫師不與病人直接接觸,通過三維視覺係統和動作定標係統對機械臂進行操作控製,由機械臂以及手術器械完成手術操作。最新的達芬奇手術機器人已經按照既定程序,在醫生的監控下實施常規手術。在未來,隨著手術程序的不斷完善,會有更多的手術可以通過這套係統精確完成。我們還可以想象,一旦無誤差的影像傳輸和控製信號傳輸技術成熟,醫生可以在千裏之外為患者實時手術,到那時通過這套係統,我們可以跨越地理界線,共享全球醫療資源。

應用型人工智能係統之後,配合程序控製技術和機器人技術,可普及的機器人將會出現。這不由得讓我們想起美國著名科幻小說家、科普作家艾薩克·阿西莫夫(Isaac Asimov)警惕性的提出的機器人學三定律:

第一定律:機器人不得傷害人類個體,或者目睹人類個體將遭受危險而袖手不管;

第二定律:機器人必須服從人給予它的命令,當該命令與第零定律或者第一定律衝突時例外;

第三定律:機器人在不違反第零、第一、第二定律的情況下要盡可能保護自己的生存。

LawⅠ:A ROBOT MAY NOT INJURE A HUMAN BEING OR, THROUGH INACTION, ALLOW A HUMAN BEING TO COME TO HARM.

LawⅡ:A ROBOT MUST OBEY ORDERS GIVEN IT BY HUMAN BEINGS EXCEPT WHERE SUCH ORDERS WOULD CONFLICT WITH THE FIRST LAW.

LawⅢ:A ROBOT MUST PROTECT ITS OWN EXISTENCE AS LONG AS SUCH PROTECTION DOES NOT CONFLICT WITH THE FIRST OR SECOND LAW.

阿西莫夫認為,在製造機器人前,需要為機器人設定這三條不可衝破的定律,機器人才能投入使用,否則會產生災難。這三條定律在今天看來,不管在邏輯上還是使用場景上都出現了新問題,當前我們認為隻有第二條可以履行,第一條和第三條都是難以履行的。比如,DARPA(Defense Advanced Research Projects Agency美國國防部先進研究項目局)研製的戰場機器人,除了執行人道主義和醫療任務的機器人外,其他的戰場機器人都是以殺傷地方戰士為目的的,如果嚴格按照阿西莫夫提出的機器人學三定律製造機器人,那打敗機器人軍團的方法將極其簡單——像戰場投入人類士兵,不戰而屈人之兵。

當然,AlphaGo這麼聰明,它一定會奪走我們的工作機會,汽車出現後,馬確實顯得有點多餘,但人類發展這麼多年,技術不斷進步,最令人欣慰的是我們一直看到,伴隨老的機會消失,新的機會總是在不斷出現。如果這一切無法避免,那我們應該規劃更美好的未來。

選自科技人文暢銷書《機器70年》

作者 徐曦

最後更新:2017-10-08 01:03:16

  上一篇:go 國內首例!人工智能助被拐男子27年後成功尋親
  下一篇:go 人工智能+5G概念績優股,主力2.7億增持,或成月末收官妖王