439 機器人

剛剛，阿爾法狗再升級，100：0碾壓舊版，三天走完了人類三千年的路

去年，圍棋程序阿法狗（AlphaGo）連續擊敗多名人類圍棋大師，最終奪得世界圍棋冠軍寶座。而就在前不久，穀歌 DeepMind 公司宣布阿法狗的妹妹，“史上最強人工智能” 阿法零（AlphaGo Zero）誕生。人工智能真的迎來了技術爆炸嗎？這對我們又是福是禍呢？

在2016年擊敗柯潔，李世石，成功在圍棋領域戰勝人類的人工智能阿爾法狗，最近又傳來了新的大新聞。

10月19日淩晨，阿法狗的開發公司 DeepMind 在知名期刊 Nature 上發表了一篇論文，宣布他們已於前不久研發成功了最新一代人工智能程序：阿法零（AlphaGo Zero）。按照 DeepMind 開發團隊的說法，阿法零不僅戰勝了此前開發過的所有版本的阿法狗，且首次在人工智能領域實現了完全脫離人類的自我學習。

一個嶄新的時代的曙光可能已經出現在地平線上了。

北京時間今天淩晨，DeepMind 公司發表了一篇名為《Mastering the game of Go without human knowledge》的論文，瞬間引爆了從學術界到媒體和民間的廣泛討論。

這篇文章詳細介紹了從去年到今年，DeepMind 公司在人工智能領域的最新成果，而其中最引人矚目的，就是阿法狗的下一代—阿法零。

“這是全世界迄今為止最強大的人工智能”，團隊主要負責人David Silver 教授在采訪中說。

在測試中，阿法零以100場全勝0負的絕對碾壓優勢戰勝了她的姐姐—曾經在2016年擊敗韓國棋手李世石的阿法狗，此外，在和阿法狗強化版 Master 的對戰中，阿法零也取得了89勝11負，接近90%的優勝率。而 Master 就是曾經3：0擊敗柯潔的那個人工智能。但這還不是最讓人震驚的地方。要知道，在早期開發階段，DeepMind 公司為阿法狗輸入了大量人類頂尖圍棋棋譜，供其研習人類下圍棋的套路。無論是阿法狗還是 Master，她們的圍棋技能提升很大程度上依賴於對人類的模仿。

而阿法零則完全沒有得到任何“指點”，她對圍棋的所有了解僅限於規則而已。開發者沒有為阿法零提供任何幫助，而隻是設計了一套“自我博弈”的學習機製。阿法零和一個自身分裂出來的“陪練”進行對弈。每一次，對手的水平都和自己旗鼓相當，在博弈中慢慢成長，總結和學習。換句話說，阿法零的圍棋技能完全是從零開始無師自通的，Zero 之名，即由此而來。

讓科研人員自己都沒有預料到的是，這種自我學習的成長速度可以用恐怖來形容。在論文中，DeepMind 詳細記載了阿法零在短短72小時內，如何實現了從猴子扔石頭一般的菜鳥水平到縱橫捭闔整個棋局的一代宗師的飛升。開始訓練3小時，還是毫無章法，12小時，看起來摸到門路了，72小時，她達到了多少人類棋手終其一生都無法抵達的圍棋九段水平。

就好像一個對武功一無所知的小白，隻被人教了怎麼握劍怎麼劈刺砍，沒學過任何劍法就閉門修煉，卻練成了吊打武林一眾高手的最強武功。

“她用了三天時間走完了人類三千年的路。”一位知乎網友如此評價。柯潔在微博上轉發相關報道時感歎“對於alphago的自我進步來講...人類太多餘了”。

“我可以代表我們團隊說，她的表現讓我們都感到驚喜”，David 教授在鏡頭前難掩興奮，仿佛一個看著自己孩子長大的父親。“她的表現已經超過了所有人的預期，她的能力一直在增長，勝率一直在增加。40天後，她已經打敗了我們所製造過的所有阿法狗。”

阿法零在ELO等級分製度（一個博弈遊戲評價體係）名列第一

數據顯示，學習人類技法的圍棋 AI 雖然可以學習前期成長迅速，但最終隻能達到與阿法狗相仿的能力水平，且這個過程長達幾個月。而放棄人類自成體係的阿法零卻在幾天時間裏取得了超過人類的成就。 “阿法零證明了人類很多時候總是隻能限於局部最優(local optima)而不自知。”杜克大學人工智能專家陳怡然教授如是說，“人類實際上‘誤導’了阿法狗。” 也就是說，阿法零在一個更高的層麵發現了人類之前的思維缺陷，並證明了自己可以做的更好。

這項突破在人工智能領域的意義可用裏程碑級來形容。DeepMind 團隊在過去的三年時間裏一直致力於研發圍棋人工智能，而阿法零的誕生標誌著他們距離開發“通用型人工智能”近了一大步。

另一方麵，由於阿法零不依賴於大數據計算，也降低了它的成本。此前的阿法狗需要48個 TPU（穀歌開發的深度學習芯片，類似手機電腦的 CPU），而阿法零隻需要4個就可以運行。

低成本，簡潔算法，不依賴於人類經驗，阿法零的原理很有可能有非常廣闊的應用前景。“阿法零的成果完全可以遷移到其他領域，” DeepMind聯合創始人和CEO Demis Hassabis 如此說，“例如新能源，新材料和蛋白質折疊研究中。”

人工智能自進入大眾視野那一天起，幾乎就伴隨著對它的憂慮。強人工智能毀滅世界也一直是各路科幻小說和電影中的熱門題材。

科幻電影《終結者》中，人工智能“天網”覺醒自我意識，發射核彈毀滅了全世界，之後製造出大量“終結者”機器人和人類展開曠日持久的戰爭。

科技圈內的名人對此也有類似看法，霍金，比爾蓋茨和馬斯克在不同的場合都發出過警告，認為人類不應低估人工智能發展可能帶來的嚴重後果。馬斯克在麻省理工學院參加研討會時表示，研究人工智能如同在召喚一個惡魔，“如果讓我猜人類最大生存威脅，我認為可能是人工智能。”

在去年阿法狗戰勝柯潔後，關於人工智能會不會反而統治人類的討論也一直在網上進行。

一篇寫於2015年的文章認為，人工智能會在我們的有生之年導致人類永生，或滅絕。

文章作者認為，一旦強人工智能研發成功，其進化能力將以指數倍計算，它也許用了幾十年才達到人類弱智的水平，但此後它會以近乎垂直的速度向上增長並遠遠趕超任何生命體。

“當這個節點發生的時候，電腦對於世界的感知大概和一個四歲小孩一般；而在這節點後一個小時，電腦立馬推導出了統一廣義相對論和量子力學的物理學理論；而在這之後一個半小時，這個強人工智能變成了超人工智能，智能達到了普通人類的17萬倍。”

想象一下，愛因斯坦和霍金的智商僅僅是正常人類的1.3倍到1.5倍，那麼比人類智商高17萬倍的電腦是什麼樣子？對於這樣一個超級大腦，攻克所有絕症，發現宇宙的終極定律，破解能源危機乃至讓人類永生，都不會是什麼困難的事。

但反過來說，這樣一個人工智能究竟是怎麼看待人類？我們不知道。正如螻蟻無法想象人類的想法（更不用提我們和超級 AI 之間的差距比螞蟻大得多了），人類很可能完全無法理解人工智能的思路，而在如此天壤之別的智力差距下，任何試圖阻止 AI 的行為都會很可笑。一如螞蟻無法阻止人類一樣。

如果你設定一個人工智能的目標是讓你笑，那它可能會把你臉部肌肉弄癱瘓，來讓你永遠保持笑臉。如果你把目標設定成保護你的安全，它可能會把你永遠關在家裏。如果你讓他終結所有饑荒，它可能會想：“太容易了，把人類都殺了就好了。”如果你把目標設定成盡量保護地球上的生命，那它會很快把人類都殺了，因為人類對其它物種是很大的威脅。

不過，上文這種觀點更多的還是停留在哲學或科幻層麵的討論。多數人工智能學者不認為目前的人工智能研究水平達到了應該擔心的程度，即使是最強大的阿法零，根本上也僅僅是在一個新領域有所突破，目前為止她除了下圍棋還是什麼都不會做的……

當然，這也不是說對人工智能的懷疑完全是杞人憂天。事實上在深度學習領域，強人工智能伴隨著風險是業內常識，科學家對此有過充分的討論和準備。作為阿法零的研發公司，DeepMind 在2014年被穀歌收購時就要求穀歌成立一個人工智能倫理委員會，以應對未來可能的相關道德問題。

但人工智能在近幾年的發展，確實可以用飛速來形容，在2012年左右的時候，圍棋程序在讓4或5子的基礎上才能勉強擊敗九段圍棋選手。僅僅五年後，它們就已經可以藐視一切人類對手了。幾年後又會有什麼新的變化？是就此止步，還是引發如同工業革命一般的又一輪技術爆發，乃至真的如上文所說，將帶領我們走向死亡或永生？或許我們已經站在了一個嶄新時代的門檻上，又或許我們隻是目睹了一場即將落幕的科技大戲的終場。無論如何，就像《銀河係漫遊指南》中說的那樣，“不要慌（Don't panic）”。

科技一直都是一把雙刃劍，用得好可以為人類披荊斬棘開拓新的旅程，使用不當，也會傷到自己。大膽探索，但不要忽視風險，就好了。

最後更新：2017-10-20 15:46:05

剛剛，阿爾法狗再升級，100：0碾壓舊版，三天走完了人類三千年的路

上一篇：人工智能芯片加持首發麒麟970的華為Mate 10是否將再創佳績？

下一篇： 10月24日京東無人機公開課預告：人工智能時代，無人機飛手該何去何從？

相關內容

熱門內容

最新內容

剛剛，阿爾法狗再升級，100：0碾壓舊版，三天走完了人類三千年的路

上一篇： 人工智能芯片加持 首發麒麟970的華為Mate 10是否將再創佳績？

下一篇： 10月24日京東無人機公開課預告：人工智能時代，無人機飛手該何去何從？

相關內容

熱門內容

最新內容

上一篇：人工智能芯片加持首發麒麟970的華為Mate 10是否將再創佳績？