閱讀628 返回首頁    go 機器人


100:0,“阿爾法元”完爆“阿爾法狗”,人工智能又進化了

這世界,沒地方說理去,還沒搞懂阿爾法狗的原理,阿爾法元又橫空出世了。

10月19日淩晨,國際學術期刊《自然》(Nature)指出,穀歌新智能“阿爾法元”:從0開始自學,在無任何人類指導的條件下,自學圍棋,並以100:0的戰績擊敗“前輩”---阿爾法狗。

阿爾法狗,完全是一個打不倒的勵誌小強。

自出生就一路坎坷,最終借助48個TPU(神經網絡訓練專用芯片),參考了海量人類棋譜,並自我對弈3000萬盤,又經數月訓練,最終封神,以4:1大敗韓國九段棋手李世石、以3比0戰勝人類最強棋手中國的柯潔。

阿爾法元,完全是一個天才富二代。

僅用4個TPU,完全不屌人類經驗,閉門自我訓練3天,自已和自己玩了490萬盤棋,出關後,以100:0的戰績輕鬆完爆阿爾法狗。

這說明什麼?

說明人工智能在短短的時間內又向前進化了。

這張圖是阿爾法元的訓練時間軸

阿爾法元為什麼這麼強?

他采用了新的算法——強化學習算法。也就是說,在每一次訓練後,他都能得到經驗和教訓,並以此優化算法、強化武功。

舉個例子吧,假如你是一隻猴子,生下來被放在一個沒有猴子的島上。

你這個時候也不知道吃什麼東西適合自己活下來。

第一天,你試著吃蘑菇,結果吃到了毒蘑菇,死翹翹了,於是,你知道了,蘑菇不能吃。

第二天,你試著吃蟲子,結果跑肚拉稀了,於是,你又知道了,蟲子也不能吃。

第三天,你試著吃水果,結果精力旺盛喜刷刷,於是,你這回知道了,要靠吃水果才能在這個島上活得倍爽。

阿爾法元,這隻猴子自己和自己玩,相當於活了490萬天,如果你可以活100年,他的經驗相當於經曆了1300個生命輪回,這經驗積累的太嚇人了,不是,是太嚇猴了。

我是一個窮人,買不起TPU,甚至都無法免費查詢最新的論文。

這些都是因為商業的原因,被保密了起來,用金錢加了鎖。

我們中國,在這個方麵是吃過大虧的。

鴉片戰爭時,大清並不是沒有先進的火器。

比如,那個時候的八旗軍隊就已經配備了和洋人一樣的燧發槍,但派去打仗的卻是隻配備了鳥銃的綠營軍,因為,不想讓漢人掌握最新的武器,結果被人家一直打到了京城。

當時的中國還引入了爆破彈(開花炮彈),可是因為保密,連林則徐都不知道有這麼厲害的東西可以和洋人交手。

開始學習人工智能,我才知道還要到網上去租GPU,看來未來還要租TPU。

人類的科技一直在風馳電掣地向前,我們落後,有的時候,不是它太快了,而是它太貴了。

最後更新:2017-10-19 23:52:34

  上一篇:go 阿爾法狗退役,“新狗”橫空出世100:0完爆“老狗”
  下一篇:go 響應號召:摩拜物聯網、人工智能技術齊發力 推動行業邁入新時代