628
機器人
100:0,“阿爾法元”完爆“阿爾法狗”,人工智能又進化了
這世界,沒地方說理去,還沒搞懂阿爾法狗的原理,阿爾法元又橫空出世了。
10月19日淩晨,國際學術期刊《自然》(Nature)指出,穀歌新智能“阿爾法元”:從0開始自學,在無任何人類指導的條件下,自學圍棋,並以100:0的戰績擊敗“前輩”---阿爾法狗。
阿爾法狗,完全是一個打不倒的勵誌小強。
自出生就一路坎坷,最終借助48個TPU(神經網絡訓練專用芯片),參考了海量人類棋譜,並自我對弈3000萬盤,又經數月訓練,最終封神,以4:1大敗韓國九段棋手李世石、以3比0戰勝人類最強棋手中國的柯潔。
阿爾法元,完全是一個天才富二代。
僅用4個TPU,完全不屌人類經驗,閉門自我訓練3天,自已和自己玩了490萬盤棋,出關後,以100:0的戰績輕鬆完爆阿爾法狗。
這說明什麼?
說明人工智能在短短的時間內又向前進化了。
這張圖是阿爾法元的訓練時間軸
阿爾法元為什麼這麼強?
他采用了新的算法——強化學習算法。也就是說,在每一次訓練後,他都能得到經驗和教訓,並以此優化算法、強化武功。
舉個例子吧,假如你是一隻猴子,生下來被放在一個沒有猴子的島上。
你這個時候也不知道吃什麼東西適合自己活下來。
第一天,你試著吃蘑菇,結果吃到了毒蘑菇,死翹翹了,於是,你知道了,蘑菇不能吃。
第二天,你試著吃蟲子,結果跑肚拉稀了,於是,你又知道了,蟲子也不能吃。
第三天,你試著吃水果,結果精力旺盛喜刷刷,於是,你這回知道了,要靠吃水果才能在這個島上活得倍爽。
阿爾法元,這隻猴子自己和自己玩,相當於活了490萬天,如果你可以活100年,他的經驗相當於經曆了1300個生命輪回,這經驗積累的太嚇人了,不是,是太嚇猴了。
我是一個窮人,買不起TPU,甚至都無法免費查詢最新的論文。
這些都是因為商業的原因,被保密了起來,用金錢加了鎖。
我們中國,在這個方麵是吃過大虧的。
鴉片戰爭時,大清並不是沒有先進的火器。
比如,那個時候的八旗軍隊就已經配備了和洋人一樣的燧發槍,但派去打仗的卻是隻配備了鳥銃的綠營軍,因為,不想讓漢人掌握最新的武器,結果被人家一直打到了京城。
當時的中國還引入了爆破彈(開花炮彈),可是因為保密,連林則徐都不知道有這麼厲害的東西可以和洋人交手。
開始學習人工智能,我才知道還要到網上去租GPU,看來未來還要租TPU。
人類的科技一直在風馳電掣地向前,我們落後,有的時候,不是它太快了,而是它太貴了。
最後更新:2017-10-19 23:52:34