303
機器人
洪小文:人工智能簡史之混沌初開
丹棱君有話說:1956 年,人工智能作為計算機的分支學科正式被提出。60 多年過去了,人工智能進入爆發增長期,不僅被中美等國家作為戰略重點,還成為各個科技巨頭紛紛布局的技術製高點和全球資本追逐的熱點。人工智能產業化之前,首先是一門科學。那麼純粹從科學的角度來看,人工智能究竟是什麼?它的能力邊界在哪裏?那些人工智能的先驅們有著怎樣的遠見卓識?有請微軟全球資深副總裁、微軟亞太研發集團主席兼微軟亞洲研究院院長洪小文博士~
今天我的題目是“智能簡史”(The Brief History of Intelligence),我想談一下什麼是人工智能,什麼是人的智能。我想把 AI 赤裸裸地剖析在大家麵前。
可能大家也聽過不少關於 AI 的演講,每個演講人背後可能都有某些目的。我今天是抱著科學的目的,談一下 AI 到底能做什麼、今天能做什麼、未來能做什麼,沒有保留地剖析給大家。
AI 的誕生
今天 AI 已經紅到不能再紅,包括美國政府、中國政府都非常重視,甚至都要製定政策和策略。過去這兩三年可以說是 AI 的一個爆發點。當然也有不少關於 AI 的擔憂。1950 年,《時代》雜誌就已經提出了 AI 的某種威脅:“現代人已經適應了擁有超人肌肉的機器,不過擁有超人大腦的機器還是挺嚇人的。設計這些機器的人試圖否認他們正創造像他們自己一樣擁有智慧的競爭者。”(Time, January 23rd, 1950)
埃隆·馬斯克和霍金
今天埃隆·馬斯克說 AI 要毀滅人類;但是 1950 年這種議論就有了。1950 年的時候,二戰結束才五年。當年做計算機是二戰時為了造原子彈,每台計算機都要比一個房間大,全世界也不超過十台。這時就已經有人擔憂,以後造的計算機比人類聰明怎麼辦?我們人類一直就對智能充滿了期待,而且非常怕受到傷害。
返回來說,為什麼 AI 會這麼熱?第一個理由很簡單,沒有人願意天生愚蠢(Natural Stupidity),那就隻能做人工智能(Artificial Intelligence)。這個略帶玩笑,真正的理由其實是人類有智能(Human Intelligence)。人類之所以可以主宰萬物、主宰地球甚至宇宙,靠的就是腦子。如果你看《人類簡史》或者《未來簡史》,尤其是《未來簡史》提到的都是 AI,大數據。
那麼,什麼是 AI ?AI 嚴格說起來是 61 年前的 1956 年發生的,但是這個定義今天已經被打破了。因為我們學 AI 的人非常清楚,在學術界 AI 是有嚴格的定義的,但在今天,我可以說任何好的而且可以用計算機實現的事情都變成了 AI 。比如,隻要你發明一個新的網絡協議或者算法,大家覺得你的想法非常好,最終由計算機實現了,不就是人工智能麼(人的智能最終通過計算機實現了)?所以,今天從公眾角度,隻要是一個好東西,能被機器實現,就是人工智能。
但我覺得,我們人有時也會被洗腦。今天 AI 領域炒得很熱的一個東西是無人駕駛。大家覺得非常難。無人駕駛還被分成了一到五個水平,最高的一級就是沒有司機。但是 1912 年,辛亥革命那一年,就有了人類的第一個飛機的自動駕駛(Autopilot)。我想,自動開飛機,不敢說一定比開車難,但是也不見得會比自動駕車簡單。那為什麼大家不說飛機的自動駕駛是 AI 呢?
AI 早期的英雄們
講 AI 的曆史,我們可以先從電腦的曆史談起。電腦是從哪裏來的呢?今年是圖靈獎 60 周年,前幾年是圖靈 100 年的誕辰。圖靈當然是非常了不起。他提出一個假設(Church–Turing thesis),任何可以被計算的東西(用算法描述)就可以用圖靈機去算。這個是很了不起的,雖然無法證明。所以圖靈在那時就覺得,電腦應該可以模擬我們大腦裏所有的想法(Computers can simulate any process of formal reasoning),也就是為什麼在那個時候就有了圖靈測試(Turing Test)。
AI 的開山鼻祖們
但是真正 AI 這個字眼,要等到 1956 年,在達特茅斯(在波士頓附近的一個很偏僻的小鎮上,也是常青藤的學校之一)舉行的一個夏季會議上提出的。當時有五個人參加,MIT 的 John McCarthy 和 Marvin Minsky,CMU 的 Allen Newell 和 Herbert Simon 以及 IBM 的 Arthur Samuel,這五個人就是 AI 的開山鼻祖。這五個人除了 Arthur Samuel 以外,全部拿了圖靈獎。其中,Herbert Simon 在中國也很有名,他同時拿了圖靈獎和諾貝爾經濟學獎。他和 Allen Newell 兩個人創立了卡耐基梅隆大學(CMU)。其實 CMU 計算機科學係就是這兩個人為了做 AI 而成立的。當時,他們從美國軍方的國防高等研究計劃署(DARPA, The Defense Advanced Research)拿到了一些資助。
John McCarthy 是我的師祖,我的老師 Raj Reddy 是他的學生。John McCarthy 是真正把人工智能取名叫做 AI 的人。現在公認的 AI 之父有兩種說法,大部分的說法是 John McCarthy;也有人說是圖靈。John McCarthy 那時是在 MIT,後來到了斯坦福。所以為什麼說 MIT,斯坦福,CMU 到今天都是 AI 的重鎮,更別說當年了,因為當時就隻有這三家,都和這些人有關。Marvin Minsky 1956 年時還在一個小公司做事,並不在 MIT,直到 1956 年開了達特茅斯會議之後,他才被 John McCarthy 邀請到了 MIT 。結果,John McCarthy 後來自己去了斯坦福成立了 AI 實驗室。
達特茅斯會議以及當時的參會者
我自己是在 1984 年開始學習 AI,我到 CMU 也是因為 AI 。當時我讀 AI 的論文的時候,基本上都讀不懂,有幾個原因。第一個,自己的英文不好,尤其是在當年的條件下;然後 AI 的論文裏麵通常沒有數學公式,都是文字;然後這些文字裏很多是認知心理學,我當時根本讀不懂。後來才覺得讀不懂是因為一些很簡單的東西故意用很複雜的文字寫出來。第二點是,這些文章裏麵很多是講腦,我也讀不懂。正是因為讀不懂,也就覺得這個東西非常高深,所以一定要好好學習。
到目前為止,AI 總共有八個人,Marvin Minsky (1969),John McCarthy (1971),Allen Newell (1975),Herb Simon (1975),Edward Feigenbaum (1994),Raj Reddy (1994),Leslie Valiant(2010),Judea Pearl(2011)得了圖靈獎,比例還是蠻高的。前四個人在 1975 年以前就得了圖靈獎,1975 年以後圖靈獎就不頒給 AI 了。一直到 1994 年,幾乎 20 年以後,我老板和 Edward Feigenbaum 又得了圖靈獎。最近的 Leslie Valiant,Judea Pearl 也得了圖靈獎,所以 AI 又解凍了。所以從得圖靈獎,也能看得出 AI 研究的冷熱。
1990 年前的 AI
我當年學習的 AI,和今天是很不一樣的。早期的 AI 都是在學習如何模擬人的智能行為,可以叫仿腦,這是它的主軸。我特地翻閱了下我大學的教科書,上麵還有我的筆記。這些書在當年的 1980 年代是非常經典的,總共三本,分別由 MIT、CMU、斯坦福出的。這些書都已絕版,連亞馬遜也找不到,非常珍貴。當年教的 AI 的這些東西,現在很多人都已經沒有人能談了。但其實最近 AI 的複興,包括未來 AI 要如何往前走,都必須要回去研究這些東西,否則是絕對做不到人的智能的這個地步的。
當時研究什麼呢?其一是知識表示(Knowledge Representation)。我們說隔行如隔山,比如學藥學的、學醫學的、學計算機的、學化學的,每一個行業都是不一樣的,知識表示了之後還要滿足約束條件求一個解(Constraint Satisfaction),人很多時候是在做這個事情。當年,搜索也是非常大的一支(包括 State-Space Representation,Pruning Strategy,深度搜索,廣度搜索,A* 搜索, Beam Search,Game Tree Search, Alpha-Beta 搜索等),今天的互聯網因此受益很多。雖然當時做這個時他們並沒有想到互聯網,當時想的是如何用搜索來實現智能。特別是包括 Game Tree Search,做計算機下棋這件事情,一直以來都是 AI 研究的。早期最早叫 Checkers,計算機很快打敗了人;後來做象棋,後來做圍棋,如今所有棋手都下不過機器人。
當時甚至有專門的編程語言,是為 AI 而設計的,做 AI 的人就要學這些語言。有一個叫 Lisp,還有一個叫 Prolog 。我想今天已經沒有人聽過這些東西了,但是在當年是不得了的,做 AI 都要學這些。
然後還研究什麼呢?認知心理學,非常重要。我們講 AI,很多都是認知。有一個詞叫 Heruristics,今天已經沒有人用這個詞,其實還真是 AI 。因為 Heruristics 是在你沒有數據的時候,或者是很少數據的時候,要用你的直覺來解決問題。
GPS 的創造者 Herbert Simon 和 Allen Newell
還有的研究是做認知的模型(Cognition Modeling),比如 GPS 。當然不是指 GPS 定位,而是一般求解器(General Problem Solver)。難道是什麼問題都能解麼?Allen Newell 和 Herbert Simon 得圖靈獎就是因為 GPS 。而且你真的去讀論文的話,很厚。它甚至一語兩思,把這個東西轉一下,去研究行為經濟學也可以,所以 Herbert Simon 又拿到諾貝爾經濟學獎。
還有一種模式叫產生並測試(Generate and Test),大概的意思就是我們所謂的大膽假設、小心求證。這些認知的模型看起來很神,基本上它就是把難的東西用數據來表示。但是人的確是這樣做的,尤其是到後來,特別是語義、認知,真的很多時候都是在做產生並測試,這個模型本身是沒錯的。
接下來的一項研究要講講我老板。他拿圖靈獎,一方麵是因為他是語音大師(這個可能也有我的一點貢獻);另外一個導致他得圖靈獎的叫做黑板理論。當年搞這些認知的模型的是非常重要的,甚至可以得圖靈獎。
另外有研究涉及 Semantic(Frame)我們今天還在用。今天做 Siri,微軟做小冰,小娜,或者做 Google 助手、百度度秘,用的是這個技術。
還有一個東西在當年非常紅,叫做專家係統。而且最早期的專家係統很多東西應用在醫療,很有名的叫 MYCIN(Medical Diagnosis),就是傳染疾病了,靠一些規則去診斷。
當然還有專門研究感知的,比如,我就是作語音和自然語言處理。那語言怎麼做呢?就是有點像大家學英文的文法。但是文法都有例外,一有例外就搞不定,所以這些東西進展都不是那麼好。
還有就是計算機視覺,今天也紅得不得了,比如刷臉。可是在當年的計算機視覺和所謂的機器人,在當時是非常可憐的一個項目。當年都是隻能研究玩具樣的問題(Toy Domain),做的東西都是方塊世界的理解(Block-World Understanding):就是有一堆磚塊,磚塊是這樣的狀態,怎麼樣變成那樣的狀態,來回搬磚塊。最多了不起了研究一個桌子。一輩子做計算機視覺,就研究椅子、研究桌子——還不是兩個都研究,隻研究一個。當年能做的隻有這些東西。
然後是機器學習。機器學習大概是在 1980 年代開始,但是當時的學習也是研究人怎麼學習,而且有一大堆機器學習。今天的機器學習變得很單一,就是深度神經網絡一個,當年有很多種:比如有被告知和指令學習(Learning by Being Told & From Instruction);有通過改正學習(Learning by Correcting Mistakes);有基於訓練神經網絡的學習(感知器)等等。1990 年以前的 AI,和今天有很大的不一樣。
後台入駐微軟小冰
如果你很萌,請跟她一決高下!
最後更新:2017-10-24 14:15:50