簡單的智慧算法存在嗎?一篇機器翻譯的文章試圖求解
本文講的是簡單的智慧算法存在嗎?一篇機器翻譯的文章試圖求解,達到人的水平的,簡單的人工智能/智慧算法是否有可能存在?這個是一個帶有終極性的問題。尤瓦爾·赫拉利的暢銷書《未來簡史》(Homo Deus)中花了大量筆墨討論智人的智能的來源,以及『意識』是否真實存在等問題,如果說這些是關於理解智慧的問題,那麼『簡單的智慧算法是否存在』就是一個關於能否創造智慧的問題。
傳統上,很多人都會認為智慧是非常複雜的,沒有統一規律的係統。但是近年來以深度學習為代表技術的研究和快速應用,使得人們發現,原來一些簡單的方法,可以取得出人意料的好效果。深度學習奠基人之一Yann LeCun的一個演講標題就是『深度學習不可理喻的有效性』(The Unreasonable Effectiveness of Deep Learning),可以說很好的概括了研究者的驚歎。
但是深度學習和真正意義的智慧還是相去甚遠的,總體來說當前的深度學習主要還隻是『感知層』的解決方案,而智慧還有常識、推理決策、情感等一係列更複雜的問題。所以這些成果,僅僅說明感知層的『智慧』,是存在簡單的算法的(深度學習是統一和簡單的東西),那麼其它問題如何?這些進展,反而讓『簡單的智慧算法是否存在』這個問題變得更加有意思。
近期剛好讀到AI知名作者Michael Nielsen關於這個問題的文章,個人覺得很精彩,下麵是翻譯稿(還是有道機譯 + 少量人工修正)。文章比較長,花15分鍾閱讀下,說不定會改變你的三觀。 其中關於天文學,以及從基因角度來分析智慧的複雜度的角度,都很有意思。
簡單的智慧算法存在嗎?
Michael Nielsen
大家對神經網絡感興趣的一個原因是希望有一天它們能超越基本的模式識別問題。也許它們,或者其他基於數字計算機的方法,最終將被用來製造思維機器——與人類智能匹敵或超越人類智慧的機器?這個概念遠遠超過目前人們會做的事情,但推測起來很有趣。
人們一直在爭論,電腦是否有可能達到人類的智慧水平。我不打算回答這個問題。盡管存在爭議,但我相信,智慧電腦是可能的——盡管它可能是極其複雜的,也許遠遠超過目前的技術——總有一天,目前的反對者將會有一天會像活力主義者一樣(周楓注:活力主義者Vitalists相信生命中存在某些將活體區別於其它物體的非物質,當然後來證明這樣的觀點是站不住腳的)。
相反,我在這裏探討的問題是,是否有一套簡單的原則可以用來解釋智慧?更具體地說,存在有一個簡單的智慧算法嗎?
一個真正簡單的智慧算法的存在是一個大膽的想法。或許這聽起來過於樂觀了。許多人有一種強烈的直覺,認為智慧有相當大的不可約的複雜性。他們對人類的驚人的多樣性和靈活性印象深刻,他們認為一個簡單的智慧算法是不可能的。盡管有這種直覺,我認為倉促作出判斷是不明智的。科學的曆史中充滿了這樣的例子:一種現象最初顯得極其複雜,但後來卻被一些簡單而強大的想法所解釋。
例如,想想早期的天文學。自古以來,人們就知道天空中有許多物體:太陽、月亮、行星、彗星和恒星。這些天體的行為非常不同——例如,恒星在天空中以一種莊嚴的、有規律的方式移動,而彗星則像是不知從哪兒冒出來的,劃過天空,然後消失。在16世紀,隻有愚蠢的樂觀主義者才會想到,所有這些物體的運動都可以用一套簡單的原理來解釋。但在17世紀,牛頓提出了他的萬有引力理論,不僅解釋了所有這些運動,而且還解釋了地球上的現象,例如潮汐和地表拋物的行為。16世紀的愚蠢的樂觀主義者現在回想起來就像一個悲觀主義者,要求的太少。
當然,科學包含了更多這樣的例子。考慮到組成我們的世界的無數化學物質,都被門捷列夫的周期表非常漂亮地解釋,而周期表本身又可以用一些簡單的量子力學規則解釋。或者是關於生物世界中存在如此多的複雜性和多樣性的謎題,其起源是自然選擇進化的原理。這些和許多其他的例子表明,僅僅基於我們的大腦——目前最好的智慧例子——所做的事情似乎非常複雜,就排除智慧的簡單解釋,是不明智的。
反過來說,盡管有這些樂觀的例子,但邏輯上也有可能,智慧隻能由大量的根本不同的機製來解釋。我們的大腦中的這些機製,可能是在我們物種進化史上的許多不同選擇壓力下進化而來的。如果這個觀點是正確的,那麼智慧就包含了相當大的不可約的複雜性,沒有一個簡單的智慧算法是可能的。
哪一種觀點是正確的?
為了深入了解這個問題,我們來問一個與之密切相關的問題,那就是人類大腦如何工作,是否有一個簡單的解釋。特別是,讓我們來看看一些量化大腦複雜性的方法。我們的第一個方法是用連接組學(Connectomics)的角度來觀察大腦。這都是關於基礎的神經連接:大腦中有多少神經元,有多少膠質細胞,以及神經元之間有多少連接。你可能已經聽說過這些數字——大腦包含了1000億個神經元,1000億個神經膠質細胞,以及100萬億個神經元之間的連接。這些數字是驚人的。他們也令人生畏。如果我們需要了解所有這些聯係的細節(更不用說神經元和神經膠質細胞)才能了解大腦是如何運作的,那麼我們肯定不會得到一個簡單的智慧算法。
還有第二種,更為樂觀的觀點,從分子生物學角度看大腦。基本的想法是問:需要多少基因信息來描述大腦的架構。為了解決這個問題,我們首先考慮人類和黑猩猩之間的基因差異。你可能聽過“人類是98%的黑猩猩”的聲音。這種說法有時不太一樣——流行的說法中這個數字可能是95或99%。這些不同是因為最初的數據是通過比較人類和黑猩猩的基因組的采樣,而不是整個基因組來估計的。然而,在2007年,整個黑猩猩的基因組都被測序了,我們現在知道人類和黑猩猩的DNA在大約1.25億個DNA堿基對上有差異,而在每個基因組中總共大約有30億個DNA堿基對。所以說人類是98%的黑猩猩是不對的——更準確地說我們是96%的黑猩猩。
在這1.25億堿基對中有多少信息?每一對堿基對都可以被標記為四種可能性之一——遺傳密碼的“字母”、堿基腺嘌呤、胞嘧啶、鳥嘌呤和胸腺嘧啶。所以每個堿基對可以用兩個二進製位來描述——正好足夠的信息來指定四個標簽中的一個。因此,1.25億堿基對相當於2.5億比特的信息,這就是人類和黑猩猩之間的基因差異!
當然,這2.5億比特解釋了人類和黑猩猩之間的所有基因差異。我們隻對與大腦有關的差異感興趣。不幸的是,沒有人知道需要多大比例的基因差異來解釋大腦的差異。但讓我們假設一下,2.5億比特的大腦中有一半是大腦差異的原因。總共是1.25億比特。
1.25億比特是一個很大的數字,讓我們把它翻譯成更人性化的用語,來看下這個數字到底有多大。特別是,等效的英語文本的量是多少?實際上,英語文本的信息量約為每字母1個二進製,這聽起來很低——畢竟,字母表有26個字母——但在英語文本中有大量的冗餘。當然,你可能會說,我們的基因組也是冗餘的,所以每堿基對2位是過高估計。但我們會忽略這一點,因為在最壞的情況下,這意味著我們高估了我們大腦的遺傳複雜性。通過這些假設,我們發現我們的大腦和黑猩猩大腦的遺傳差異相當於大約1.25億個字母,約2500萬個英語單詞。這大約是英皇欽定版聖經(King James Bible)的30倍。
這是很多信息。但並不是不可思議的大,而是一個人類可把握的尺度。也許沒有一個人能理解這段代碼中所寫的所有東西,但是一群人可能通過適當的專門化來理解它。雖然信息量很大,但與描述1000億個神經元、1000億個神經膠質細胞和100萬億個大腦連接所需的信息相比,這是微不足道的。即使我們使用一個簡單粗糙的描述——比方說,10個浮點數來描述每個連接——那將需要大約70千萬億位。這意味著基因描述比人類大腦的全連接體要少5億倍。
我們從中學到的是,我們的基因組不可能包含對所有神經連接的詳細描述。更確切地說,它必然僅僅指定了大腦的基本架構和基本原理。但這種架構和這些原則似乎足以保證我們人類將成長為聰明的人。當然,也有一些潛在風險——成長中的孩子需要一個健康、刺激的環境和良好的營養,以達到他們的智慧潛力。但是如果我們在一個合理的環境下成長,一個健康的人類將擁有非凡的智慧。在某種意義上,我們基因中的信息包含了我們思考的本質。而且,遺傳信息中包含的原則似乎有可能被我們集體所理解和掌握。
以上的數字都是粗略估計。有可能,1.25億比特是一個巨大的高估,有一些更緊湊的核心原則是人類思想的基礎。也許這1.25億字節中的大部分隻是對相對次要的細節進行微調。或者我們在計算數字時過於保守。很明顯,如果這是真的,那就太好了!就我們目前的目的而言,重點是:大腦的結構是複雜的,但它並不像你基於大腦的連接數量而想象的那樣複雜。從分子生物學的角度來看,我們人類應該有一天能夠理解大腦架構背後的基本原理。
在以上幾段中,我忽略了一個事實,即1.25億比特隻是量化了人類和黑猩猩大腦的基因差異。並不是所有的大腦功能都是由這1.25億個位帶來的。黑猩猩本身就是了不起的思考者。也許智慧的關鍵在於黑猩猩和人類共有的心智能力(和遺傳信息)。如果這是正確的,那麼人類的大腦可能隻是黑猩猩大腦的一個微小的升級,至少在基本原理的複雜性方麵如此。盡管人類對我們的獨特能力有著傳統的人類沙文主義想法,但這並不是不可想象的:黑猩猩和人類的遺傳線在500萬年才出現了分支,在進化的時間尺度上這僅僅是一眨眼功夫。然而,在沒有更有說服力的論點的情況下,我對傳統的人類沙文主義更為認可:我的猜測是,人類思想中最有趣的原理在於那1.25億比特,而不是我們與黑猩猩共享的基因組。
從分子生物學的角度來看大腦,我們在描述的複雜性上減少了大約9個數量級。雖然令人鼓舞,但它並沒有告訴我們是否存在一個真正簡單的智能算法。我們能進一步減少複雜性嗎?更重要的是,我們能否解決一個簡單的智慧算法是否可行的問題?
不幸的是,目前還沒有任何強有力的證據能夠決定性地解決這個問題。下麵,讓我來描述一些現有的證據。這是一個非常簡短和不完整的概述,旨在傳達一些最新工作的味道,而不是全麵調查已知的內容。
在2000年4月《自然》(Nature)雜誌上發表的一項實驗中,有證據表明,可能存在一種簡單的智慧算法。Mriganka Sur帶領的一組科學家“重新連線”了新生雪貂的大腦。通常,雪貂的眼睛發出的信號被傳送到大腦中稱為視覺皮層的部分。但對於這些雪貂,科學家們從眼睛裏接收信號並將其重定向到聽覺皮層,也就是通常用於聽力的大腦區域。
為了弄清楚當他們這樣做的時候發生了什麼,我們需要知道一些關於視覺皮層的事情。視覺皮層包含許多『方向柱』。這些是小塊的神經元,每個神經元都能對從特定的方向到來的視覺刺激做出反應。你可以把方向柱想象成微小的方向傳感器:當有人從某個特定的方向發出明亮的光時,相應的方向柱就會被激活。如果光被移動,一個不同的方向柱被激活。視覺皮層最重要的高層結構之一就『是方向圖』,它繪製了方向柱的布局圖。
科學家們發現,當雪貂的視覺信號被重定向到聽覺皮層時,聽覺皮層發生了變化。方向柱和方向圖開始出現在聽覺皮層。它比通常在視覺皮層發現的方向圖更無序,但明顯相似。此外,科學家們對雪貂對視覺刺激的反應進行了一些簡單的測試,訓練它們在燈光從不同方向閃爍時做出不同的反應。這些測試表明,雪貂仍然可以通過聽覺皮層“看到”,至少是以一種基本的方式。
這是一個驚人的結果。這表明,大腦的不同部分如何學習對感官數據的反應是有共同的原則的。這種共同性至少為『存在簡單的智慧原則』這種觀點提供了一些支持。然而,我們不應該自欺欺人地認為這些實驗中雪貂的視力有多好。行為測試隻測試了視覺的非常粗略的方麵。當然,我們也不能問雪貂是否已經“學會了看”。因此,這些實驗並不能證明重新連接後聽覺皮層給了雪貂一個高保真的視覺體驗。因此,他們隻提供有限的證據支持這個觀點,即共同的原則構成了大腦的不同部分的學習能力。
有什麼證據不支持簡單的智慧算法的存在?一些證據來自進化心理學和神經解剖學。自20世紀60年代以來,進化心理學家已經發現了廣泛的人類共性——在不同文化和教養中都共有的複雜行為。這些人類共性包括母親和兒子之間的亂倫禁忌,音樂和舞蹈的使用,以及許多複雜的語言結構,如使用粗口(即禁忌語)、代詞,甚至是最基本的動詞。與這些結果相輔相成的是,神經解剖學的大量證據表明,許多人的行為是由大腦特定的局部區域控製的,而這些區域似乎在所有人身上都是相似的。綜上所述,這些發現表明,許多非常特殊的行為都被『硬編碼』在我們大腦的特定部位。
一些人從這些結果中得出結論,對於大腦的這些功能,必須有單獨的解釋,因此,大腦的功能有不可約的複雜性,而這一複雜性使得為大腦操作的簡單解釋(或者,智慧的簡單算法)成為不可能。例如,著名的人工智能研究人員馬文·明斯基(Marvin Minsky)就持有這一觀點的。在20世紀70年代和80年代,明斯基開發了他的“心智社會”理論,基於一個觀點,即人類的智慧是一個大型社會的結果,由一個個簡單(但非常不同)的計算過程組成,明斯基稱之為代理(Agent)。在他的書中,明斯基總結了要點:
什麼魔法讓我們變得聰明?關鍵是沒有什麼魔法。智慧的力量源於我們巨大的多樣性,而不是來自任何單一的、完美的原則。
在對他的書的評論的回應中,明斯基闡述了“心智社會”的動機,給出了一個類似於上麵所述的觀點,基於神經解剖學和進化心理學:
我們現在知道,大腦本身由數百個不同的區域和核組成,每一個都有顯著不同的架構元素和安排,其中很多都與我們精神活動的不同方麵有關。這一現代的大量知識表明,許多傳統上被稱為“智慧”或“理解”的常識描述的現象實際上涉及到複雜的機製的組合。
當然,明斯基並不是唯一一個持這種觀點的人:我隻是以他作為支持這樣論點的人的例子。我覺得這個論點很有趣,但不相信證據是有說服力的。雖然大腦確實是由大量不同的區域組成,具有功能不同,但並不能因此推出,大腦功能的簡單解釋是不可能的。也許這些架構上的差異源於共同的基本原理,就像彗星、行星、太陽和星星的運動都是由單一的引力引起的。無論是明斯基還是其他任何人都沒有有力地反駁這些基本原則。
我個人的偏見是:有一個簡單的智慧算法。我喜歡這個想法的主要原因,在上麵(不確定的)論點之上,是它是一個樂觀的想法。當涉及到研究時,一種不合理的樂觀情緒往往比看似更合理的悲觀主義更有成效,因為樂觀主義者有勇氣出發去嚐試新事物。這是通向發現的道路,即使發現的可能不是最初希望的。悲觀主義者在某些狹義上可能更“正確”,但會比樂觀主義者得到更少的發現。
這種觀點與我們通常判斷想法的方式形成了鮮明的對比:試圖弄清楚他們到底是對還是錯。這是處理日常研究瑣事的明智策略。但這可能是判斷一個重要而大膽的想法的錯誤方式,這種想法會決定整個研究項目。有時,我們隻有微弱的證據來證明這樣的想法是否正確。我們可以溫順地拒絕跟進這個想法,把所有的時間都花在細究已有的證據上,試圖辨別什麼是真實的。或者,我們可以接受沒有人知道真想的事實,而去努力發展一個重要的、大膽的想法。此時我們沒有成功的保證,但也隻是如此,我們的理解才會進步。
盡管如此,以最樂觀的形式,我其實不相信我們會找到一個簡單的智慧算法。更具體地說,我不相信我們會發現一個非常短的Python(或C或Lisp,或者其他)程序——比方說,1000行代碼以內——來實現人工智能。我也不認為我們會找到一個很容易描述的神經網絡來實現人工智能。但我還是相信我們值得這樣努力,就像我們能找到這樣一個程序或網絡一樣。這是通向洞察的道路,通過追求這條道路,我們可能有一天能夠理解足夠多的知識,可以寫出一個更長的程序,或者建立一個更複雜的網絡,它確實能表現出智慧。所以,我們值得假設一個極其簡單的智慧算法存在而來探索。
在20世紀80年代,著名數學家和計算機科學家傑克·施瓦茨被邀請參加人工智能支持者和人工智能懷疑論者之間的辯論。辯論變得不守規矩,支持者們對即將出現的神奇事物提出了誇大其詞的主張,而懷疑者們則加倍悲觀,聲稱人工智能完全是不可能的。施瓦茨是這場辯論的局外人,當討論升溫時,他保持沉默。在一個間歇期,他被要求說出自己的想法,陳述他對正在討論的問題的看法。他說:“好吧,做出這些進展的過程,可能會帶來100個諾貝爾獎”。在我看來,這是一個完美的回應。人工智能的關鍵是簡單、強大的想法,我們可以而且應該對這些想法進行樂觀的搜索。但我們需要很多這樣的想法,而且我們還有很長的路要走!
原文發布時間為:2017-09-21
本文作者:周楓
本文來自雲棲社區合作夥伴新智元,了解相關信息可以關注“AI_era”微信公眾號
原文鏈接
最後更新:2017-09-22 17:03:09