閱讀418 返回首頁    go 機器人


丘成桐演講全文:工程上取得很大發展,但理論基礎仍非常薄弱,人工智能需要一個可被證明的理論作為基礎

雷鋒網AI科技評論消息,2017年10月26日上午,第十四屆中國計算機大會(CNCC 2017)正式在福州海峽國際會展中心開幕,雷鋒網作為獨家戰略合作媒體,對大會進行了全程報道。

在大會第一天,菲爾茲獎獲得者、哈佛大學終身教授丘成桐在會上作為特邀嘉賓做了首個演講報告,報告主題為《現代幾何學在計算機科學中的應用》。

報告中丘成桐先生首先介紹了現代幾何的發展曆史,隨後介紹了他與他的學生及朋友在計算機與幾何交叉方麵的一些研究。對於人工智能,丘成桐先生認為現代以神經網絡為代表的統計方法及機器學習在工程實踐中取得了很大的成功,但其理論基礎非常薄弱,是一個黑箱算法;人工智能需要一個可以被證明的理論作為基礎。

下麵為雷鋒網AI科技評論根據丘成桐先生演講內容整理,內容在不改變原意的情況下稍有修改。

胡事民(大會程序主席,清華大學教授):

大家都知道,計算機科學離不開數學,早期的計算機都是數學家幫我們奠定了基礎。今天的第一個報告,我們非常榮幸地邀請到了著名的數學家、數學界最高獎菲爾茲獎獲得者、哈佛大學教授丘成桐。丘老師不僅是偉大的數學家,他也在計算機方麵做了很多工作。他開創了計算共形幾何,廣泛地應用在圖形學、視覺傳感器等方麵。最近丘先生還在Nature上發表了一篇文章,研究社交網絡。下麵我們有請丘先生。

丘成桐演講全文:

今天很榮幸地收到你們的邀請來做一個演講。我本人在數學上的貢獻不在計算機數學,最近這十多年來,由於我的學生顧險峰以及其他朋友的緣故,他們叫我幫忙做些跟計算機有關的學問。我發覺,純數學,尤其是幾何學在計算機方麵有很大的應用。所以我今天就濫竽充數,講講幾何跟計算機數學的關係。

一、現代幾何的曆史

首先,前麵幾分鍾講講幾何學曆史。幾何學一開始,就類似今天的人工智能,有很多工程上的應用以及產生的很多定理。不過隨後歐幾裏得將當時主要的平麵定理組合以後發現這些定理都可以由5個公理推出來。這是人類曆史上很重要的一個裏程碑,在很繁複的現象裏,他找到了很簡單但卻很基本的五個公理,從而能將原來的這些公理全部推出來。我是很鼓勵我們做人工智能的也能重複這個做法——從現在複雜多樣的網絡中找到它最簡單的公理。

由於希臘人的工具不夠,所以除了二次方程定義的圖形(圓形、直線、橢圓等)以外,他們沒有能力處理更一般的圖形。一直到阿基米德,才開始做微積分的無限算法(積分體積),同時他們也開始做射影幾何的算法。

微積分的出現使幾何學進入了新紀元,微分幾何也因此誕生。幾何學在歐拉和高斯手上突飛勐進,變分方法和組合方法被大量地引入到幾何學當中。

現代幾何(近兩百年的幾何)主要發源於黎曼在1854年的博士論文,這篇論文奠定了整個現代幾何的基礎,他把幾何圖像看成一個抽象但是能夠自足的空間。這個空間後來成為了現代物理的基礎,現在物理中研究引力波等都是從黎曼這裏開始的,沒有黎曼這個空間,愛因斯坦不可能研究出來廣義相對論。同時假如我們細看黎曼的這篇論文的話,就會發現,黎曼還認為離散空間也是一個很重要的空間。這個離散的空間包括了我們現在研究的圖論,也用來研究宇宙萬物可能產生的一切。所以即使是150年以後的今天,我們依然能看到黎曼的這個觀點很重要。

二、對稱的概念

幾何學能夠提供很多重要的想法,可以講其影響是無所不在的。幾何學的很多概念在高能物理和一般的物理學領域都產生重要的影響。其中一個重要的概念叫做“對稱”。“對稱”的概念是在1820年到1890年間由幾個重要的數學家發展出來的。我們中國喜歡講的陰陽,其實就是一個屬於對稱。在數學上有一個叫龐加萊對偶的概念,其實就是陰陽,但這個概念要比陰陽具體得多,同時也真正用在了數學的發展上。

19世紀,Sophis Lee發展的李群,也是物理學界最重要的工具之一,在現代物理中幾乎沒有一個學科可以離開李群的。

在幾何學上,1870年的時候,偉大的數學家克萊因發表了《埃爾朗根綱領》,在這個綱領裏克萊因提出用對稱來統治幾何的重要原理,隨後產生了很多重要的幾何學,包括仿射幾何、保角幾何和投影幾何等。

這些幾何對於圖像處理都有密切的關係。我以及我的學生和朋友這十多年來就是用保角幾何及種種幾何來處理不同的圖像。即使是當年看上去不重要的幾何,現在實際上都有它重要的用處。這種種的計算都是從對稱這個概念發展出來的。從大範圍對稱到小範圍對稱,這些在20世紀的基礎研究中都有很成功的影響。

三、平行移動

另外一個很重要的概念,我想是很多做工程的人都沒有注意到的,就是平行移動的概念。這個概念影響了整個數學界兩千年。平行移動的概念其實就是一點和另外一點要有一個很好的比較的方法;計算機也好,圖形學也好,在某一點上看到的事情要和其他點進行比較,比較的方法就叫平行移動。這也是一個很廣泛、很重要的概念。現在在計算數學裏麵還沒有大量的引進,但是在物理學界已經被大量地使用上了。所以我期望這些基本的概念以後能在計算機裏麵大量地使用。

四、幾何學與計算機相互之間的影響

現在我們具體來講一些的事情。現代幾何為計算數學奠定了很多理論的基礎,並且指導了計算機科學未來發展的方向。現代幾何廣泛應用到計算機的所有分支。舉例來講,計算機圖形學、計算機視覺、計算機輔助幾何設計、計算機網絡等等都有廣泛的應用。再例如,黎曼幾何可以用來理解社交網絡;現代幾何理論也可以用來理解人工智能的特性。要記住,我們講的幾何並不是高中時代的幾何,所有與圖像或者網絡有關的都是幾何的一部分。

從另一方麵來看,計算機學科的發展為現代幾何提供了需求和挑戰,也推動了跨學科的發展方向。例如:

人工智能中的機械定理證明推動了計算代數的發展;

數據安全、比特幣、區塊鏈的發展推動了代數數論、橢圓曲線和模形式的發展;

社交網絡、大數據的發展催生了持續同調理論(persistent homology)的發展;

動漫、遊戲的發展推動了計算共性幾何學科的誕生和發展;

機器學習的發展推動了最優傳輸理論的發展等等。

五、計算機&幾何學研究案例

我們下麵舉幾個具體的例子,分別是圖論、計算機圖形學、計算機視覺、人工智能、深度學習等。這幾個和幾何都有密切的聯係。

1、圖論

我們先講講圖論。圖,就是一大堆頂點、一大堆邊把它們連起來,這是最簡單不過的事情。對於一個圖,譬如交通圖,我們要找出它們有著怎麼樣一個結構,什麼地方比較擁擠。有時候我們也要研究怎麼將這個圖切成小部分,然後分解成簡單的子圖;如何衡量各個連通分支間的連接度;如何將圖染色等。這些問題實際上都跟圖上的特征函數有密切的關係。

圖上的特征函數跟光滑圖形上的特征函數有很類似的地方。我在40年前跟幾個朋友,鄭紹遠、李偉光,做了一個工作,將光滑黎曼流形的特征函數推廣到圖上,得到了很好的結果。這些結果可以用來決定圖上的連結的生成,研究圖上的邊創造過程,尤其是有個量的估值來控製在圖上發散的過程。約束發散的過程可以應用到許多實際的過程中。我們還研究了圖上的薛定諤方程,定義了圖上的量子隧道概念。這些概念都是從物理上來的,被借用到圖上。

假如我們在考慮有向圖,就是每個點、每個邊,給它一個方向,我們就可以將拓撲學整個引用到圖上去,定義了圖上的同調群。同調群可以用來研究圖上密切的關係和它的內容。

現在我們來講講我們做的關於博弈理論的一個事情。進化圖論為表達種群結構提供了數學工具:頂點代表個體,邊代表個體的交互作用。圖可以用來代表各種具有空間結構的群,例如細菌、動植物、組織結構、多細胞器官和社交網絡。在進化過程中,每個個體依據自身的適應程度,進行繁殖病侵占到鄰近頂點。圖的拓撲反映了基因的演化——變異和選擇的平衡。類似的,互聯網是一個大網,一個非常複雜的網絡,我可以在上麵研究它的變化。社交行為的進化可以用進化博弈論來研究。個體和鄰居博弈,根據收益而繁殖。個體繁殖速率受到自身與其他個體的交互作用影響,從而產生博弈的動態演化。其中心的問題就在於對於給定的圖如何決定哪種策略會取得成功。

我們在今年年初的時候在nature上發了篇文章,我們得到一個結果,就是在任何給定的圖上進行弱選擇,自然選擇從兩種彼此競爭的策略中如何進行挑選,這個理論框架適用於人類決策,也適用於任何集群組織的生態演化。

我們從弱選擇極限得到的結果,解釋了何種組織結構導致何種行為。我們發現,如果存在成對的強紐帶結構,合作就會大規模出現。我們用數學證明了社會學方麵的一個結論:穩定的夥伴或者伴侶,對於形成合作型的社會起到了骨幹作用。

2、計算機圖形學:全局參數化 – 共形幾何

下麵我要講的是“計算機圖形學:全局參數化 – 共形幾何”。這是我們發展了二十多年的一個學問。我和顧險峰從他還在哈佛念博士的時候(1999年)我們就開始做這個事情。

當我們將圖形整體光滑映射到參數區域,使幾何變得很小,會破壞掉整個圖形;一般來講這個要用手工來做,否則的話它變化非常大。針對這個問題,我們使用了紋理貼圖、法向量貼圖等等的方法。共性幾何是一個很重要的從很古典的黎曼幾何中產生的幾何。

舉例來講,這個大衛的雕像,我們將它保角地映射到平麵上去。它表麵上看好像變化很大,但實際上變化不大,因為它是保角不變的。這在圖像處理中是一個很重要的事情。舉個例子來講,從圖上要畫格點,因為我們畫到平麵上去以後,我們就可以將平麵上畫的很好的格點映射到臉上,就可以變成很漂亮的四方形的格點。這對工程處理有很多好處,其好處就是它將圖上很小的圓映射到對方圖上還是一個很小的圓,不會有扭曲,不會有太大的變化。

前麵這些應用到一個數學上很重的定理,叫做龐加萊單值化定理,這是一個從黎曼時候開始的定理。就是講映射的圖形隻跟它的拓撲性有關,這上麵有三種幾何,分別為:球麵幾何、歐氏幾何、雙曲幾何。所有二維的幾何,不管是什麼樣子的,我們都可以用這三種幾何來分類。因此我們就可以將很複雜的事情很簡單地描述出來。

上麵這些我們得出了很好的結果。但是保角也有它的缺點,所以我們也發展了第二類映射,我們使得麵元被保持,而角度不一定被保持。保角映射有時候可能將一個麵拉的很遠,左手邊是保角映射,右手邊是保麵元映射。右麵的圖在不同的情形下會得出很好的結果。

3、計算機視覺,表情追蹤 – 擬共映射

共性映射也可以應用到表情識別和追蹤當中。我們可以自動地找到球麵上曲麵間的光滑映射,使得特征點匹配,使映射帶來的變化很小。這是我們得到的一個很重要的結果。

因此,我們可以用來追蹤表情,表情捕捉。一個人他在笑、在哭、在種種不同的表現的時候,我們能夠得到他的重要的麵部特征,主要的方法就是我們將它映射到平麵上,然後用共形映射或擬共形映射來研究它。這些都是很重要的數學工具,在計算上也有很重要的應用。

擬共形映射到目前來講,純數學家把它看得還是非常重要的,它不是一個正則方程,而是一個偽正則方程,也即Beltrami方程。這個方程在我們研究圖像變形時在數學上是非常重要的,所以我們應用到圖形處理裏麵去也得到很重要的結果。我們可在微分同胚的空間進行變化到最優的映射。它對醫療和動漫都有很重要的應用。

4、計算力學 – 六麵體網格生成,葉狀結構理論

我們也可以用同樣的變化(保角映射)來產生六麵體網格的生成和葉狀結構理論。

這是在一隻兔子上找到的好的網格。但是這個網格會產生一些奇異點(拓撲學的緣故)。針對這些奇異點,我們就做了一些研究,得出了很好的結論。

再比如,我們看這個曲麵,在這個曲麵上我們畫出一些葉狀的結構,可是它也有一定的奇異點。我們將這些奇異點分類,得出了一些在計算機科學上有意義的結論。

此外,全純二次微分的網絡中間有個六邊形的變化。

5、數字幾何處理-幾何壓縮:蒙日-安培理論,幾何逼近理論

下麵我們來看計算機的幾何壓縮中的蒙日-安培理論以及幾何逼近理論。如何壓縮複雜幾何數據,同時保證幾誤差最小,保證黎曼度量、曲率測度、微分算子的收斂性,這些都是很重要的問題。我們用了很多共形映射的方法將曲麵映射到平麵去;再用蒙日-安培方程,將高曲率區域放大;隨後重采樣,在共性參數域上計算Delaunay三角剖分。這樣得到的簡化多麵體網格就能夠保證黎曼度量、曲率測度、微分算子收斂。

6、區塊鏈:數字安全,橢圓曲線理論

這方麵很多人都知道,這部分我就跳過去不再講了。

7、人工智能

目前機器學習算法需要大量的樣本。雖然現在比從前進步得多了,但規模還是很龐大。所以我們的想法是,讓理論來幫忙處理這種複雜的數據學習。

在機器學習中有很多統計的內容,但是很多內容我們都不是很了解它是如何產生的。所以我們需要用一些比較嚴格的數學的理論來從這些複雜的現象中抽取出它們的本質。我們今天介紹一下用幾何的方法來研究對抗生成網絡(GAN)的事情。

生成對抗網絡GAN(Generative Adversarial Networks)其實就是以己之矛克己之盾,在矛盾中發展,使得矛更加鋒利,盾更加強韌。這裏的盾就被稱為判別器(Descriminator),矛被稱為生成器(Generator)。生成器G一般是將一個隨機變量(例如高斯分布或者均勻分布),通過參數化的概率生成模型(通常是用一個深度神經網進行參數化),進行概率分布的逆變換采樣,從而得到一個生成的概率分布。判別器D也通常采用深度卷積神經網絡。

舉個例子來講,有個概率分布u,u是基本的白噪音,影射到右手邊的圖片,一個概率分布v。我們從映射裏看到GAN的問題其實就是:在兩個概率分布u和v之間,找到一個最優的傳輸映射,從一個空間到另外一個空間,使它的概率分布是保持的。

u通過phi映射到v上去,同時我們要將它傳輸的代價變得最小。這樣的變化是我們所需要的,因為這就不再需要像剛才所說的矛盾變化來達到最好的結果。我們知道,映射可以用一個方程來解決,所以我們其實就是要找一個凸函數U,它的梯度是我們的映射函數phi,它滿足一個方程:蒙日-安培方程。

我們可以通過對這個方程進行求解的方式來找到最優傳輸映射,所以就節省很多生成對抗的時間。蒙日-安培方程本身其實是等價於微分幾何中的亞曆山大定理的。60年代就有人處理過這個方程,我自己也做過這個方程,前幾年顧險峰跟他的學生也和我一起對它做了一個計算。

對抗生成網絡實質上就是用深度神經網絡來計算概率測度之間的變換。雖然規模宏大,但是數學本質並不複雜。應用相對成熟的最優傳輸理論和蒙日-安培理論,我們可以為機器學習的黑箱給出透明的幾何解釋,這有助於設計出更為高效和可靠的計算方法。

六、總結

我們看到現代數學和計算機科學的發展緊密相關,共形幾何的單值化定理、蒙日-安培理論、最優傳輸理論等現代幾何中的定理應用到計算機科學中的很多領域。我希望我們能夠將更多那些表麵上看來很高深的數學應用到我們日常的計算機上去,不但是能夠有效地提出計算機的算法,同時也能夠給它一個理論的基礎。人工智能需要一個堅實的理論基礎,否則它的發展會有很大困難。

更多CNCC 2017精彩資訊,敬請關注雷鋒網AI科技評論。

最後更新:2017-10-28 13:57:12

  上一篇:go 人工智能到底有多火?在福州舉辦的中國計算機大會特邀專家這樣說……
  下一篇:go 人工智能創作物的著作權法規製