閱讀317 返回首頁    go 阿裏雲 go 技術社區[雲棲]


阿裏NASA計劃“亮劍”:謝崇進和他追求的科學極限

NASA計劃推出近一個月。阿裏在科技領域到底做著怎樣的技術布局?日前,阿裏巴巴資深技術總監謝崇進在接受采訪時,介紹了阿裏在光通訊領域的研究和規劃。

af5d780a7fd409528be2e1acfa7075ce046cdf5e

從某種程度上來說,科技世界沒有貴族,任何一項核心科技的突破,其燃料都是無數人質感堅硬的年華和奮鬥。這就是阿裏巴巴祭出“NASA”震撼人心的地方。它試圖推進人類知識的邊疆。這其中包括機器學習、芯片、IoT、操作係統、生物識別等等。如果馬雲的狂想成真,以上任何一項的重大進展,都可以為中國添置一顆科技領域的“核武器”。實際上人們又很容易忽略,這些風頭正勁的技術,幾乎都坐落在一座巨大的技術根基之上。

這種技術就是“光通信網絡"。乍一聽枯燥艱深,但是隻要稍加解釋你就會明白。光通信網絡實際就是我們所說的“互聯網”的實體,那些把計算、存儲連接起來的真實網絡。你用手機撥打電話,或打開電腦瀏覽網頁,發出的信息都會在光纖網絡裏奔湧。實際上,目前世界 95% 的信息都在通過“光通信網絡連接”,它就像賽博世界的神經係統。

“光通信,不就是用光纖把兩台機器連接起來嗎?看上去易如反掌。”

64fccf09744da92ea04cbc309aabb60349b5e83e

如果你這樣想,那麼接下來出場的科學家會顛覆你的認知。他就是阿裏巴巴資深技術總監謝崇進。

你可以想象任何一個計算機網絡,就像一個大腦。神經的速度決定了你的反應速度,這種速度最終體就是:時間。謝崇進說。有一個浪漫的比喻:當年周幽王烽火戲諸侯,恐怕就是最早的光通信技術了。從技術上來說,烽火隻能傳遞一個比特的信息,非0即1(有敵情和沒敵情)。而且烽火傳輸信息的速度有些坑,這個錯不在光,光永遠以每秒30萬公裏的速度奔跑,問題在於用狼糞生火的過程比較麻煩。

a315cb5080ae004ac0bea3bce056f806aab3f32e

從此之後千年,人們一直沒有發現有效率地利用光的方法。1831年法拉第鼓搗出發電機,製造出一種易於人為控製的電流。讓人們更相信電這種東西比“野性難馴”的光要有效率。

即使後來人們發明了光纖,但仍有致命的問題:最初的光纖是玻璃材質,每米損耗1db。也就是說,每走十米信號強度就剩下了十分之一。這樣算來走一百米之後信號就隻剩下了原來的0.0000000001。

aa2c40f986145290d284aae2e331aaa3b4e0e631

60年代,華人物理學家“光纖之父”高琨在做實驗

這位曾在世界著名科學機構貝爾實驗室供職十餘年的科學家饒有興趣地講述了光纖的曆史。在他眼中,光通信的進步,就是一部不斷“飆車”的曆史。從諾貝爾獎得主,華人科學家高琨提出“光的損耗是因為光纖中的雜質引起的”這個論斷之後,光纖的傳輸速率就開始了瘋狂的突飛勐進:

  • 1970年,美國康寧公司拉出了第一根光纖。
  • 1977年,AT&T公司第一次在芝加哥把光通信用於商業,速度達到了 44M 每秒。
  • 今天,一根光纖在實驗室裏的速度達到了 100T 每秒,在商用係統裏也可以做到 20T 每秒。

從七十年代中期到現在的三十年,光傳輸信息的速度提高了1000000倍。看起來技術進步勢如破竹,但每一個“0”都來之不易。光通信的基本原理仍然是開和關代表的0和1,這沒有變。這就意味著每秒傳輸1G的數據,光模塊要開關1000000000次。沒有任何模塊可以跳得這麼快,於是研究者們不得不研究其他“黑科技”,例如使用不同的相位、添加不同的光顏色來增加傳輸的信息量。就這樣“連滾帶爬”地保持了每十年帶寬增加100倍的速度,這種成績即使是我也覺得不可思議,但是過去我們真的就是這樣走過來的。謝崇進感歎。他們這一代科學家的使命,就是繼續按照摩爾定律推進光通信的速度——每18個月翻一倍。

讓光通信速度飆車的難度究竟在哪裏呢?《2001太空漫遊》中有一個載入史冊的經典橋段:原始人奮力把骨頭拋向天空,轉眼骨頭化作萬年之後的宇宙飛船。拋一根骨頭,原始人都可以做到;拋一塊巨石,大力士也可以做到;把一根火箭拋出地球大氣,卻需要科學家艱苦卓絕的努力。

e5bf5275c35ef435e4cc8bcf3f9f607f1b53570e

速度已經達到 100T 每秒的光通信,每前進一步都異常艱難。但麵前是數據爆炸式的增長,傳輸速度增長稍有遲疑,就會拖慢整個世界的奔跑進程。這就是現實。So Far So Good,摩爾定律暫時沒有在謝崇進手上失效,但物理世界的天花板——香農極限——就橫亙在他麵前。他用簡單的語言為雷鋒網解釋了香農極限:

  • 一條道路看上去可以允許車輛用任意的速度通行。但是在路麵材質不變的情況下,如果車輛多到了一定程度,就一定存在一個車速的極限。即使每輛車的動力再強,也無法提高整體車速。

也就是說,在現有的材質下,光每秒能傳輸的信息是有物理上限的。不巧,謝崇進這一代研究者已經逼近了香農極限。以前用來提高傳輸速率的方法,麵對香農極限已經宣布失效了。單單等待材質的進步,肯定達不到摩爾定律的增長速度。作為 NASA 計劃的一部分,謝崇進所麵臨的一切勾勒出了未來的殘酷。NASA 要對抗的不是商業對手,而是科學的極限。

謝崇進要怎麼辦呢?實際上,早在2014年他早就預見到了研究可能麵對的極限,但他解決問題的方法卻與眾不同,那就是——加入阿裏巴巴。除了材料的進化,還有兩個金礦,那就是光模塊和網絡架構。這兩個金礦,阿裏巴巴有。說到光模塊和網絡架構的進化,就不得不提阿裏巴巴的一項秘密武器——阿裏雲。這兩項技術在雲計算網絡中應用最為廣泛。

謝崇進說,根據 CISCO 的調查,未來 99% 的互聯網流量將來自於數據中心。而數據中心中最主要的成員就是雲計算係統。以目前阿裏雲在中國的碾壓態勢,這個龐大的雲計算係統成為了謝崇進的無邊的“實踐場”。

f5ca26f4c4d347f83542c0d9ad5ed63e29114498

光模塊結構示意圖,兩側分別是光信號和電信號,中間是光電轉換的控製芯片和轉換模塊

先來說說光模塊:光信息傳輸的過程中,在一端把電信號變成光,在另一端把光信號變成電,就是光模塊的使命。正如之前所說,它就是那個每秒能發射出超過 1000000000 次閃爍的“怪獸”。

在實際環境中,全世界有幾百家大的光模塊供應商。坑爹的是,這些光模塊企業並沒有統一的參數標準,甚至連工作流程都不同。例如同樣是打開一個信道,有的先調頻率,再打開激光器;有的先開激光器再調頻率。這就造成了不同光模塊同時存在於同一個網絡之中的時候,給調度係統造成了巨大的困擾。這就好像一個班主任同時管理說一百種語言的孩子。

我們的方法就是,試著把所有的設備統一抽象成同樣的設備。在底層對所有的模塊差異進行“掩蓋”,這樣在上層調度係統來看,他們就都變成一樣的設備了。謝崇進說。雖然這樣可以大幅優化數據傳輸速率,但這並不是他理想中的狀態。在目前行業普遍采用40G 和 10G 的光模塊的時候,他和團隊定義出了 100G 的光模塊。在供應商還沒有生產的時候,就主動找到他們,要求按照阿裏巴巴的標準生產。

這種玩法的好處在於,一方麵可以加快模塊投產,另一方麵可以推進很多供應商統一采用阿裏的標準,這樣就可以在未來逐漸奪取標準製定權。未來如果在硬件層麵,大家都遵循統一的標準,那麼通信速度自然就會上升2-3倍。

在雲計算中心內部,這個問題同樣存在。對於人來來說,腦神經的帶寬隻需要十幾兆,因為信息量再大,腦就無法處理了。但對於雲計算中心來說,算力之凶勐超越了我們的想象。它們就像一個個超級大腦,內部需要高速路網般強大的神經網絡連接。

f62a48968bec5df8e7b5806351122315b71f424b

目前主流雲計算中心服務器之間的網絡通路為 10G 或 25G,但是這些顯然不是謝崇進的目標。他同樣在測試 100G 的內部網絡連接。當然,做到100G的連接有簡單的辦法,你隻需要四條 25G 的線路並行。但是這顯然是作弊。因為所謂的科技進步帶來的速度提升,一定是以成本不變或基本不變為前提的。就像這麼多年以來,你的手機通信速度越來越快,但是你的電話費並沒有隨著速度翻倍而翻倍,甚至還有所減少。這才是科技進步的真正形態。這是謝崇進的野心之一。

實際上,謝崇進正在實現他的諾言。他的團隊定義的 100G 的通信模塊即將在2017年投入使用,而且成為了ODCC(開放數據中心委員會)的標準,這也是中國互聯網的榮耀之一。

再來說網絡架構:“開放光傳輸網”,這是謝崇進對自己主導技術的標準稱唿。這是指在軟件硬件兩個層麵的網絡接口標準,它主要應用在網絡集群對外的信息傳輸上。

這個標準讓很多巨頭垂涎三尺。運營商自己在搞一套,例如美國的 AT&T,例如中國電信。科技公司也在做標準,比如我們阿裏巴巴正在聯合一些互聯網公司,如 Google 和 Facebook 製定標準。謝崇進說。他做了一個預言:互聯網未來的樣子是“簡單的東西組成強大的係統”。每個東西都可能出現故障,但是作為整體的係統非常可靠。

這番圖景需要大量重複的結構進行疊加,而重複的東西必須依靠統一的接口和標準。一旦攥住接口,就攥住了互聯網的命脈。科學家群體也許更相信戰略,排斥戰術。但謝崇進和他們的區別在於,他相信技巧的力量。傳統的通信標準都是20年。這意味著現在的標準到20年之後才會升級,而目前為下一個標準所做的準備要前瞻20年。這不是現在真實的情況。為使用20年而做出的設備,和為使用5年做出的設備,成本是有很大差距的。但是目前看來,所有的硬件設備和軟件架構都會在5年之內升級換代,那我們為什麼要付出那麼高的成本?他說。就像現在的自行車一樣。現在每一台車都不如過去的鳳凰28堅固,但我們並不會希望騎一輛車十年。

謝崇進參與製定的硬件標準,就是5年之後的。這些硬件的速度較上一代跨度雖然沒有那麼戲劇化,質量要求也並非如此苛刻。但卻達到了兩個重要的指標:成本控製+技術領先。“單一硬件的可靠性降低,但是受益於冗餘的架構,整體係統性能並不降低。在新技術出現的時候,我們就可以迅速地修改下一代標準的走向。”這可以被稱為“世俗”的算計,同樣可以被稱為務實的戰術。

621a817b71b5858012b7eefc3ffc5653c014d878

英特爾公司創始人之一,摩爾定律提出者 戈登·摩爾

400G 光模塊,是謝崇進下一個五年計劃的“旗艦”。它比目前最新的 100G 模塊又快了四倍。以前以太網的增速一直是十倍,但由於互聯網快速落地的需求,業內定了一個四倍的“小目標"。

阿裏巴巴做生意,人們普遍看好;但阿裏巴巴挑戰科學極限,並沒有那麼多祝福。"就你們幾個人能定義下一代光通信模塊的標準?”這是我最常聽到的話。聽得多了,我也心裏沒底了。但是好在我們堅持下來了。現在我可以說,下一代阿裏光模塊和開放傳輸網這兩件事,我們已經成功了70-80%。謝崇進篤定地說。

從1985年開始研究微波通信,到1993年研究生正式學習光通信,謝崇進經曆了九十年代光通信博士找不到工作的窘迫,也見證了2000年十幾家通信公司搶一個人的泡沫。比起自己起伏的際遇,他更喜歡回憶另一條曲線:最早的同軸電纜,一條幹線上隻允許一百多人同時通話;微波通信時代,從北京到上海的幹線可以允許960個人同時通話;今天,一根光纖之上,可以允許全世界人同時通話。

但這還遠遠不夠。他所做的一切,更像是對摩爾定律的一個承諾。

36abc73de2671089def4fb0c2584a58dd099ee31

作者:雷鋒網史中
原文鏈接

最後更新:2017-04-22 14:00:57

  上一篇:go 華能集團牽手阿裏雲 打造“互聯物+”陽光采購樣板工程
  下一篇:go 細數阿裏雲在使用 Docker 過程中踩過的那些坑