閱讀1012 返回首頁    go 汽車大全


北大博士在阿裏:因為期待,你需要更出色!


image


本文講的是北大博士在阿裏:因為期待,你需要更出色!2016年,星罡在北京大學畢業並獲得了博士學位,研究課題為《動態數據流上的實時迭代計算》。

博士期間,他是一位名副其實的學霸,作為一名學生,在學術上取得了令人矚目的成績,曾在包括SIGMOD和TODS在內的頂級國際期刊和會議上發表多篇學術論文,並獲得校長獎學金、五四獎學金等諸多榮譽和獎勵,其中校長獎學金是北大的最高獎學金。

2016年畢業加入阿裏之後,參與了實時計算係統Blink的開發工作,負責計算狀態的存儲、備份和恢複等功能的研發。在2016年雙11期間,Blink為搜索、推薦和廣告等關鍵業務提供了穩定、高效和可靠的服務。Blink相關工作同時也在開源社區取得了較大影響。通過將部分工作貢獻給社區,他已經在今年4月成為Apache頂級項目Flink的Committer。




提問:大概從什麼時候開始接觸到計算機編程方麵的東西?又是因為什麼喜歡上了計算機?

星罡:第一次接觸是小學,那個時候有一個很流行的東西叫裕興學習機,裏麵可以學一些簡單的dos、命令等編程的東西。我印象最深的是學習機裏麵有一個實現超級馬裏奧的程序,然後我就照著那個教程把馬裏奧繪出來,雖然也不懂代碼的翻譯,就照著教程把代碼一行行敲進去,這樣我就可以控製馬裏奧到處移動。


image

這應該是我人生寫的第一個程序,雖然很簡單,但是寫完之後很開心。從那個時候開始一直到上高中我對計算機的理解基本上就等於遊戲,因為我特別愛玩遊戲,就喜歡上了編程。

提問:那計算機有這麼多領域,為什麼後來選擇了算法呢?

星罡:選算法有很多偶然的原因,最早我在實驗室的主要工作是在分布式環境下的數據存儲和查詢。那個時候互聯網技術隨著web2.0的發展,用戶產生的數據有了一個指數級的增加,所以數據的存儲和查詢是一個很大的問題。但到了後來計算機的技術的發展使得很多這方麵的問題被解決了,同時大家對於數據價值的追求越來越高,非常渴望從數據之中尋找到那些潛在的聯係,並運用到實際應用中。

所以我在讀博的時候有一個很重要的研究課題,就是如何從搜集到的大數據中高效的提取數據價值,如何高效的運行豐富複雜的數據挖掘算法和計算機算法。這個問題非常有挑戰,因為我既需要對算法非常了解,還需要能提供一個支持這些算法的平台。所以我就特別希望能夠深入了解這些算法,考慮如何把這些算法通過一個真實的係統讓大數據運行起來。

提問:在校期間取得了哪些學術上的成績,哪些對你來說意義非凡?

星罡:博士期間我的課題是《實時數據流上的迭代計算》,這個問題主要是想解決在實時動態的數據流上怎麼去高效的編寫和運行基於迭代的數據挖掘算法,主要的工作是兩塊,一個是如何提供一個聲明語言,就是一種很簡單的高級語言,能夠允許用戶簡單的編寫他們的迭代程序。


image


另外的一個工作就是考慮在分布式環境下在實時數據流上怎麼樣去跑這些迭代的程序。這些工作在當時非常有創新性,也非常有意思,在SIGMOD和TODS這些國際的頂級會議和期刊上也發表了一些相關的paper。另外,這些成果也幫助我也獲得了學校的校長獎學金(北大校長獎學金為北大最高規格的獎學金,每年全校僅有100個名額)。




提問:那麼在畢業前都有哪些選擇?為什麼最終選擇了阿裏?

星罡:找工作的時候我麵了不少公司,也拿了挺多的offer,我當時希望找一個能夠繼續我博士期間研究方向並在實際中能夠發揮作用的工作,所以最早我猶豫要不要去微軟或者IBM這些公司的研究院,但是接觸之後感覺那邊的工作可能更偏向於學術研究,在實際應用裏並沒有想象中那麼大。之後我麵了很多互聯網公司,滴滴、hulu、阿裏等等,比較了業務情況、技術氛圍等等,發現阿裏這邊的工作和我研究方向非常匹配。

另外阿裏的數據場景非常吸引人,因為阿裏的流量非常龐大,另外我覺得阿裏在業務上已經非常成功了,有足夠的資源在技術上做探索,通過技術創新來獲得優勢。通過和麵世官的交流,我知道實時計算是阿裏技術發展的一個重要方向,希望通過實時計算在搜集和廣告這些關鍵業務中,提高用戶體驗獲得更高的收益。所以在阿裏我的研究和我的技術可能有更大的發揮空間,所以就果斷的過來了。

提問:那麼加入阿裏的初心是什麼呢?想達成什麼?

星罡:上大學的時候我開始接觸阿裏,那個時候經常會上淘寶買東西,感覺淘寶上的寶貝非常多,存量也非常大,那時候我就特別好奇淘寶的係統是怎麼去搞定這麼龐大的數據量和訪問量的。後來隨著我研究的深入和對阿裏的接觸,我更希望在阿裏自己能夠搭建一個在世界上有影響力的實時計算平台,自己也能夠成為一個理論和實踐兼具,成為領域內的專家。




提問:從學生到工作的轉變,這個過程中有沒有遇到過什麼問題或者不適應的地方?

星罡:之前在讀博士的時候一般我們的工作都自己安排,自己去尋找一些有意思的課題,然後追逐最前沿的科研問題。但是工作之後大部分的工作通常是由業務提出需求,所以在開始的時候總感覺自己的價值沒有發揮出來,然後日常的工作節奏也不一樣,因為以前讀博士的時候可能更關注於自己,每天的時間也由自己安排。


image


但是現在可能會經常需要和其他團隊交流,每天的時間也比較碎片,利用率不會很高。所以剛開始的時候很難適應這樣的節奏,也很難適應這樣的工作環境,開始的時候工作效率會比較低,需要一個轉化的過程。

提問:在工作中,阿裏星的光環對你來說意味著什麼?

星罡:作為阿裏星,會受到來自不同方麵的矚目,可能有更大的舞台或者更靈活的空間給你,也有更多機會和那些大牛去探討問題,但是可能對我來說意味著一個非常大的壓力,因為阿裏星其實公司和同事對你有期待,所以說你需要更出色,在工作中要更加努力,然後在個人發展中需要從更多的角度去思考一些問題,盡自己所能幫助團隊提高。

提問:到阿裏之後做的這些事情你覺得做得最好的是什麼?

星罡:在阿裏我主要還是做實時計算係統相關的事情,我們基於Apache開源社區的一個計算係統Flink搭建自己的計算係統,名字叫Blink,我主要負責計算狀態state相關的工作,我對state接口做了大量的改動,豐富了很多類型,並且優化了狀態備份的實現,還提供了很多工具來提高用戶程序開發的效率以及用戶程序的性能。


image

另外我們對可靠性做了很多工作,比如前麵提到的增量備份來減少每次備份的數據量,提高備份的效率,另外還做了一些在恢複時我們也通過本地複用來使得任務在發生異常時能夠很快的恢複。這些工作在實際業務中都起到了很大的作用,在科研社區也得到了非常好的認可。我們通過把這些工作貢獻給社區,我也成長為了Flink項目的一個Committer,這對我來說是在阿裏收獲的一個非常好的榮譽。

提問:有沒有得到你預期的收獲,感覺最大的收獲和成長是什麼?

星罡:有的。一個明顯的收獲就是我對阿裏這樣的大公司的業務有了非常深入的了解,然後在技術上就是實際能力有明顯的提高,豐富了用戶場景,使得我有了非常豐富的調試經驗,對峰值環境下的容錯、恢複這些都有了非常深刻的認識,在這方麵的技術也有了長足的進步。

另外很關鍵的收獲就是深刻理解的平台化和服務化的重要性,阿裏豐富的業務不僅要求我們開發滿足現有需求的產品,還需要我們能夠進一步的分析需求、分解抽象,設計出一個靈活高效的計算平台,來驅動業務進一步的迭代。在阿裏豐富的團隊合作使得對大項目的需求安排和項目規劃有了很好的認識。了解到了如何在一個大項目中規劃自己的進度以及開發的能力。

提問:作為一名阿裏星,在你眼中,你覺得阿裏的哪些東西對你的成長來說是非常有價值的?

星罡:第一個我覺得就是鼓勵創新和允許探索的企業文化,這讓我們在技術上有很多的大膽的嚐試。然後豐富的數據以及業務場景使得我們能夠從中獲取到豐富的問題,同時能讓自己的技術有一個實踐和落地的舞台,看到自己的技術在實際中發揮作用,對於自己來說通常是一個很振奮人心的事情。另外在阿裏有很多非常優秀的同事,我的身邊就有很多在領域內屬於頂級的同事,從他們身上獲得了很多幫助,對我在技術上的進步有巨大的影響力。

image

提問:你當初的博士的同學現在都在做什麼?和他們相比你覺得現在的你有什麼不同?

星罡:有一部分同學在學術界做一些科研研究,還有更多的同學和我一樣在互聯網公司做業界的東西。還在做研究的那些博士同學們可能會更加關注科研的熱點,然後尋求一些新奇大膽的想法。和他們相比我感覺我更加關注技術和業務的結合,考慮這些技術在實際中的可行性以及在真實場景下的表現,想法也和以前有了很大的不同。




提問:對於即將畢業的師弟師妹們你有沒有什麼建議?

星罡:我覺得最重要的還是首先要打好自己的基本功,要有過硬的技術能力,然後在找工作的時候一定要想清楚自己想要的東西是什麼,保持一顆初心,在選擇工作的時候一定要考慮到長遠的打算,不要急於眼前的一些利益。

作者:星罡
來源:阿裏技術
原文標題:北大博士在阿裏:因為期待,你需要更出色!

最後更新:2017-09-21 10:03:20

  上一篇:go  自建ELK vs 日誌服務(SLS)全方位對比
  下一篇:go  “醫院”+“互聯網”,京頤領銜構建互聯網醫療新生態