閱讀995 返回首頁    go 人物


阿裏雲為國家基因庫提供係統支持

9月22日,位於深圳大鵬新區的中國首個、全球第四個國家級基因庫正式投入運營。國家基因庫是全世界最大的綜合性基因庫,1期建成後,綜合能力世界第一。

據了解,國家基因庫已實現對基因信息數據總量達20PB的訪問支持。20PB是什麼概念?以一部電影500MB計算,20PB(1TB=1024GB,1PB=1024TB)相當於4千萬部電影,一個人一天看一部電影需要10萬年才能看完

這裏既有保存動植物、微生物和人類組織細胞等樣本的“濕庫”,也有匯集各種生物信息的“幹庫”——數據中心。為了確保“幹庫”具備優良的數據吞吐能力和足夠安全可靠,國家基因庫運營方華大基因同阿裏雲達成戰略合作,基於阿裏雲飛天操作係統構建了基因檢測大數據分析平台,解決了生物大數據高性能計算難題。

徐訊說,在農業時代,一個國家擁有的耕地越多優勢越大;在工業時代,擁有的石油、礦產等能源越多優勢越大;而在生命時代,擁有更多的基因資源同時能對基因資源進行認知和利用,則意味著更大的優勢。

國家基因庫是真正的‘國庫’,比銀行的金庫還要寶貴。因此,技術是否自主可控、是否足夠安全,也成為運營方衡量的標準。阿裏雲的飛天係統,由阿裏巴巴的工程師自主研發,能夠將成千上萬台機器變成一台超級計算機,在存儲和計算性能上遠超國外技術。同時,具備支付寶、淘寶同量級的安全防禦能力。

在國家基因庫建成前,我國每年產出的大量基因數據都存在國際三大數據庫——NCBI、EBI、DDBJ中,在基因數據已成為戰略資源的現在,國內不能保存我國獨特的基因數據,這本身就是一種風險。

基因庫的建立將推動基因的進一步解讀和利用。“怎麼樣能理解更多呢?就像我們做人工智能研究一樣,機器要想學會下棋就需要看上萬部的棋譜。這個也是一樣的,要看懂人類基因組上的未知區域就必須依賴更多的數據,增加10%的理解至少需要一百萬到一千萬新增人的數據。所以,隻有大量提供數據才能產生出新的理解,而產生出新的理解之後測序的價值就會更大。”

阿裏雲的計算能力還將為科學家解讀生命密碼提供幫助。徐訊說,“我們每個人大約有3個GB的基因組大小,但是我們真正能讀得懂的區域隻有1%的區域,99%的區域我們是不理解的。”

基因與雲計算的結合已成為一種趨勢。即將開幕的全球雲計算頂級會議——2016杭州·雲棲大會上,更是單獨為基因計算設置了專場討論,引發關注。

最後更新:2017-10-08 00:52:43

  上一篇:go 擊敗過華為,阿裏雲是他的對手,大疆、美圖、熊貓TV是他的用戶,這家公司什麼來頭?
  下一篇:go 聯合新加坡教育部下屬大學,阿裏雲推出科技創業課程