閱讀902 返回首頁    go 阿裏雲 go 技術社區[雲棲]


獨家幹貨|基於大數據的人體組織微結構的解析與構建


0?wx_fmt=png

◆ ◆ 

導讀 

0?wx_fmt=png

清華大數據思享會醫療大數據係列之“基於大數據的人體組織微結構的解析與構建”於2016年09月22日下午在清數D-LAB成功舉辦。


深圳艾科賽龍公司創始人趙小文深刻闡述了醫學大數據的技術架構,以及對骨骼、血管等人體組織微結構的量化簡析和構建的方法,並將這種方法延展到蛋白結構的量化解析和構建上,為再生醫學的發展奠定了個性化的組織工程學基礎。以下為演講全文:

(感謝主辦方提供演講速記及照片,速記整理|劉道全)


◆ ◆ 

一、技術趨勢0?wx_fmt=png


醫學大數據的架構具有很強的擴展性,在獲取人體的基本數據以後,不僅可以構建人體的解剖結構和生理結構,而且可以從分子層麵去構建微觀模型。例如,基於一些複雜的數學模型,可以從DNA序列推演到mRNA結構,最後構建這段DNA序列表達的蛋白結構。近年來包括醫學在內的多種學科不斷交叉融合,學術界的交流以及創業公司都在努力推動多種技術的融合。在醫學上不僅僅牽涉到臨床醫學,同時涉及生物學、分子生物學、細胞生物學、化學等等,以及自動化,包括檢測、統計、分析、影像等方麵都會涉及。當然,數學肯定是最基礎的,建立數學模型、複雜的算法都跟數學基礎息息相關。新興的大數據即數據科學,也離不開基礎的計算機科學。所以,未來醫學是眾多學科融合的綜合科學,大數據的價值是眾多領域量化的數據融合,這就是技術趨勢。

 

◆ ◆ 

二、價值驅動

0?wx_fmt=png


過去解決實際臨床問題更多依賴於醫生的經驗,不論是生理層麵還是分子層麵許多都還沒有被完全的量化,而是記錄在醫生的經驗當中。醫院也已經采集到很多數據,存放在不同的計算機係統中,但是基本以數據孤島的形式存在,並沒有被充分利用和挖掘,而這些其實就是做基礎研究最重要的數據。


醫學大數據發展有三大價值驅動力,首先是生活質量的提高,人們對生命質量或者是健康質量的不斷追求和高標準的要求;其次是在高品質生命健康需求下促使成的生命科學技術的進步;最後是基於生命科學技術進步的臨床手段不斷豐富,臨床治療質量不斷提高,這就是整個醫學大數據價值驅動的核心。此外,巨大的患者人體組織器官替換的市場需求也是重要的驅動因素。


◆ ◆ 

三、行業背景

0?wx_fmt=png


整個再生醫學行業的大背景是全球每年大概有8000多萬的各種組織器官的需求,包括髒器器官、軟骨、胰、顱頜麵、眼膜等,目前隻能通過捐獻滿足,而捐獻所能滿足的需求是非常有限的。所以,眾多科學家希望可以獲得除了捐獻以外的方式來替代和滿足大量的需求。脫細胞異體移植是正在研究的一種方法,即從供體上取出的組織脫細胞後,種植受體的細胞進行培養,然後再移植到新物體上。比如豬或牛跟腱組織取出來進行脫細胞處理,然後異體組織移植。自體移植的方法可能會造成二次創傷,而異體移植也可能因為分子層麵未被認知的部分影響生物的生存。所以,眼下的科學家研究采用人工合成、天然高分子或者生物仿生等材料,構建人體組織器官的結構,如骨骼的結構,把細胞種植在上麵,然後再做培養骨骼的移植,目前大量的實驗證明這種方法是可行的。每個人的人體骨骼從頭到腳的結構都不一樣,不同骨骼的功能也不一樣,有的是起支撐作用,有的是為神經和血管等提供營養供給載體,有的起保護髒器的作用。因此需要針對每個患者的骨骼等受損組織器官的微結構進行精準構建,而組織器官微結構的精準構建需要通過艾科賽龍進行精準的解析並構建,然後才能提供給臨床去做治療。在中國通過捐獻方式獲得器官移植的每150萬人當中,隻有1萬例獲得捐獻,其餘的因未能得到及時治療而死亡。癌症、新發腫瘤、心腦血管疾病等患者數量,再加些意外創傷、事故等患者人數,再生醫學技術的需求將越來越大,並且日趨緊迫。


◆ ◆ 

四、重塑精準醫療

0?wx_fmt=png


國內對精準醫療的理解主要是停留在基因層麵上,而精準醫療的概念在外科領域最早被提出,精準醫療其實是針對個體化治療的、針對個性化各器官的醫療服務。例如,骨組織的修複,完整的骨組織功能重建,需要匹配生理環境,這也是精準治療的範疇。重塑精準醫療的整個流程首先是基礎數據的采集,這是醫學大數據的挖掘的基礎,數據的采集方式很多,包括臨床經驗數據、自動化設備的影像數據(CT、MRI)、基因測序數據等。其次是數據的解讀與分析,通過建立相應數學模型、采用機器學習等技術對醫學數據進行挖掘。


接下來是臨床治療和技術支持,把數據解讀和分析的結果變成實用、落地的產品或方案,用於臨床治療或技術支持,如個性化解決方案、手術導航板及個性化植入物等。再者結合個性化治療的量化指標,跟蹤隨訪、複診,形成精準醫療的閉環。最後,將匯聚眾多的臨床經驗、數據進行完整的解析與融合,形成精準醫療完整的路徑和思路,從而建立巨大的精準醫療係統。這個係統不僅包含外科,也會涵蓋內科。借助這樣一套巨大的係統,將骨骼等外科以及髒器等內科學所涵蓋的組織器官量化解析,從數據開始重塑整個精準醫療體係。


◆ ◆ 

五、人工神經網絡與深度學習

0?wx_fmt=png


人體生理環境下各種數據是有相互關聯性的,單個數據拿出來,如影像數據與血液的檢測數據,與單個細胞或者幹細胞是什麼關係?在人體外的彼此間的關係不大,所以必須構建起彼此之間相互關聯的係統,模仿人體真實環境。搭建這樣的係統涉及的數據非常龐大,通常需要通過多層的運算,應用較為普遍的人工神經網絡。人工神經網絡的架構與人體神經係統有些類似,通過計算機模擬神經網絡的運行方式來構建,據說穀歌已經可以建立50到100多層的神經網絡運算,而通常應用隻有幾層。在實際應用中,艾科賽龍沒有建立那麼複雜的關係,但會經過多個環節的處理以達到更好的效果。人工神經網絡的單神經元通常由計算單元、連接單元和計算結果組成,再由多層神經元建立神經網絡。計算單元對外麵獲取的信息進行計算,獲得信息分配的權重,也是經驗值,計算結果再進行加權、綜合等處理,經過多層的運算,就形成人工神經網絡的基礎架構。


0?wx_fmt=png

擁有海量數據和建立分析的係統架構後,利用相關專業的算法和分析的數學模型進行挖掘,從而獲取最終結果。海量數據和龐大的工作量,需要有效利用計算機的計算與運算能力,通過機器學習和深度學習賦予計算機一定的智能,並結合人工神經網絡實現自動化架構。


◆ ◆ 

六、數據結構化/量化解析

0?wx_fmt=png


建立這樣一套架構的目的是要經過大量數據對機器進行訓練,使得機器可以相對獨立地計算與判斷,並得出相對精準的結論。艾科賽龍做的骨科學領域,基於幾萬例的數據不斷地對機器進行訓練,機器現在可以獨自進行計算與判斷,並得出相當精確的結論。


基於深度學習和人工神經網絡架構運算,得出的數據和結果是結構化的。這個結果就是結合臨床和醫學,進行定量計算、結構解析、判別細胞毒性和癌症病變等,以及對腫瘤標識和藥物篩選,甚至是組織構建和再生。所以量化與解析的目標就是解析人體的組織的微環境及微結構。骨骼結構可以看作脫細胞之後的物理結構,微環境就是組織生存的複雜的生理環境,最終的目標就是要解析組織的微結構和微環境,具體表現為細胞與細胞之間、細胞與組織之間、組織與組織之間的相互作用。例如解析血管的微環境和微組織,需要清楚認識血管細胞與構成管壁的肌細胞、甚至脂肪細胞之間的關係,即細胞與細胞之間的關係,以及組織與組織之間的關係,血管的毛細血管網絡化以後,如何向組織滲透營養、輸送營養等。


0?wx_fmt=png


最後將多領域的數據融合,經過缺失量化和精準構建,可以做到精確統計、精確預測,最終精確地輸出一個產品或者是一個結論。


◆ ◆ 

七、再生技術

0?wx_fmt=png


再生醫學技術是用醫學、生物學、化學、等多個學科與工程學相結合的方式,重新構建或修複人體或動物失去功能的組織、器官,使其具備正常的生理功能。具體包括多功能幹細胞誘變、細胞遷移、組織再生修複,組織替代等。修複組織結構和生理結構以後,再生醫學技術最終目的是要恢複生理功能。


0?wx_fmt=png


再生技術最重要的環節是幹細胞,幾種有代表性的幹細胞定向誘變,如iPS、MSCs等在技術和實驗中已經比較成熟。再生技術與幹細胞的結合的路徑首先是通過種子細胞培養獲得組織細胞。然後通過對組織器官的精準解析和構建,並結合生物3D打印構造仿生的微結構和微環境。接著將培養的組織細胞與仿生微結構在微環境下進行活性的培養,激活構建的組織器官的功能。活性培養完之後就構建了具備相對完整功能的組織器官,從而可以繼續進行臨床治療。經過整個過程的治療,患者能夠最大限度的恢複缺失的組織生理功能,從而真正提高患者治療質量。


◆ ◆ 

八、組織識別/解析/構建

0?wx_fmt=png


組織識別是比較關鍵的技術之一,涉及的影像數據比較多,包括基本的圖形演化和基本數據。組織識別首先要對組織進行分類,識別出哪些是血管、神經等,並標識組織特征。然後要對細胞的膜、質、核進行區分。之後還要進行蛋白層麵的評價打分,基於蛋白質的功能定位進行打分評價,完整的區分細胞外基質跟細胞的關係。最後要進行完整數據解析及校準,與現有數據庫的數據進行完整對比,缺失的部分可以基於數據實現修複等。


0?wx_fmt=png


舉個例子:為了獲取血管的結構組織,即微結構與微環境,不僅需要清晰描繪出心髒中非常複雜的血管網絡數據,也要清楚肝髒、腎髒、腦部、後肢、四肢等不同器官的血管網絡數據,甚至新增腫瘤的血管網絡數據也要進行采集,否則建立的數據分析模型可能不完整也不科學。基於大量數據的機器學習和數據結構化,並且不斷重複和強化這個過程,最終實現對靜脈血管的量化解析和數據融合。


0?wx_fmt=png


量化解析的目的是構建靜脈血管的微結構,結合生物3D打印技術就可以完成靜脈血管的體外構建,再加上細胞培養技術可以實現個性化靜脈血管的生產。通過將解析和構建的靜脈血管的結構與實際靜脈血管的影像,或者脫細胞後的血管結構進行比較,我們發現是一模一樣的。對靜脈血管進行局部放大以後,就是圖中的樣子,之前沒有人對血管的局部進行如此詳細的仿真,當中可能有些部分還要繼續完善,然而個性化組織器官的產業化或者量產商業化,還需要做適合培養並不斷地完善。目前,市麵上的人工的血管其實都隻是一個生物材料的管狀物,不能像這裏描述的一樣,根據個性化的微結構來構建。


0?wx_fmt=png


我們的一個國外合作夥伴建立的一個軟骨的臨床前動物實驗(如圖),主要是為了對比我們構建組織的組織修複情況。通過實驗組與對照組的比較,清楚地看到對照組軟骨組織修複的效果和血滲的情況,而實驗組的軟骨組織實現了理想的修複。


0?wx_fmt=png


下麵分享我們做的一例臨床實驗案例,一個患者下頜骨有造釉血管瘤,手術切除以後需要對組織進行解析與構建,從而實現功能修複。我們做了一個仿生下頜骨,既要保證原來骨結構的完整性,也要保證手術以後的美觀性,所以這也是個性化的需求。我們做這個複雜的案例時,先做基本的力學測試,獲取了相關的數據,所以手術非常可靠。為了確保短期不出現問題,先做了基本的咬合咀嚼的關係的力學分析,最終構建上圖中的模型,並通過3D打印技術實現出來。在3D打印的原型上種植細胞和塗敷軟骨細胞及細胞外基質,其中軟骨細胞在植入以後嚴重缺氧的環境下會釋放抗炎因子。最後頜骨愈合後,基本就跟正常的一樣完好。


0?wx_fmt=png


頜骨缺損修複手術後第12個星期就會發現新骨頭長好了,最高的地方會長出2.6毫米,最低長出2.5毫米。之前沒有精準的解析和構建組織的做法,骨表麵隻能長0.5毫米,因為組織間匹配度不高沒有足夠的親和性。第16個星期到第24個月之間在電鏡掃描圖(上圖右上角)發現,我們構建的骨質結構已完全融合到患者本身的骨小梁結構中,已經分不清植入物表麵新骨與原骨質的界麵。


0?wx_fmt=png


此外,在醫學大數據架構下的仿生模擬組織,艾科賽龍聯合國內外醫療研究機構共同探索的案例還有許多,左下角的兩例分別是手指的指骨和腳趾的趾骨模型,結合細胞培養,最終也進入臨床前實驗。中間紅色的模型(如圖)是2014年底的時候為國外一家公司做的兔子的活性脊椎,大概在第4個月的時候取出以後,剝離了組織及軟組織之後就剩下圖中的支架(如圖),這是4個月降解以後的樣子,原來的結構已經不見,說明原來的結構基本降解成二氧化碳與水,被身體吸收。


上麵藍手套上就是前麵提到的人造血管,是艾科賽龍利用解析與構建技術,再利用生物3D打印技術完成的,之後結合細胞培養,進行了三次培養激活實驗。圖右上角的是耳朵模型(如圖),國內外的專家都做過很多的嚐試。現在基於數據量化解析和生物3D打印已經可以精準的構建和打印耳朵原型,通過這種方式構建的“耳朵”就非常真實了,是完全的軟骨骨基結構。


圖左上角的修複體是針對退行性病變骨質流失以後,在關節裏打洞植入的骨修複材料,就是右下角中的圓柱體(如圖)骨修複材料。這種骨修複材料等同於通用的被臨床認知的方式填充進去,而不需要使用以前常用的粉末材料去填充,即“骨水泥”。骨水泥填充後的後遺症非常多,如果用金屬的材料,金屬粒子與組織表麵結合時間長之後,會滲入到人體組織,在人體組織某些地方進行沉澱,現有的大量實驗數據印證了這些問題的嚴重性。


生物材料的植入物有逐步替換金屬材料的植入物的趨勢,包括現有人工金屬關節和器械等,因為金屬植入通常有使用壽命,植入之後必須做第二次、第三次甚至多次的手術,而生物材料手術植入人體之後,與本身組織的融合,不需要做第二次手術,除非手術做的不成功。


0?wx_fmt=png


這個例子更能說明數據的力量。前麵介紹的架構,在獲取基本數據以後進行解析和構建,不僅可以在宏觀方麵應用,如骨骼生理結構的解析和構建,活性組織的外觀就是它的解剖結構,內部複雜的細胞生長結構是微結構,綜合起來就是生理結構;這種解析與構建的基礎技術也可以延伸和擴展到分子層麵的應用,如根據DNA堿基對的表達過程,可以基於類似的數據數學模型的解析和構建,實現蛋白質結構解析與構建和結構預測。圖中是88個堿基對序列(如圖),第二張是結構化處理後的圖(如圖),然後對堿基對的結構再做一次分析。DNA的表達和蛋白結構解析過程當然非常複雜,首先要把DNA的信息數據,測序的數據,mRNA的信息數據以及已知的蛋白質的折疊碼做大量的計算及分析,mRNA在剪接體裏進行遺傳信息的交換,然後通過蛋白的形式進行表達也就是翻譯過程,最後對數據進行校準和平衡,在數據和數學模型的方麵完成大數據的基礎庫。


0?wx_fmt=png


第一張圖是DNA的雙螺旋結構(如圖),接著按照要求附加上相關的信息,經過這個量化過程,把它變成了稍微複雜的結構(如圖),接著繼續進行量化,將具體的物質賦予給這個空間,這些物質就是這個DNA所要表達的信息,最後還要經過多方麵的或者是長期的驗證,我們隻是做了蛋白結構計算。接著進行蛋白質的共定位,然後進行打分評價,確定物質沒有多餘或減少,最終確認之後就解析和構建成了蛋白結構,或者說通過複雜技術預測了蛋白的模擬結構。


獲取蛋白結構的傳統方法是通過冷凍電鏡在分子層麵甚至在原子層麵進行觀察,然後根據觀察到的形狀畫出來,而大型冷凍電鏡在觀察蛋白結構的時候無法進行及時的三維拍照,因為微管環境下蛋白是動態的並且結構也相當複雜。通過計算數學模型的方式,從基因序列開始構建蛋白結構,這就是數據的力量。上圖中的蛋白結構還有許多不完善之處,需要繼續構建基礎數據庫,隻有當數據庫足夠強大的時候,通過這種方法構建的蛋白結構才非常準確。針對已知的蛋白質的折疊碼建立基礎數據庫,將量化解析構建蛋白結構與數據庫對比後進行驗證。


0?wx_fmt=png


後續各種實驗、各種臨床研究與轉化和前沿技術的合作,都需要廣泛而深入的研究,艾科賽龍的這套架構和技術體係已經實現從宏觀的解剖結構到生理結構解析與構建,並且可以擴展到分子結構,說明已經具有很強的擴展性,但其中落地的部分還是在解剖結構和生理結構上,分子結構需要相關的專家合作往前推進。


◆ ◆ 

九、總結

0?wx_fmt=png


醫學是一個綜合的學科,需要眾多學科的融合,包括化學、生物、自動化、數學等學科的融合,但仍然會有局限性,因為還有很多未知的部分。例如就遺傳基因方麵,含有外顯子編碼序列的遺傳基因已經知道10%的部分,但10%當中隻有1%可以被認知、挖掘。所以整個行業的機會是很大的,同時存在許多挑戰,我們會站在巨人的肩膀上不斷探索、不斷創新。


0?wx_fmt=png

原文發布時間為:2016-11-04


本文來自雲棲社區合作夥伴“大數據文摘”,了解相關信息可以關注“BigDataDigest”微信公眾號

最後更新:2017-06-01 12:32:24

  上一篇:go  如何在 Linux 中查找一個文件
  下一篇:go  一位缺覺的父親記錄了他雙胞胎寶寶的睡眠數據 並交給機器學習,結果……