45
機器人
人工智能+大數據,人類如何向疾病宣戰?
《人類簡史》作者尤瓦爾·赫拉利提出:幾千年來,人類戰勝了饑荒、瘟疫和戰爭之後,將麵臨三大新議題:戰勝死亡、永久幸福和升級為神一樣的人。
未來,在萬物互聯時代,隨著大數據和人工智能技術的不斷進步,強大的電腦算法和數據分析將在人類的生產生活中占據重要地位,甚至對數據的信仰將成為一種新的“宗教”。
那麼,醫療行業與大數據、人工智能融合將如何向疾病宣戰,甚至戰勝死亡呢?
從“望聞問切”到醫療大數據
2017年7月20日,國務院辦公廳印發的《新一代人工智能發展規劃》指出:推廣應用人工智能治療新模式、新手段,建立快速精準的智能醫療體係,如研發人機協同臨床智能診療方案,實現智能影像識別、病理分型和智能多學科會診等。
以醫學影像大數據為例。在古代,扁鵲、華佗等名醫通過“望、聞、問、切”來診斷患者病因。200年前,法國醫生雷奈克發明了聽診器。到了近代,隨著醫學成像技術的進步,X光、超聲波、放射性核素顯像、X-CT、MRI、數字化成像等這些技術幫助醫生們更加深入的了解人體內部病變。
“望、聞、問、切”獲得的是小數據,而醫學影像產生的則是大數據。隨著數據庫和IT技術的發展,數字化影像傳輸和電子膠片應運而生。而伴隨著信息化的不斷深入,醫學影像信息被數字化、數據化後形成了豐富多樣的、存儲量龐大的醫學大數據。
長期以來,包括電子病曆、醫學影像和醫院視頻等,醫療領域積累了大量的數據,但是我們講大數據具有“4V”特征(Volume大量、Variety多樣、Value價值、Velocity高速),“Volume大量”是基礎,但數據不一定是越多越好,數據質量非常重要,比如大量非真實和嚴重缺失不完整的數據是毫無價值的,甚至會誤導分析,這對於準確度要求更高的醫療行業尤為重要。
因此,大數據的真正的價值在於:精準、實時地收集高質量的數據,通過處理分析提供準確的輸出,且能實現數據資源的多次重複再利用。如何構架一個高效的大數據平台是關鍵環節。
醫療大數據平台構架
英特爾所提供的針對大數據分析的總體架構,主要由數據中心硬件、基礎設施資源管理、大數據處理平台和醫療信息服務平台業務應用四層構架組成。
該平台充分利用底層軟硬件架構來進行數據的采集、處理、存儲、分析和對最終用戶的數據呈現、業務處理支持等,要求:
1)高性能的底層硬件支持,在數據中心配置了英特爾至強處理器、基於3D XPoint技術的存儲/內存、基於Intel Fabric的高速網絡。
2)在基礎設施資源管理上,支持彈性部署,可靈活動態擴展,采用分布式存儲,並具備高安全性。
3)在大數據分析處理上,支持對數據清洗和預處理以收集高質量數據、實時數據處理分析,並采用機器學習的相關技術,進行預測、推理型分析。
以其中的離線分析為例,其構架圖如下:
Hive是開源的數據倉庫實現,它能夠很好地支持基於SQL的查詢,方便開發人員實現統計型分析需求。HBase可以用於存儲離線分析後生成的維度數據,以及支持快速的數據鑽取查詢。Mahout是開源的機器學習框架,基於已經實現的機器學習算法,方便開發人員實現預測、推理型分析需求。
在分析處理流程上(如下圖),
數據清洗與預處理進行數據驗證、修正或清除錯誤數據,然後生成實時查詢和報表服務,並引入基於機器學習的數據挖掘服務。
AI+大數據,喚醒沉睡的金礦
再以醫學影像為例,目前醫療數據中有超過90%來自於醫學影像,大量的非結構化影像數據傳統上需要醫療工作者一一識別,是一項非常繁重的工作。
而通過先進的深度學習技術和醫學影像分析技術,我們可以實現自動化目標檢測與分割,輔助疾病診斷和手術規劃,有效提高醫學影像在臨床應用中的診斷效率和可靠性(如下表)。
“AI+醫學影像”可表現於兩個方麵:
1)利用AI圖像識別醫學影像,獲取重要信息,提高判讀醫學影像的效率。
2)基於深度學習,通過大量已有的影像數據和臨床診斷信息訓練人工智能係統,輔助臨床診斷,降低誤診、漏診概率。
聯想開發了一個LEAP醫療大數據分析平台(Lenovo Enterprise Analytics Platform, LEAP),該平台涵蓋數據采集與集成、大數據計算平台、算法與分析工具、平台運維管理、數據資產管理等五大部分,支持企業內部/外部數據的采集與集成、實現海量數據的存儲、並提供極佳的數據計算與深度分析挖掘能力。
聯想醫療大數據平台架構圖
該平台與英特爾公司全新大數據可信分析平台—TAP集成,實現更加有效地進行數據管理、協議提取、負載分配以及計算,讓數據變得可操作。
Intel Trusted Analytics Platform(TAP)架構示意
作為基礎構架,TAP是一個開源的可信計算平台,幫助企業和開發者加速采用機器學習,為大數據用戶擁有更好的用戶體驗。
TAP平台是一個集成、自助的數據科學工作環境,提供用於處理大數據的工具、引擎、 框架和算法,支持豐富的服務和API,集成的可自助服務的應用套件等。
該平台也麵向5G物聯網,它可快速部署和連接開源大數據分析工具,如Hadoop、Spark等,以提供各種物聯網分析應用。
萬物互聯、大數據、人工智能,毫無疑問已成為下一波浪潮,顯然這也是英特爾眼中的願景。英特爾正致力於醫療業務的智能化和自動化,以更好利用數據這一武器來擊退疾病。
事實上,作為芯片龍頭製造商,英特爾正在向人工智能、無人駕駛、5G、虛擬現實、中國製造2025、精準醫療、體育、機器人等多個領域發力,全新推出的英特爾至強可擴展處理器以更強勁的數據處理能力,正助力更多行業和領域更好地利用數據,加速數字化轉型升級。
來源:網優雇傭軍
最後更新:2017-11-02 22:19:04