阅读45 返回首页    go 机器人


人工智能+大数据,人类如何向疾病宣战?

《人类简史》作者尤瓦尔·赫拉利提出:几千年来,人类战胜了饥荒、瘟疫和战争之后,将面临三大新议题:战胜死亡、永久幸福和升级为神一样的人。

未来,在万物互联时代,随着大数据和人工智能技术的不断进步,强大的电脑算法和数据分析将在人类的生产生活中占据重要地位,甚至对数据的信仰将成为一种新的“宗教”。

那么,医疗行业与大数据、人工智能融合将如何向疾病宣战,甚至战胜死亡呢?

从“望闻问切”到医疗大数据

2017年7月20日,国务院办公厅印发的《新一代人工智能发展规划》指出:推广应用人工智能治疗新模式、新手段,建立快速精准的智能医疗体系,如研发人机协同临床智能诊疗方案,实现智能影像识别、病理分型和智能多学科会诊等。

以医学影像大数据为例。在古代,扁鹊、华佗等名医通过“望、闻、问、切”来诊断患者病因。200年前,法国医生雷奈克发明了听诊器。到了近代,随着医学成像技术的进步,X光、超声波、放射性核素显像、X-CT、MRI、数字化成像等这些技术帮助医生们更加深入的了解人体内部病变。

“望、闻、问、切”获得的是小数据,而医学影像产生的则是大数据。随着数据库和IT技术的发展,数字化影像传输和电子胶片应运而生。而伴随着信息化的不断深入,医学影像信息被数字化、数据化后形成了丰富多样的、存储量庞大的医学大数据。

长期以来,包括电子病历、医学影像和医院视频等,医疗领域积累了大量的数据,但是我们讲大数据具有“4V”特征(Volume大量、Variety多样、Value价值、Velocity高速),“Volume大量”是基础,但数据不一定是越多越好,数据质量非常重要,比如大量非真实和严重缺失不完整的数据是毫无价值的,甚至会误导分析,这对于准确度要求更高的医疗行业尤为重要。

因此,大数据的真正的价值在于:精准、实时地收集高质量的数据,通过处理分析提供准确的输出,且能实现数据资源的多次重复再利用。如何构架一个高效的大数据平台是关键环节。

医疗大数据平台构架

英特尔所提供的针对大数据分析的总体架构,主要由数据中心硬件、基础设施资源管理、大数据处理平台和医疗信息服务平台业务应用四层构架组成。

该平台充分利用底层软硬件架构来进行数据的采集、处理、存储、分析和对最终用户的数据呈现、业务处理支持等,要求:

1)高性能的底层硬件支持,在数据中心配置了英特尔至强处理器、基于3D XPoint技术的存储/内存、基于Intel Fabric的高速网络。

2)在基础设施资源管理上,支持弹性部署,可灵活动态扩展,采用分布式存储,并具备高安全性。

3)在大数据分析处理上,支持对数据清洗和预处理以收集高质量数据、实时数据处理分析,并采用机器学习的相关技术,进行预测、推理型分析。

以其中的离线分析为例,其构架图如下:

Hive是开源的数据仓库实现,它能够很好地支持基于SQL的查询,方便开发人员实现统计型分析需求。HBase可以用于存储离线分析后生成的维度数据,以及支持快速的数据钻取查询。Mahout是开源的机器学习框架,基于已经实现的机器学习算法,方便开发人员实现预测、推理型分析需求。

在分析处理流程上(如下图),

数据清洗与预处理进行数据验证、修正或清除错误数据,然后生成实时查询和报表服务,并引入基于机器学习的数据挖掘服务。

AI+大数据,唤醒沉睡的金矿

再以医学影像为例,目前医疗数据中有超过90%来自于医学影像,大量的非结构化影像数据传统上需要医疗工作者一一识别,是一项非常繁重的工作。

而通过先进的深度学习技术和医学影像分析技术,我们可以实现自动化目标检测与分割,辅助疾病诊断和手术规划,有效提高医学影像在临床应用中的诊断效率和可靠性(如下表)。

“AI+医学影像”可表现于两个方面:

1)利用AI图像识别医学影像,获取重要信息,提高判读医学影像的效率。

2)基于深度学习,通过大量已有的影像数据和临床诊断信息训练人工智能系统,辅助临床诊断,降低误诊、漏诊概率。

联想开发了一个LEAP医疗大数据分析平台(Lenovo Enterprise Analytics Platform, LEAP),该平台涵盖数据采集与集成、大数据计算平台、算法与分析工具、平台运维管理、数据资产管理等五大部分,支持企业内部/外部数据的采集与集成、实现海量数据的存储、并提供极佳的数据计算与深度分析挖掘能力。

联想医疗大数据平台架构图

该平台与英特尔公司全新大数据可信分析平台—TAP集成,实现更加有效地进行数据管理、协议提取、负载分配以及计算,让数据变得可操作。

Intel Trusted Analytics Platform(TAP)架构示意

作为基础构架,TAP是一个开源的可信计算平台,帮助企业和开发者加速采用机器学习,为大数据用户拥有更好的用户体验。

TAP平台是一个集成、自助的数据科学工作环境,提供用于处理大数据的工具、引擎、 框架和算法,支持丰富的服务和API,集成的可自助服务的应用套件等。

该平台也面向5G物联网,它可快速部署和连接开源大数据分析工具,如Hadoop、Spark等,以提供各种物联网分析应用。

万物互联、大数据、人工智能,毫无疑问已成为下一波浪潮,显然这也是英特尔眼中的愿景。英特尔正致力于医疗业务的智能化和自动化,以更好利用数据这一武器来击退疾病。

事实上,作为芯片龙头制造商,英特尔正在向人工智能、无人驾驶、5G、虚拟现实、中国制造2025、精准医疗、体育、机器人等多个领域发力,全新推出的英特尔至强可扩展处理器以更强劲的数据处理能力,正助力更多行业和领域更好地利用数据,加速数字化转型升级。

来源:网优雇佣军

最后更新:2017-11-02 22:19:04

  上一篇:go 人工智能背景下的金融投资机会与哲学思考
  下一篇:go 大数据、人工智能、机器人,有什么血缘关系?