医学影像+人工智能渐行渐近 数据处理难题待解

机器需要更多的学习次数,以得到更准确的判断,多次学习的基础是数据,现阶段最大的困难是数据积累。

人工智能+医学影像正在成为现实。

9月6日,香港中文大学宣布,该校研究团队利用人工智能影像识别技术判读肺癌及乳腺癌,准确率分别达到91%及99%,识别过程只需30秒至10分钟。近日,腾讯也发布AI医学影像产品“腾讯觅影”,通过将医生多年积淀的病例图片与AI结合,腾讯觅影筛查一个内镜检查用时不到4秒,早期食管癌的筛查准确率高达90%。目前,该项技术已在中山大学附属肿瘤医院、广东省第二人民医院、深圳市南山区人民医院启动临床预实验。

“人工智能将迎来爆发式增长,数据易于获取的行业会率先进入人工智能时代。”招银国际一机器学习工程师告诉21世纪经济报道记者,人工智能医疗影像可节省医生在处理数据、分析病理方面花费的大量时间。

“人工智能+医学影像”自2016年来逐渐受到资本热捧。推想科技、图玛森维、雅森科技等人工智能影像分析与诊断服务的企业相继获得千万元融资。放诸全球,IBM斥资10亿美元收购了医疗影像处理公司Merge,将其技术整合进沃森系统。

千亿市场

据国金证券调查,目前我国影像市场规模达到2000多亿元,省会城市的影像中心规模在250亿-300亿,县级市影像中心规模300多亿。

“由于中国信息化建设较晚,医疗影像方面落后美国。医学影像数据共享度较低,正逐渐向电子信息化迈进。”上述机器学习工程师告诉记者,临床需求及云技术的普及加速了医学影像智能化。

CHIMA数据显示,2015年我国医院PACS系统(医学影像存档与通信系统)建设水平50%-60%,远低于美国几乎100%的水平。

PACS系统是指影像归档和通信系统。简单说就是医院影像科检测数据通过PACS系统保存到服务器,根据实际需求可进行图像分割、特征提取、定量分析、对比分析等。

根据人工智能的不同路径,影像智能分析市场可分两类:一类是以IBM沃森系统、百度医疗大脑为代表的提升影像诊断效率的智能系统,通过大量患者电子数据累积,对医院影像诊断分析;另一类是帮助医生提高影像诊断精准度,通过对医学影像数据的深度解读分担医生工作量。

“无论哪种类型,都需要让机器学习海量数据。”上述机器学习工程师认为,随着云技术的普及,以华润万里云为代表的云端影像信息系统企业在市场上涌现,提高了患者信息的存储效率。

这种趋势下,飞利浦、西门子、联影等传统医学影像设备厂商,因其产品使用普遍,如实现PACS系统信息化转型,数据将实现在云端实时存储,更容易抢占市场份额。

数据处理难题

人工智能应用普及的三大推力是深度学习为代表的新技术、计算力和海量数据,前两者各行业通用,对医疗领域来说,数据首当其冲。

“机器需要更多的学习次数,以得到更准确的判断。多次学习的基础是数据,医疗影像需要海量医疗影像和医生的结果判断。”一位熟悉智能医疗的投资人士告诉记者,现阶段最大的困难是数据积累。

咨询公司IDC预测数据显示,到2020年全球医疗数据量将达40万亿GB,每年还将迅速增长,这些数据中80%以上是非结构化影像数据。

另外,影像数据和放射科医生增长速度存在不匹配。据相关部门和动脉网数据,美国、中国的影像数据年增长率将分别达到63.1%和30%。但两国放射科医生年增长率仅有2.2%和4.1%。

“两者之间的鸿沟一方面促进了人工智能的发展,同时也给人工智能存储及处理海量数据带来巨大难题。”上述人士解释道。

记者注意到,由于医疗数据尚未实现互联互通,国内医疗影像数据应用还处于起步阶段,数据格式难以统一。“众多医疗影像公司以科研合作方式从医院获取影像数据,但仅依靠几家医院远远不够,扩大合作医院范围又会增加医疗影像公司的成本。”

此外,获取医学影像后,对于病灶识别与标注,也是机器智能化必不可少的过程。通常的做法是医疗影像公司花费较大成本,请影像科医生识别病灶并标注,高昂的成本让部分企业望而却步。

在医学人工智能领域,IBM沃森一直处于领先。但近期屡遭市场质疑的原因之一就是沃森需要特定类型的数据持续进行“训练”,这些数据要么非常紧缺,要么难以访问。资深技术投资者和风投公司SocialCapital创始人ChamathPalihapitiya5月在CNBC上表示,IBM的专长只是通过强大的营销和市场能力让消费者为并不了解的服务买单。

“为使人工智能更聪明,需要构建深度理论学习模型。”上述投资人士认为,在构建模型前需定义一个理论策略去评估、调试,“通过调整顺序,学习模型会逐步明确及常规化”。

;