人工智能在生物医学领域大有作为

1943年,由McCulloch,Pitts和Wiener等科学家发表的关于生物控制论和仿生学的科技论文奠定了人工智能的理论基础。从那以后,一些科研团体热衷于从物理学、数学和工程计算中探寻生物学的踪迹,探索目的主要有两个,一是试图从工程研究中获取一些新的概念和灵感;二是物理学、工程学和计算学中的概念和相关技术,很好地帮助神经科学家们理解生物系统的功能。

随着图像识别、深度学习、神经网络等关键技术的突破带动了人工智能新一轮的大发展,“人工智能+医疗”概念应运而生。在业界达成的一个共识是“人工智能+医疗”主要集中在机器学习辅助诊疗及分析这类领域。

国家相关部门也认识到人工智能在医疗领域的应用需求,也陆续出台过相关文件。如2016年6月,国务院公布了《关于促进和规范健康医疗大数据应用发展的指导意见》,明确指出健康医疗大数据是国家重要的基础性战略资源,需要规范和推动健康医疗大数据融合共享、开放应用。

近年来,科学家们纷纷投入人工智能开发,用于预测和检测阿尔茨海默病(亦即阿兹海默病)、癌症、心脏病、病人死亡、血型、化学分子气味等。基于此,小编针对这些年来人工智能在生物医学领域的应用进行一番梳理,以飨读者。

1.人工智能预测阿兹海默病风险,准确率超 84%
原始论文:Predicting Cognitive Decline with Deep Learning of Brain Metabolism and Amyloid

作为一类慢性中枢神经疾病,阿兹海默病越来越严重地影响了现代社会。2015 年,全世界约有 3000 多万人被诊断患有这种疾病。因为需要花费巨大人力物力来妥善护理病人,它也给世界各地的卫生保健系统带来了很大的经济负担。虽然目前没有已知的方法在晚期病例阶段中制止该疾病的恶化,但有证据表明,如果早期发现,相应治疗有望使疾病进展获得减慢或停止。所以,如何找到一种可靠的方法来提早发现那些有可能具备疾病风险的潜在病人,逐步成为医学研究和临床护理的重要目标。

近日,韩国高科技科学院(Korea Advanced Institute of Science and Technology)和 Cheonan 公共卫生中心的科学家们通过深度学习(deep learning)开发出一项技术, 能以超过 84% 的准确度识别未来三年可能发展成为阿兹海默病的潜在病人。

医生会非常热衷于能够发现可能发展成为阿兹海默病的潜在人群,因为他们最有可能受益于早期干预治疗。一般来说,其中一种方法是研究大脑的正电子发射断层扫描(PET)扫描图片。众多医学研究显示,阿兹海默病患者的大脑部位大量产生一种被称为淀粉样蛋白斑块的特征性蛋白质团块,它能负面影响大脑使用葡萄糖的能力,于是显着降低脑代谢速率。利用这一原理,某些类型的 PET 扫描可以显示出上述两种情况的大脑迹象,因此可以被用于发现最有可能发展成为阿兹海默病的轻度认知障碍患者。

遗憾的是,这一理论在操作中难以得到适当实践:认读解释 PET 图像很不容易。研究人员通过长期培训可以寻找一两个大的生物学标记,但是这种方法不仅耗时且容易出错。韩国科学家 Hongyoon Choi 博士和 Kyong Hwan Jin 博士开发了深度学习的神经网络,期望这一过程可替代人类的观察活动。

近年来,世界各地的阿兹海默病研究人员一直在建立一个健康人群与阿尔茨海默病患者脑图像的数据库。Hongyoon Choi 博士和 Kyong Hwan Jin 博士使用这个数据库来训练卷积神经网络,并且在此基础之上识别它们之间的区别。该数据集由 182 位 70 多岁的健康人大脑图像和 139 位相似年龄的确诊阿兹海默病患者大脑图像组成。通过培训,该机器软件系统很快就学会了识别差异,精确度几乎达到了百分之九十。接下来,Hongyoon Choi 博士和 Kyong Hwan Jin 博士使用他们的机器来分析不同的数据集。这里面包括了 181 位 70 多岁轻度认知障碍患者的脑部图像,其中 79 人在三年内继续发展为阿兹海默病——显然机器学习的任务是发现这些易患疾病的个体。

这一机器深度学习的结果是非常鼓舞人心的:软件系统识别轻度认知障碍患者患者转化成为阿兹海默病的预测精度高达 84.2%,优于常规基于特征的人为量化方法(p<0.05),显示出了深度学习技术使用脑图像预测疾病预后的可行性。

2.Science:自学习式人工智能可协助预测心脏病发作
doi:10.1126/science.aal1058

即使医生有很多工具可以预测患者的健康,但是他们仍会告诉你这些工具远远不能应对人体的复杂性。而心脏病发作就特别难以预测。现在,科学家已经表明,自我学习式计算机可比标准医疗指导方针实现更好的性能,显着提高预测率。如果推广开来,这项新方法每年可挽救数千甚至数百万的生命。

在一项新研究中,Weng 和其同事对比了 ACC/AHA 指导方针和 4 个机器学习算法:随机森林(random forest)、logistic 回归(logistic regression)、梯度提升(gradient boosting)以及神经网络(neural networks)。为了在没有人类指示的情况下得出预测工具,所有这 4 项技术分析了大量数据,被分析的数据来自英国 378256 名患者的电子医疗记录,目标是在与心血管疾病有关的记录之中找出发病模式。

首先,人工智能(AI)算法必须自我训练。模型使用 78% 的数据(约 295267 条记录)来搜索模式并构建它们自己的内部"指导方针〃。然后使用剩余的记录对自己进行测试。在使用 2005 年的可用记录数据后,系统能预测在未来十年内哪些患者会首次发生心脑血管疾病,然后再使用 2015 年的记录检查预测结果。与 ACC/AHA 指导方针不同,机器学习方法可考虑超过 22 个的特征,包括民族、关节炎和肾脏疾病等。

所有 4 种人工智能方法的表现都优于 ACC/AHA 指导方针。我们使用 AUC(其中 1.0 表示 100% 的精确度)的统计量,ACC/AHA 指导方针达到 0.728,而 4 种人工智能方法的精确度在 0.745 到 0.764 之间,Weng 的团队这个月在 PLOS ONE 报告了这一成果。最好的神经网络方法的精确与测量不仅比 ACC/AHA 指导方针多出 7.6%,同时还减少了 1.6% 的错误预警。在大约有 83000 条记录的测试样本中,这相当于多挽救了 355 名额外的患者。Weng 说,这是因为预警通常就会导致患者通过服用降低胆固醇的药物或改变饮食进行预防。

3.人工智能诊断皮肤癌准确率达91%
doi:10.1038/nature21056

斯坦福大学一个联合研究团队开发出了一个皮肤癌诊断准确率媲美人类医生的人工智能,相关成果刊发为了1月底《自然》杂志的封面论文,题为《达到皮肤科医生水平的皮肤癌筛查深度神经网络》(Dermatologist-level classification of skin cancer with deep neural networks)。他们通过深度学习的方法,用近13万张痣、皮疹和其他皮肤病变的图像训练机器识别其中的皮肤癌症状,在与21位皮肤科医生的诊断结果进行对比后,他们发现这个深度神经网络的诊断准确率与人类医生不相上下,在91%以上。

研发者们是以谷歌的一个能在128万张图像中识别1000种物体的算法为蓝本进行加工。谷歌的这个算法原本是用来区分喵星人和汪星人的,现在,研究者们需要训练它区别良性脂溢性角化病(benign seborrheic keratosis)和角化细胞癌(keratinocyte carcinomas)、普通的痣和恶性黑色素瘤(malignant melanomas)。

他们选出了129450张皮肤病变图片,其中包含2032种不同的疾病。每张照片是作为一个带有相关疾病标签的像素输入进算法的。这样,研发者省去了许多前期的图像分组工作,大大提高了数据量。

在测试中,人工智能被要求完成三项诊断任务:鉴别角化细胞癌、鉴别黑色素瘤,以及使用皮肤镜图像对黑色素瘤进行分类。研究者通过建构敏感性(sensitivity)-特异性(specificity)曲线对算法的表现进行衡量。敏感性体现了算法正确识别恶性病变的能力,特异性体现了算法正确识别良性病变,即不误诊为癌症的能力。在所有三项任务中,该人工智能表现与人类皮肤科医生不相上下,敏感性达到91%。

算法诊断不同数量的角化细胞和黑色素细胞图片时的敏感性,均在91%以上。除了媲美人类医生的诊断敏感性之外,该算法还有一大亮点,它的敏感性是可以调节的。研究者可以依据想要的诊断效果对敏感性进行调整。

4.人工智能走进ICU:可预测病人死亡 准确率达93%

医院对于自家的重症监护室(ICU),往往有一个不成文的期望:减少“患者在病床上去世”事件的发生。这种想法乍一听有点奇怪,但可以理解。这个期望可能很快就能实现了。基于监测患者生命体征各种设备所提供的实时数据,ICU似乎是人工智能的完美使用场景,可以用来判断患者的实时病情以及病情何时恶化。

儿科重症监护室(PICU)内的场景,总是让人心痛。在洛杉矶儿童医院,数据科学家Melissa Aczon和David Ledbetter提出了一种人工智能系统,这个系统可以让医生们更好地了解哪些孩子的病情可能会恶化。

Aczon和Ledbetter都在一个名为“虚拟PICU”的医院研究部门内工作。在这里,他们和那些渴望看到操作上有改进的临床医生合作,共同开发这个人工智能系统。Aczon说:“他们的观点是,在ICU里,医患之间的接触一直在发生,并产生数据。我们有道德责任从这些病例中学习,并将所学到的经验来更好地治疗接下来的患者。”

他们使用了PICU里超过12000名患者的健康记录,机器学习程序在数据中发现了相关规律,成功识别出了即将死亡的患者。该程序预测死亡的准确率达到了93%,明显比目前在医院PICU中使用的简单评级系统表现更好。Aczon和Ledbetter在Arxiv上发表了相关论文,公布了他们的研究成果。

他们实验的创新点是使用了一种叫做循环神经网络(RNN)的机器学习方法,这种方法擅长处理持续的数据序列,而不是从某一个时刻的数据点直接得出结论。“RNN网络是处理临床数据序列的一种有效方法。”Aczon说,“它能够整合新产生的信息序列,得到准确的输出。”所以在程序中,RNN网络表现得更好,因为它能够随着时间的推移,根据病人最近12小时的临床数据,做出最准确的预测。

虽然这个系统还处于实验阶段,但Aczon和Ledbetter提到,这样的工具将在PICU中有很大的用途。当然,如果这个死亡率预测软件在医院投入使用,医生不会满足于只是获得病人的死亡风险评分。“风险评估只是第一步。”Ledbetter说,“一旦你知道了病人将会发生什么,你就可以基于患者病情思考如何进行干预和防止患者病情恶化情况的发生。”

5.厉害!第三军医大利用人工智能30秒内鉴定血型,超99.9%准确率
doi:10.1126/scitranslmed.aai7863

图片来自H. Zhang et al., Science Translational Medicine, doi:10.1126/scitranslmed.aaf9209。

利用人工智能30秒内可鉴定血型,准确率超过99.9%。这是3月15日,权威杂志《Science Translational Medicine》刊登的一篇关于中国第三军医大学罗阳团队的最新研究成果,这对于急需输血抢救的病人意义重大,可以为患者节省3-15分钟的时间,增加他们的生还几率,同时也可用于抢险救灾、战场急救等急需验血的情况。

第三军军医大学罗阳团队研发的技术,可以在30秒内检测出ABO血型和Rh血型,仅用一滴血在2分钟内完成包括罕见血型在内的正向和反向同时定型(医生在输血前,为了减少错误,一般要做正反定型和交叉验血试验)。同时团队还设计出一套智能算法,能够根据试纸的颜色变化读出血型,定型准确率超过99.9%。

罗阳团队的鉴定原理是抗原-抗体反应和PH试纸颜色反应。研究人员用Ph指示剂染料浸渍后的特殊纸质材料,制成特殊形状的纸条。然后在每一张纸条的不同位置,固定不同的血清抗体,根据血液与抗体反应产生的不同颜色判断血型。

值得一提的是对于反应后颜色的识别不是人为的去看,而是机器自己识别。研发团队为了减少人为识别带来的误差,开发了一套机器学习算法自动识别颜色的变化,同时为了验证算法的准确性,研究人员先用经典凝胶卡片法鉴定3550例血液样本,再通过优化参数操作,算法模型准确的测出这3550例血液的血型。同时在另一项试验中,研究人员取600个血液样本,15个无效样本(红色墨水之类),机器学习模型100%识别出15个无效样本。这种方式不仅方便、快捷、而且成本很低适宜推广,要想实现产业化,该方法稍加改造就可成为一个低成本和强大的通用血型鉴定平台。

6.Science:重大突破!利用人工智能鼻子预测分子的气味
doi:10.1126/science.aal2014; doi:10.1126/science.aal0787

在你看到一种颜色之前,你能够仅根据光的波长预测它。音乐无需亲耳听见而能够仅根据乐谱上的音符加以理解。但是气味不是这样的。辨别一种东西闻起来像是玫瑰味、松脂味、汽油味还 是海风般清新的唯一方法是闻它。

一项新的研究让我们的最为神秘的嗅觉变得更加可预测一些。由美国洛克菲勒大学的研究人员启动的一个项目利用众包策略设计出一种数学模型,这种模型能够预测一种分子产生的气味。

在这项新的研究中,Vosshall研究了人类和昆虫的气味感知(odor perception)。作为这项研究的一部分,她和来自她的实验室的研究员Andreas Keller着手探究分子和它们产生的气味之间 存在的关联。

为了获得他们需要的数据,他们要求49名志愿者闻一闻一组精心挑选的分子,每种分子装在一个小瓶子里。可能存在的气味数量几乎是无止境的---尽管人类感知光线和声音的限制是大家熟知 的,但是还没有为气味建立这样的边界。因此,在探究我们的嗅觉的全部范围的努力中,Keller收集了476种不同的分子,它们中的很多分子之前从没有在嗅觉研究中接受过测试。

总之,这项研究产生100万多个数据点。这些研究人员随后寻求将这些气味感知信息与200万多个描述这些气味分子化学特征(如它们含有的硫原子数量)的额外数据点相关联在一起。它利用 众人的智慧解决这个问题。

来自全世界的研究机构和公司的22个精通计算的志愿者团队参加DREAM嗅觉预测挑战(DREAM Olfaction Prediction Challenge)。这种DREAM挑战是由美国IBM公司托马斯-沃森研究中心主任 Pablo Meyer组织的。利用Vosshall和Keller的气味评分,即迄今为止收集到的最大的数据集之一,这些团队设计出能够“学着”依据一种分子的化学特征预测它的气味属性的算法。

最好的解决方法并没有出现在任何单个模型中。为了利用众人的智慧,DREAM挑战通常将每个人提交的模型合并到一个综合模型(aggregate model)中。这个综合模型经常要比任何单个模型 更加强大。

在DREAM挑战结束时,这些研究人员利用他们拥有的对69种分子的评分测试了这种综合模型的性能。将气味属性与分子匹配在一起的完美分数是1.0;这种综合模型得分为0.83,显著好于之前 为解决这个问题作出的任何尝试。

尽管这种气味预测模型迄今为止并不完美,但是它为寻找高效地配制玫瑰香味等气味的方法的香水化学家开辟了新的可能性。它也为气味感知的非常复杂的生物学特征提供新的认识。没有人 充分地理解当气味分子飘进鼻子,转化为传送到大脑中的电信号时,到底发生了什么。

7.谷歌研发人工智能眼科医生:用深度学习诊断预防失明
doi:10.1001/jama.2016.17216

谷歌的人工智能已经比人类更好地掌握了古老的围棋、学会了识别人脸和口语、能帮你在网络中智能地筛选答案、甚至还能将你说的话翻译成上百种语言。而除了玩游戏和提供更便捷的智能手机应用之外,谷歌的人工智能还能做一些更为严肃的事,比如疾病诊断。实际上,谷歌已经严肃起来了。昨天,谷歌研究者在其 Research 博客上更新了一篇文章,介绍了他们在研究自动识别糖尿病性视网膜病变(diabetic retinopathy)上的最新进展,相关论文已经发表在美国医学协会杂志(Journal of the American Medical Association)上。

在今天发表于 JAMA 的论文《用于检测视网膜眼底照片中糖尿病性视网膜病变的深度学习算法的开发和验证(Development and Validation of a Deep Learning Algorithm for Detection of Diabetic Retinopathy in Retinal Fundus Photographs)》中,我们提出了一种可以解读视网膜照片中 DR 发病迹象的深度学习算法,这有望能帮助资源有限地区的医生正确地筛选出更多的病人。

我们使用了一种被称为深度卷积神经网络的专为图像分类而优化过的神经网络类型,该网络使用 128175 张视网膜图像的可追溯的开发数据集进行了训练,其中的每一张图像都针对糖尿病性视网膜病变、糖尿病性黄斑水肿和图像等级进行了 3 到 7 次评估,评估者来自 54 个美国有执照的眼科医生和眼科学资深专家在 2015 年 5 月到 12 月之间所作出的评估。所得到的算法使用 2016 年 1 月和 2 月的两个互相独立的数据集进行了验证,其中的每张图像都至少经过了 7 位美国认证的眼科医生的高 intragrader 一致性的评估。

这种用于检测可发病的糖尿病性视网膜病(RDR/referable diabetic retinopathy,即中度和更糟糕的糖尿病性视网膜病)、可发病的糖尿病性黄斑水肿或同时两者的算法的灵敏度(sensitivity)和特异性(specificity)是基于眼科专家小组中大多数决策的参考标准。该算法在为两个开发集所选择的 2 个操作点上进行了评估,其中一个是为高特异性选择的,另一个则是为高灵敏度选择的。

在这项成人的糖尿病性视网膜眼底照片的评估中,基于深机器学习的算法对可疑糖尿病性视网膜病变检测时具有高灵敏度和特异性。 进一步的研究是必要的,这将确认此算法应用在临床中的可行性,并确定与目前的眼科评估相比是否使用该算法可以改善治疗和诊断结果。

8.人工智能加快乳腺癌风险预测
doi:10.1002/cncr.30245

来自美国休斯顿的研究人员最近开发出一个人工智能软件能够准确解读乳腺X线影像结果,帮助医生快速准确预测乳腺癌风险。根据这项发表在国际学术期刊Cancer上的最新研究,这套计算机软件能够直观地将病人的图像结果翻译成诊断信息,速度是人类的30倍,准确率高达99%。

研究人员使用人工智能软件解读了500名乳腺癌病人的乳腺X线影像结果和病理报告。该软件能够扫描病人的影像结果,收集诊断特征和将乳腺X线影像结果与乳腺癌亚型进行关联。医生使用软件的分析结果来精确预测每个病人诊断为乳腺癌的可能性。

研究人员希望这套人工智能软件能够帮助医生确定病人是否需要进行活检检查,为医生配备该工具能够减少不必要的乳腺活检。他们还表示人工回顾50份影像结果需要耗费两名医生50到70个小时,而这套软件回顾500份只需要几个小时,为医生节省了大量时间。

9.人工智能筛查乳腺癌的效率有多高?比医院老司机们快30倍!

乳腺癌是发生在乳腺腺上皮组织的恶性肿瘤,一直是威胁女性健康的恐怖杀手之一。此前在该疾病的筛查上,医生们多数采用乳腺X光图片的检验方法,但这种方式通常需要乳腺活组织检查来辅助,这就为女性带来了不必要的痛苦。不过,通过研究人员的努力,未来AI将大幅降低乳腺疾病检测为女性带来的不适。

今天,来自休斯顿卫理公会医院的研究人员称他们开发出了一款AI软件,该软件在解析乳腺X光图片时比普通医生快上30倍,其准确率更是高达99%。他们将该研究发表在了癌症杂志上,研究结果显示,这款AI软件可以直观的将X光图转译成诊断信息,方便医生快速对病人病情作出判断,以免耽误病情。

为了检测这款软件的实力,研发团队搞了一次人机大战,直接给AI安排了500位乳腺癌病人的乳腺X光图片和病理组织切片报告。同时,该团队还为其安排了各种相关医学发现试图迷惑AI。不过,这点任务可难不住拥有洪荒之力的AI,几个小时之内它就成功完成了任务。而另一边,两位乳腺癌界的老司机,却花了50-70小时才搞定50位病人的诊断。由此我们可以想见,这款AI软件在效率上到底有多恐怖。

那么研发人员为什么会想到做这件事呢?原来是残酷的数据震惊了他们。来自美国疾控中心(CDC)和癌症协会的数据显示,每年美国大约有1210万人接受乳腺X光图片监测,但其中差不多有一半都有“假阳性”嫌疑。这就造成了大量女性为了求安心接受乳腺活组织检查(每年160万人左右),而其中20%的女性根本就没病。

除了减少病人痛苦和节省医师时间,该软件还能制住不断攀升的抗癌成本。美国国家癌症研究所预计,到2020年,国家花在癌症上的钱将达到史无前例的1580亿美元,实在是个天文数字。

10.人工智能助力癌细胞活体检测
新闻来源:AI Boosts Cancer Screens to Nearly 100 Percent Accuracy

随着人工智能技术的快速崛起,基于人工智能的癌症筛选也获得了长足的进步。科学家们利用人工智能技术,可以高效区分出普通的健康细胞和癌变的细胞,其准确率不亚于一个专业训练的病原学专家。

2016年4月份,在捷克首都布拉格举行的国际生物医学成像国际研讨会上,一组来自哈佛大学的科学家们,展示了他们最新的研究成果。该研讨会组织了一次利用计算机模型来进行病理检测的竞赛。组织者们选择的病理活体组织检测基于前哨淋巴结活检。哈佛大学组的基于机器学习模型的分辨方法,可以在人类乳腺癌细胞组织中,成功区分开正常的组织细胞和乳腺癌细胞,其分辨的成功率达到了惊人的92%,远超出其他的机器学习模型。然而人类依然有着天然的优势。病原学专家进行活体组织检测,可以区分开正常组织细胞和癌细胞,其准确率则高达96%。在该研讨会上,来自哈佛大学的研究人员还展示了机器学习的人工智能模型与人类专家的协作,在组织细胞活体检测上面能够有99.5%的准确率。

机器学习模型已经在各个方面得到了应用,生物医学领域也逐渐有更多的“会学习的机器”参与。2016年4月的这次国际生物医学成像国际研讨会就旨在促进研究者们更多地关注人工智能在生物医学领域的应用。虽然目前来说,人工智能模型对于癌细胞的检测没有能够到达100%,但是其效率惊人,如果能够和人类配合,检测的精度和速度将会比传统方法提高很多,或许机器终将逐步取代人类。但是,哈佛大学的Andrew Beck博士指出,虽然机器学习和深度学习技术会让人的工作越来越少,但是传染病学专家和病理学专家仍有用武之地,因为机器学习模型需要人类的帮忙来完成学习过程。

11.Neurocomputing:人工智能50年辉煌历程
doi:10.1016/j.neucom.2007.11.001

近,全球范围的科学家们都在欢庆人工智能50周年华诞。1943年,由McCulloch,Pitts和Wiener等科学家发表的关于生物控制论和仿生学的科技论文奠定了人工智能的理论基础。从那以后,一些科研团体热衷于从物理学、数学和工程计算中探寻生物学的踪迹,探索目的主要有两个,一是试图从工程研究中获取一些新的概念和灵感;二是物理学、工程学和计算学中的概念和相关技术,很好地帮助神经科学家们理解生物系统的功能。

“人工智能50年”这一特辑,由西班牙卡斯蒂利亚-拉曼查大学信息学院的Antonio Ferna′ ndez-Caballero等教授编辑,收录了神经计算领域内绝大多数高质量论文,并且论文在CMPI2006会议上宣读。这一次会议成为科学家们纪念人工智能“诞生”50周年的盛会,搭建了与会科学家零距离知识交流的平台。特辑概括了人工智能50年的发展历史,介绍了听觉和视觉系统的计算模型,进一步阐述了启发于神经理论的相关实际应用,致力于提高先前的科研结论,以推动神经计算科学的发展。所有研究成果均代表了当今人工智能学科的最新前沿进展。相关文章发表在爱思唯尔期刊《神经计算》(Neurocomputing)上。

;