谷歌开发出的深度学习算法模型 可用于预测DNA链等亚细胞结构的变化
该算法通过研究细胞的变化来进一步研究相关疾病的变化,获得了多项人类尚未发现的研究成果。
眼睛是心灵的窗口,但从去年开始,谷歌的研究团队就利用机器学习将眼睛转化为检查人体健康的“窗口”,他们通过算法分析人体的高精度3D视网膜照片发现,图像里面包含的信息可以用来判断出一个人的血压、年龄和吸烟状况。
近日,研究团队又获得了新的进展,利用算法分析其亚细胞结构(如线粒体、染色体、DNA链等)的变化后,发现了通过分析“眼睛”,我们可以判断一个人是否有患心脏病的风险。
不同于以往,这里的研究成果不断,背后的首要功臣是谷歌研究团队开发的3D细胞结构模型的算法。继Alpha Go之后,谷歌研究团队又一“黑科技”秒杀人类。
其实揭开它的神秘面纱,其核心就是图像处理算法。
图像处理是如何应用到生物学领域的?
在生物学研究领域,细胞生物学的研究核心点就是:结构决定功能。其中,蛋白质学中就有理论明确提出,细胞的状态由细胞内结构的位置以及细胞周期的改变来确定。
在这一背景下,研究学者自然就想到从3D显微镜图像切入研究细胞结构,希冀借由图像处理来进行生物学的研究。而随着科技的发展,深度学习成为图像处理领域的最佳利器,故而许多研究人员开发出了算法,以用于处理活细胞等微生物荧光图像:
如当科学家希望利用深度学习来分析基因组中的基因突变,他们先将DNA链中的碱基转换为计算机可以识别的图像,然后将已知的DNA突变片段信息与基因组信息一起用于训练神经网络系统,随后用机器学习进行预测和数据分析。
但是谷歌研究团队发现,这一过程本身存在着一项技术缺陷:因为现有算法模型处理2D图像,所以在利用其对生物图像进行处理之前,每一次都首先需要对3D图像进行处理,以将其转换为现有图像处理算法能够处理的照片。
可见,想将深度学习用于生物学研究领域,“磨刀”的功夫就需要花费很久,将每一项研究的3D图像转化为2D图像极大得降低了研究效率、限制了图像处理算法在生物医学研究上的应用。
谷歌团队让生物学图像处理更轻松,研究成果不断
为了解决图像维度转换过程带来的应用局限性,谷歌研究团队基于卷积神经网络提出了一种条件生成模型,他们可以直接利用3D显微镜图像对模型算法进行训练,以用于学习细胞和细胞核形态的变化,并利用训练后的模型分析预测亚细胞结构的位置。
上个月,谷歌就基于该模型发布了一款名为DeepVariant的工具,人们可以用它来识别DNA序列中的细微变化。
但不止于此,谷歌研究团队还整合了条件生成模型和传统的算法处理方法,提出了一种不需要参数的3D细胞结构模型的算法,它可以直接处理高精度的三维生物器官图像。
此外,这种新算法还可以将细胞内部结构的变化和细胞的变化结合在一起,以用于研究相关疾病的变化。在最新的报告中,研究团队给出了初步的实验结果,即其在心脏病预测上的应用。
图像处理算法因此更强大
对于该算法,谷歌研究院工程总监Philip Nelson介绍说:“之前,将机器学习应用于很多生物学领域是不切实际的。现在,我们可以做到了。但更让人激动的是,如今机器能发现之前人类可能无法看到的东西。”
值得指出的是,谷歌开发的这种方法本质上就是一种通用的图像处理算法,不仅可以用于通常的图像识别,还可以用于生物学领域高精度三维图像的分析和相关细胞变化的预测。