编者按:本文来自网易科技,编译:过客,36氪经授权发布。
人们常说眼睛是心灵的窗户,但是谷歌的研究人员把它们视作人们健康的指示器。谷歌正借助深度学习技术,通过分析人们的视网膜图像预测一个人的血压、年龄和吸烟状态。谷歌的计算机能够从血管的排布中获取线索,而且之前的一项研究表明计算机能够借助这种信息预测一个人近期是否会有心脏病发作的风险。
这些研究依靠的是一种卷积神经网络,这是一种能够改变生物学家分析图像方式的深度学习算法。科学家们正借助这种方法寻找基因中的突变,并且预测单细胞排列的变化。谷歌带来了新一轮的深度学习应用,能够让图像处理变得更简单而且更通用,甚至能够识别以前被忽视的生物学现象。
美国加州山景城谷歌研究所的工程学负责人Philip Nelson称:“以前将机器学习应用到生物学的许多领域是不切实际的想法。现在你就能够做到,而且更加令人激动的是,计算机现在能够观察到许多人类或许从未见过的细节。”
卷积神经网络能够让计算机高效而且完整的处理图像,而且不需要再对图像进行分解。这种方法最早是在2012年出现在技术领域,比如说Facebook借助这种深度学习技术识别照片上的面孔。但是科学家们一直难以把这种方法应用到生物学领域,部分原因源于两个领域之间的文化差异。
旧金山生物学公司Calico的首席计算机官员Daphne Koller称:“这就像你把一群生物学家送入到一个计算机科学家团队所在的房间,他们将彼此用不同的语言谈论,而且会产生不同的思维方式。”
科学家们也必须确定借助卷积神经网络能够进行哪种类型的研究。当谷歌想要用深度学习寻找基因中的突变时,谷歌科学家必须将DNA字母链转变成计算机能够识别的图像。随后他们需要借助参照基因对神经网络进行训练,这样才能发现突变。12月问世的DeepVariant工具就能够在DNA序列中发现微小的变化。在测试中,DeepVariant的表现至少赶得上传统的工具。
西雅图艾伦细胞科学研究所的细胞生物学家正使用卷积神经网络,将光学显微镜拍摄的单调灰白照片转换成3D图像,而且让部分细胞器拥有了色彩标签。这种方法消除了细胞染色的流程,细胞染色耗时较多且需要在精密实验室中进行,而且会给细胞带来损伤。上个月,该团队公布了一项先进技术,只借助部分数据就能够预测细胞其他部分的形状和位置。
麻省理工学院布罗德研究所和哈佛大学影像平台的负责人Anne Carpenter称:“你现在所看是一种史无前例的变化,机器学习能够借助图像完成生物学任务。”在2015年她的跨学科团队开始借助卷积神经网络处理细胞图像。现在Carpenter称,在她的研究中心大约有15%的图像数据借助了卷积神经网络。她预测,几年后这种方法将成为研究中心主要的图像处理方法。
更加令人激动的是,借助卷积神经网络分析图像能够在无意中揭开微妙的生物学现象,让生物学家开始思考之前忽视的问题。艾力研究所的执行董事Rick Horwitz称,这样的偶然发现能够帮助医学研究不断进步。如果深度学习能够揭开癌症在单体细胞中的微妙标识,那么它就可能帮助研究人员提前识别肿瘤。
其他生物学中的机器学习专家已经目标放在更前沿的领域,现在卷积神经网络已经开始广泛应用于图像处理。德国环境健康研究中心的计算机生物学家Alex Wolf称:“图像是非常重要的,但是化学和分子数据同样重要。我认为未来数年内将实现一项重大的突破,让生物学家更广泛的应用卷积神经网络。”