编者按:本文来自微信公众号“ 量子位”(ID:QbitAI),作者:问耕;36氪经授权转载
啊~医学,一个正在被人工智能改变的领域。
一讲到这个,常见的报道大都是AI阅X光片无数,无师自通成良医。前不久,FDA还批准通过了首个AI设备,能预测以及预防猝死……等等,怎么都是西方传来的那一套!
民族的,能不能是AI的?
也行。
最近国内学者就发布了一项中医AI的最新研究。这项研究的目标,是基于症状的文本描述,更好地自动生成对应的中药处方。
论文中提到,之所以这个方向可行,是因为中医大夫主要根据患者描述的症状开出药方,通常不需要借助医疗器械的观察和分析。
另外研究人员指出,中医历史悠久,产生了很多医疗典籍,积累了大量的治疗记录。其中就包括症状的文本描述,以及对应的中药处方。
这不正好就是深度学习可以派上用场的地方么?
来看一个实际的案例。
比如这个《常用解表剂》中的案例。症状描述为:“外感风寒表实证。恶寒发热,头身疼痛,无汗自喘,舌苔薄白,脉浮紧。”对应的重要处方为:麻黄汤,主要成分为:麻黄、杏仁、桂枝、炙甘草。
这种模式,也可以理解为一问一答的任务。症状描述就是问题,生成的处方就是答案。
听起来简单,但研究人员发现直接使用简单的seq2seq模型时,并不能很好的完成这个任务。这也促使他们继续研究,最后得到一个更好的多元化的模型。
这就是最后的模型架构图。这个模型基于具有注意力机制的seq2seq模型基础上,并且使用了覆盖机制和masking来减少重复问题。
覆盖机制是通过向解码器添加覆盖矢量来实现的。研究人员在进行推理时在输出层添加了masking。
这个模型最后使用了PyTorch实现。
据说,这是首个用AI生成中医处方的研究。
这也意味着,之前并没有太多可借鉴的工作。实际上大部分中医病例和处方都没有数字化,已有的内容质量也不是很好。
所以,几位研究人员最终选择从中医典籍里获取数据,虽然这样构建的数据集比较小,但是能保证处方质量。
然后就是一系列的实验,过程就按下不表了。有兴趣的同学,可以看看论文。反正最后的结论如下图所示,最后一种方案在两种数据集上的表现最好。
需要说明的是,为了简化研究工作,这个项目只考虑了如何精准的生成处方中的成分,至于剂量等问题,并不在此次研究之列。
研究者也在论文中指出,希望他们的工作能为中医相关的AI研究奠定一些基础,能够鼓励更多的研究人员关注中医治疗自动化的问题。
脑洞一下,如果数据足够多,未来应该可以训练出一个AI老中医。
可以可以。
最后说一下,这项研究的三位作者,两位来自北京大学计算语言学教育部重点实验室,一位来自北京中医药大学。他们这次研究的论文,可以在arXiv上查阅。
论文地址:https://arxiv.org/pdf/1801.09030.pdf