本文作者:陈鹏,首发自“动脉网”,经36氪授权转载。
2018年对于AI和医疗行业来说必将是值得铭记的一年——在2月份,FDA(美国食品药品监督管理局)接连批准了几项AI诊断决策支持产品。
首先是2月14日,Viz.AI的ContaCT应用获得了FDA的批准,这也是FDA批准的第一个针对中风的AI诊断决策支持产品。仅仅一周后,FDA又批准了另外一个第一——Cognoa的深度学习应用作为第一个针对儿童自闭症的AI诊断决策支持系统通过审批。
在如此密集的时间段,接连批准AI诊断决策支持,这意味着什么?目前又有哪些AI诊断决策支持系统,它们分别针对哪些疾病?本文将试图解答。
顾名思义,诊断决策支持系统(CDSS,Clinical Decision Support System)是设计用来辅助医生在诊断时进行决策的支持系统。这种主动的知识系统通过病患至少两种以上的数据进行分析,为医生给出诊断建议。医生再结合自己的专业判断,从而使诊断更快更精准。
依据运行模式的不同,现有的诊断决策支持系统主要分为两种:基于知识库的诊断决策支持系统和非知识库诊断决策支持系统。基于知识库的诊断决策支持系统包括知识库、推导引擎以及用户交互界面。
非知识库诊断决策支持系统主要利用AI深度学习。AI算法通过对过往病例数据的学习,对比现有病患的数据自动给出意见。
根据实现方式的不同,又被分为机器向量、人工神经网络和遗传算法三种模式。这种诊断决策支持系统的精准度与算法和学习样本的大小有关,如果有优秀的算法和足够的样本,可以实现很高的精准度。不过,由于算法的限制,它只能对某种特定的疾病有效。
FDA分三类监管医疗设备,其根据是设备的可能使用及其给病人带来的风险。第一类class I是低风险设备如医用手套;第二类class II是中等风险设备如CT机;第三类class III是最高风险设备如支架。
Al影像系统有两种:computer-aided detection (CADe) 和 computer-assisted diagnostic (CADx) 。
CADe 用于检测不正常状况abnormalities,而CADx评估疾病的存在与否,如疾病的严重性、分类或预测。
FDA 对于监管CADe软件有很多经验,并提供510(k) 的指示标准,如何做临床表现评价。但是,FDA历来把CADx系统作为class III。
注:510(k)文件是向FDA递交的上市前申请文件,目的是证明申请上市的器械与不受上市前批准(PMA)影响的合法上市器械同样安全有效,即为等价器械(substantially equivalent)。申请者必须把申请上市的器械与现在美国市场上一种或多种相似器械对比,得出并且支持等价器械的结论。
但是2017年9月,FDA刚批准了一个乳腺CADx产品为class II,只需要510(k)。也就是说通过降低门槛来过审批。
FDA指出,它目前正在为类似的临床决策支持系统建立一个监管框架,目的是帮助系统开发者确定对患者的疾病状况最合适的治疗方案。FDA表示,希望鼓励开发人员创建、调整和扩展软件的功能。
中风
Viz.AI的ContaCT是FDA批准的第一个针对中风的AI诊断决策支持系统。根据美国疾病控制和预防中心的统计,中风是目前美国排名第五的致死病,每年有大概795000人因此丧生,它也是导致成年人残障的主要病因之一。
ContaCT通过对中风患者的脑部CT图像进行学习,总结出与中风关系最紧密的CT图像模式。
一旦发现新的脑部CT图像符合先前的模式,患者有大血管闭塞的可能性,它便会自动向医生发送提示报告。
通过与CT设备联动,它可以实时提取CT图像并传送到医生身边的平板或者手机上,比起传统需要等待CT出片的模式更具效率。
在临床实验中,ContaCT对300张CT图像进行识别并检测脑部大血管阻塞,并与两名有丰富经验的放射科医生进行对比。它的AUC值可以达到0.91,识别大血管阻塞的敏感度和特征度高达90%。
与此同时,它还可以更快地通知医生,从CT影像生成到最终医生获得提醒的时间少于6分钟,明显加快了诊断速度。根据情况不同,ContaCT大致可以节约6~206分钟,平均可以节约52分钟。
房颤
2017年7月,FDA 批准了Cardiolog Technologies的心电图分析平台。该技术是一项基于云计算的心脏监测分析网络服务,旨在帮助医生使用长期动态心电图监测记录来筛查心房颤动和其他心律失常的症状。
近日,乐普医疗自主研发的“AI-ECG Platform心电图人工智能自动分析和诊断系统”也被FDA受理。
心脏病、肺病、肝病
Arterys的Cardio DL是FDA批准的第一个基于深度学习的人工智能诊断决策支持系统,早在2017年1月5日就通过了FDA的审核。
这一平台基于卷积神经网络算法对至少1000个案例的核磁共振图像进行学习,并总结出了1千万条相关联的模式,希望可以更好地识别心脏病变。
Cardio DL识别每个案例并做出诊断的时间仅需15秒,大大低于专业医生所需的30分钟到1小时的时间。
与此同时,Cardio DL在安全机制上的进步也减小了对病人隐私泄露风险的担心——病患的相关影像在上传至Cardio DL的云平台时只是单纯的图像信息,不包含任何用户信息,只有具有授权的医生才有权限将云平台上的影像和病人的个人信息合成重建输出。
借助Cardio DL在心脏病上取得的经验,Arterys还推出了针对肺病和肝病的AI产品,并都已通过了FDA认证。
但是据行业人士介绍,Arterys公司获得认证的产品并不是能够给出诊断结果的AI产品。认证的是一个工作站,增加技师的工作效率。
儿童自闭症
2018年2月21日,FDA宣布了Cognoa的同名APP获得认证,这也是第一款针对儿童自闭症的AI诊断决策支持系统。读者可能知道,表型是人类等生物体上可观察到的生理或生化特征。
对于幼儿,为了更好地了解其发育是否正常,通常需要数小时的行为检查,而这些检查必须由有资质、受过训练、能通过与父母或孩子面谈来分析发育情况的医师进行。
这种检查很难预约,小孩平均要到4.1岁才能得到这类医师的检查。遗憾的是,此时小孩已经错过了干预手段会发挥最大效果的大脑可塑性窗口期。
根据新英格兰儿童中心(The New England Center for Children)对自闭症幼儿的研究,每周20至30小时的一对一治疗对不同年龄儿童的效果差别巨大,2岁是一个分水岭。
90%的2岁及以下幼儿在学习中取得了社交和沟通技巧上的“明显进步”,而对于那些在2.5岁或更大年龄才开始治疗的儿童,只有30%取得了“明显进步”。Cognoa的应用看似简单,但背后其实是具有自我学习能力的人工智能平台。
通过对包括美国国家卫生研究院资助的“国家自闭症研究数据库”在内的权威自闭症资料库的学习和分析。
Cognoa应用总结出了与自闭症关联的行为规则,它会询问父母15个问题,包含了能表明孩子是否有可能患上自闭症的最少可行数量的行为。
目前,Cognoa确诊出的患有自闭症的儿童最小年龄仅有18个月。这就为潜在的儿童自闭症患者争取到了更多的治疗机会。
糖尿病视网膜病变
美国IDx公司近日宣布,FDA已加快对其AI诊断决策支持产品IDx-DR的审查进程,预计很快就将通过认证。这个AI系统致力于预测糖尿病视网膜病变,这是导致糖尿病患者失明的主要原因。
它试图在没有眼科专家的辅助下进行工作,对于患者而言可能会产生重大影响。
目前,患者经常需要等待数周或数月才能看到眼科专家,并且可能因为无法及时诊断而导致失明。如果通过FDA的批准,IDx-DR有望成为第一个用于医疗保健第一线的AI诊断系统。
IDx拥有与OCT相关的多项专利,包括通过OCT自动评估青光眼视力丧失方法的专利,而青光眼是全球第二大致盲眼病,影响超过300万美国人。
此外,IDx公司还开发了用于检测黄斑病变、阿尔茨海默病、心血管疾病和中风风险的算法。
肺癌、乳腺癌、直肠癌、结肠癌、胃癌和宫颈癌
在癌症领域顶尖的美国纪念斯隆·凯特琳肿瘤中心(MSKCC)和AI领域顶尖的IBM相结合,便诞生了沃森肿瘤解决方案——这个由IBM研发的AI经过纪念斯隆·凯特琳肿瘤中心的专家历时4年半训练而成。
它汲取了3469本医学专著、248000篇论文、69种治疗方案、61540次实验数据和106000份临床报告,同时还吸收了美国国立综合癌症网络发布的临床指南,可以为包括胃癌、肺癌、直肠癌、结肠癌、乳腺癌和宫颈癌等主要癌症提供决策支持。
它在临床试验中筛选乳腺癌和肺癌平均时间是24分钟,这个速度比医生平均速度的110分钟要快78%。
通过从病人的病历中提取关键信息,它可以给出多套治疗方案,从中选出最佳诊断建议提供给医生,并有详细的依据和说明。
根据在印度进行的一项研究,在治疗肺癌时,沃森肿瘤解决方案给出的治疗建议96%的情况下与医生的方案相吻合;治疗直肠癌和结肠癌时,与医生建议的吻合率也分别高达93%和81%。
肺炎
深度学习著名学者吴恩达和他在斯坦福大学的团队提出了一种名为CheXNet的新技术。这个121层的卷积神经网络算法被称为CheXNet,在目前最大的开放式胸透照片数据集“ChestX-ray14”上进行训练。
ChestX-ray14数据集包含14种疾病的10万张前视图X-ray图像。通过与4名分别具有4年、7年、25年和28年从业经验的放射科医师进行对比,在检测肿块、结节、肺炎、气胸和肺气肿时,CheXNet 的表现超越了此前业内最佳水平至少 5%。
阿尔茨海默病
2017年6月,哈佛大学、马萨诸塞州总医院和华中科技大学的合作者设计了一个将fMRI脑部扫描与临床数据相结合的程序来进行阿尔茨海默病的预测。
团队建立了一个深度学习计划,尝试将fMRI脑部扫描和深度学习结合。与任何fMRI扫描一样,它们揭示了大脑中电信号闪烁的位置以及这些区域如何相互关联。
团队以来自MCI患者的数据和阿尔茨海默氏病神经成像的101例正常患者开始。基于对参与者大脑内90个区域的130次功能性磁共振成像测量的时间序列,研究人员可以分辨出信号在一段时间内闪烁的位置。
通过深度学习,AI可以解释这些模式的强度,并结合有关年龄,性别和遗传风险因素的临床数据,预测一个人是否会发展为阿尔茨海默病。研究小组表示准确率可以达到90%。
雅森与北京宣武医院、北大人民医院、协和医院合作研发的脑功能多模态人工智能产品问世。通过对核磁、PET、SPECT、脑电等数据额分析,此系统可以应用于阿尔兹海默症、癫痫、帕金森、噬血症等各类脑功能疾病的量化分析、诊断和预测领域。
截止2017年10月,此系统已经在全国超过30家大型三甲医院落地部署,累计完成病例分析超过7000余例,在各类病种上平均准确率超过84%。
此系统也是国内第一个针对具体病种提供多模态分析的人工智能系统,在辅助临床医生诊疗这一方向上迈进了一大步。
先天性白内障
中山大学与西安电子科技大学的研究小组合作,开发了一种能诊断先天性白内障的AI程序CC-Cruiser,利用深度学习算法,预测疾病的严重程度,并提出治疗决策建议。
在计算机模拟中,AI能够区分病人和健康的个体,准确率达98.87%。在三个关键指标(晶状体混浊面积、密度和位置)上,准确度都超过了93%。
不仅如此,系统提供的治疗建议的准确率,也达到了97.56%。临床试验中,CC-Cruiser使用了中国三家合作医院的57张儿童眼睛图像。识别精度达到98.25%;在所有三个严重因素中超过92%;治疗建议的准确性为92.86%。
皮肤癌
斯坦福大学在GoogleNet Inception v3的架构上建立了深度学习算法,这是一种卷积神经网络算法。
斯坦福大学的研究人员随后对该算法进行了微调,收集了2000例不同皮肤癌病例的12.9万张图像,这是用于皮肤癌症分类的最大数据集。
在这项研究中,该算法对21名有执照的皮肤科医生进行了面对面的调查。医生们检查了数百张皮肤病变的图像,确定他们是否会对其进行进一步的测试,或者向患者保证它是良性的。
该算法回顾了相同的图像并给出了诊断结果。AI的表现与专家一致。例如,该程序能够区分角质细胞癌——最常见的人类皮肤癌症——以及称为脂溢性角化病的良性皮肤增生。
不难看出,目前的AI赋能诊断决策支持多集中在医疗影像领域。由于越来越多的诊断依赖揭示人体内部病变的医疗影像,这一领域的发展也最为迅猛。
根据统计,美国医疗影像数据的年增长率为63%,而放射科医生数量年增长率仅为2%;国内医疗影像数据和放射科医师的增长数据分别为30%和4.1%。
一方面,放射科医生在医院的地位并不高。另一方面,影像需求与医生数量的错位,导致医生负荷过重,影响诊断效果。如果能借助AI解读影像辅助诊断提升效率,可以有效弥补其中的缺口。
与此同时,基于深度学习的计算机视觉识别天然适合处理影像问题,硬件和算法的发展在近来也有巨大进步,大部分AI诊断决策支持系统集中于此也就不难理解。
不过,AI目前更适合解决具有明确定义的任务。因此,就目前而言,AI诊断决策支持系统在具有“硬”数据的医学领域(例如病理图像)比具有“软”数据的领域(诸如来自电子病历的一般诊断)发展要成熟得多。
自从2017年FDA组建成立AI与数字医疗审评部以来,AI医疗产品得到了FDA的大力支持。
进入2018年后短短3个月时间就连续有多款AI诊断决策支持系统先后获批,这在FDA历史上是前所未有的景象,未来医疗AI化的趋势已经非常明显。不仅包括当前十分火热的图像识别,也包含了影像组学等将影像信息结合临床信息进行整体计算的方法。
除了美国,中国监管部门也在积极研究医学人工智能产品的审批机制。2017年9月4日,CFDA发布新版《医疗器械分类目录》,新增了与人工智能辅助诊断的对应的类别。
按照最新的分类规定,若诊断软件通过算法,提供诊断建议,仅有辅助诊断功能,不直接给出诊断结论,则申报二类医疗器械,如果对病变部位进行自动识别,并提供明确诊断提示,则按照第三类医疗器械管理。
另外,中检院也在制定审批细则,目前眼底图像标定专家团队已经建立,肺结节的审批标准也在制定。
AI将给未来医疗技术带来深刻的变化,是未来医学创新和改革的强大动力。