“5秒内完成数百张影像的初步诊断”、“将电脑端语音转换医疗文字的极速输入”、“AI算法将原来数小时的疑似病例基因分析缩短至半小时,精准检测出病毒的变异情况”等等。这半年多以来,我们似乎也熟悉了这样的字眼。
然而,在前几日的一次大会上,“网红医生”张文宏表示,“在整个疫情防控中,全部是靠人工,也就是靠传统智慧和城市管理实现的”。
一语道破真相,尽管现在人工智能已经应用于多个场景,技术还算成熟,但是人工智能在医疗等领域的建设还在起点。AI产品无论是从科学到临床,还是从申报到审批,每一个关口都是挑战。
近日,在《AI在医疗应用场景落地的机遇与挑战》线上闭门会上,浙江大学健康医疗大数据国家研究院副院长、浙大睿医人工智能研究中心主任吴健博士,浙江大学医学院附属第二医院神经外科主任张建民博士,致众科技股份有限公司副总经理史国齐做了分享。
科研和临床之间有很大的差距。首先,二者的诉求不一样,一个是发文章,一个是做真实的产品。科研可能针对某个具体的问题,选个例子,只要有一个看似不错的结果就可以发表文章了。临床当中则要求在每一个场景下面的应用都能够达到一样好的水平,这是科研和临床最大的一个区别。
第二,科研最主要做的事情是挑一个比较困难的问题,尤其是别人没有做过的新的问题都可以研究。但是在临床里边,需要是几乎95%遇得到的场景,你都要能够做得非常好。比如,科研基本上大家做单病种,作为一个病种的某一个片段,病灶的识别、分割,预后的预测等等。在临床可能需要做的是全病种,而且做的水平都还可以,才能得到医生的认可和接受。
第三,数据上,科研里面的数据往往会很小,医生写文章几十例就可以了,人工智能产品大概需要10万例,就已经很好了。但是在临床,这样的数量很有可能是不够的。比如我们自己做糖尿病视网膜病变拿了15万的数据,15万的标注好的数据去做训练,做完以后在临床实验当中还会遇到问题。所以在科研的时候可以找一家公司帮忙把标准制定完,模型训练好,出一个结果就可以写文章了。但是在临床上还得统一不同派系的医生,大家学的东西不一样,掌握的指南也不一样。
第四, 科研当中往往不考虑一些突发状况,临床上会考虑一些意外。比方说把模型放在设备上面去做,因为拍摄人的不同,很有可能得到的数据是不一样的,比如在显微镜上看一个病理细胞,动一下桌子,聚焦的层面不一样了,最后结果可能就不一样。但是科研上,一旦采用了一些数据做出一个结果,它几乎是不变的,但是在临床使用中就要考虑这个问题。
还有一些细碎的不可避免的一些问题,科研可能完全不需要考虑易用性、可用性,但临床当中这些问题都要考虑。所以一个人工智能的产品,从科研最后走到临床,还有很多问题需要考虑。
从临床的角度看人工智能,其中一个很大的问题是数据。只有掌握了数据,掌握了深度学习,才能更好地应用于临床。就国内来讲,许多大数据的真实性和完整性是非常让人质疑的。举个例子来讲,病人的电子病历记载了一个病人在住院期间所有诊治过程、检查结果及处理等信息。但是这些记录大多是靠人工记载和录入的,主要是为了应对检查,而检查主要看项目齐不齐全,有无漏项缺项,流于表面形式,况且每天要记录和书写的内容很多,临床医师又要看病、手术,又要做一大堆文秘工作,其数据的真实性和完整性质量可想而知。许多病历可能就是一堆废纸,假如把这些数据拿去作为人工智能的大数据去分析,去深度学习,然后来指导临床诊疗,这是要走偏的,甚至会误导。
人工智能在神经外科临床应用中有很多需求,简单举几个例子:
第一,通过人脸机器识别来筛查早期垂体生长激素瘤。因为人脸是有特征性的,比如说嘴唇、鼻子,额头等大小及比例,列上相关几个关键要素,通过AI人脸设别,通过和临床上经过专家检查、化验及磁共振检查加以证实的病人去比较,两者之间确实有相当大的一个吻合度。
结果还是不错的。可以用来做筛查。
第二,胶质瘤,它的不同的部位,不同的形态,不同的磁共振等检查信息与病人的病理诊断是否有关联也在研究中,特别对于比较少见,不典型的病例,如果我们有足够多的病例加以总结,特征提取,加上AI的自学习能力,会有助于提高我们的诊断水平,从而指导我们的治疗方案。我们目前还在搜集更多的基于病理诊断的数据。
第三,脑梗病人的血栓特性的识别用于指导治疗。同样一个脑梗,血栓的类型性质不一样,治疗的方法不一样,最后得到的效果也是不一样的。希望通过大数据来分析,从而用人工智能来诊断评估,选择合适的治疗时机和方法。
第四,帕金森氏病的治疗。许多帕金森氏病病人经过药物治疗无效或效果不好的话,根据评估,可以通过脑深部电刺激植入电极去刺激(DBS)),得到比较好的治疗效果。但传统DBS的刺激是根据调节好的参数持续不变的给予刺激,而不是根据需要可以随时个性化调节的。目前有研究用人工智能,也属于脑机接口技术,通过病人不同状态的需要,采集到信号,再加以自动反馈刺激,也就是“按需刺激”,这就是人工智能开发的二代DBS设备。此外,也包括人工智能治疗癫痫。
所以在神经外科许多方面都很有前景。相信随着数据的积累,包括这些人工智能研究方面的进步,这些都会运用到临床,相信不是一个遥远的梦想。
从整个法规层面来看,我们的监管部门非常重视。AI在医疗方面的应用,其实在促进我们产品的注册,但是实际上在这个过程中间还是会有很多实际的问题。
第一,医疗器械质量管理体系方面的意识是比较欠缺的。AI审评要点中对数据质量控制的要求非常高,所以说AI医疗器械企业的质量管理体系的合规性非常重要,但是做AI医疗器械产品的企业,往往做开发和测试的人员居多,他们可能并没有医疗器械行业质量体系方面一些意识。可能产品做好了,去做注册的时候才发现前期该做的规范性工作没有做。
第二,在审批要点里面,也对数据质量控制有很明确的要求,涉及到数据采集、脱敏清洗标注、数据集构建等一系列的工作,每个环节都涉及到对数据质量的控制,怎么样保证从医院采集的数据的合规性及可追溯性,都应该有相应的管理规范。目前可能很多企业在获取数据的时候,并没有去按照这样严格的规范来做。 另外,数据的泛化能力,如果说在做训练的时候数据只是来自于一家医院,可能泛化能力会比较差,在后期注册的时候也会存在一些问题。
第三,在整个注册的过程中,临床试验的成本费用、周期都是最大的。要在临床上去证明AI产品的有效性,那临床实验首先需要有代表性,通常情况下至少需要4~5家医院,并且要在多家不同区域的医院去开展。另外做临床的时候,可能还要根据产品的安全性级别来决定是采用前瞻性的临床试验,还是回顾性的临床试验。
第四,因为通常AI的产品基本上都是三类的产品需要在国家药监局注册。在做注册的过程中,除了检验报告、临床试验的资料之外,还有很多其他资料,包括综述资料、研究资料、软件文档、网络安全文档、风险管理资料等等。这些文件又涉及到很多不同的知识点,对于AI生产企业来说也是一个比较大的挑战,需要有专门熟悉法规和质量,同时又了解AI产品相关知识的人才,相结合起来,去完成注册材料的准备工作。
整个产品注册是一个系统工程,需要整体规划,保持各个阶段间的有效衔接和一致性,才能保证产品最终能够顺利拿到注册证,顺利上市。