自如回应“租客喝了7个月中水”:已修复,将沟通补偿方案 台风“海神”逐步北上 后期或将影响东北 快手8.0版本上线!品牌与产品全面升级 支持1080P视频上传和播放 200余名防疫人员为服贸会做现场保障 参会人员配发中药预防饮 【地评线】京彩好评:更新技术出口目录是应时应势之举 2020年服贸会9月4日开幕:参展企业数量超往年 个人可提前两天预约参观 最新数据持续向好引海外点赞中国经济复苏 全国消费扶贫月:农产品流通过程中的税收优惠政策了解一下 徐州三十一中女教师殴打辱骂多名学生 已被停职 塑料书皮真“有毒”吗?哪种最安全?听专家怎么说 正当防卫认定新规来了,5张图带你看明白! 阿达来提·艾再孜:民法典将护佑“全面小康”行稳致远 【桂声漫画】防疫学业两手抓——大学,我来了! 我国成为3月份以来全球主要服务贸易国中唯一出口增长国家 中央财政对受灾困难群体予以倾斜和优先保障 防汛救灾工作有力有序 王毅:维护南海稳定,携手化解挑战 【地评线】京彩好评:更新技术出口目录是应时应势之举 中国改革低保等现行社会救助制度 打造多层次分类救助体系 疫情之下“审判执行不停摆” 中国最高法要求确保完成全年审判执行任务 商务部:愿与日本深化防疫和经济社会发展合作 中方再驳蓬佩奥涉华无端指责:蓬佩奥之流的险恶用心早已被世人识破 2020年服贸会9月4日开幕 设置7类活动 东北抗联遗址“云展播” 感受传承历史培育家国情怀 木里矿区非法开采为镜鉴 青海层层出手宣示生态保护决心 昨天,今天!胜利,唯有胜利! 中国创新发展目标明确 在人工智能和先进制造业等方面有规划 世界旅游合作与发展大会将在京开幕 促旅游业再繁荣 美国国务院限制中国在美外交活动 外交部回应 商务部回应印度禁用中国118款APP:严重关切 坚决反对 北京开展有限空间专项执法检查 持续至9月11日 中央财政对受灾困难群体予以倾斜和优先保障 防汛救灾工作有力有序 云南省原副省长赵廷光逝世 享年89岁 应急管理部消防救援局前方指挥部完成各项任务正式撤离四川 男童泳池排便被索赔1.5万元 家长回应:不接受赔偿数额 商务部:调整发布《中国禁止出口限制出口技术目录》不针对具体企业 宇宙全尺度暗晕什么模样?8个“放大镜”接力模拟出清晰图像 250万贫困人口遭受洪涝灾害 官方紧急施措防范因灾返贫致贫 西银高铁陕西段联调联试正式启动 应急管理部自然灾害工程救援成都基地挂牌成立 跨境服务贸易负面清单何时推出?商务部:年底前将出台 内蒙古推荐50项国家重点研发计划项目获国家立项支持 “日军细菌战罪证”上线,让历史说话! 中方回应美方限制中国在美外交活动:于法无据、于理不合、于情不通 疫情阴霾渐散 外媒感受“中国式”热闹 实验室设计、人员培训……中国抗疫医疗专家组在几内亚分享这些经验 中科院科研人员在新型半导体激光器研发上取得进展 王毅将出席金砖国家外长视频会晤 三部门:防卫过当应兼具两个条件,缺一不可 5G手机首次击穿千元关口 上游芯片厂商芯片迭代速度加快 二战以来首次!CBO:美国政府债务明年将超过经济规模
您的位置:首页 >财经 >

人工智能在医疗数据荒野上“刀耕火种” | 海斌访谈

2020-07-20 13:12:09来源:第一财经

任何一家想要在医疗领域掘金的人工智能企业,必须要有身为拓荒者心理准备。在这个行业,当然有希望收获满满,但也得先干许多苦活。

“有许多数据科学家、机器学习方面的专业人员,在进行机器学习模型开发的时候,花了一半的时间来做数据准备的工作”,亚马逊AWS副总裁Swami Sivasubramanian接受第一财经记者采访时说,这些苦活、累活需要借助专门的平台型工具帮忙完成,比如给数据打注释、给数据做清洗等工作。

机器学习是人工智能的核心组成部分,而数据常被认为是人工智能的“燃料”,它是这项技术用于构建模型和改进算法的根基。

数据准备的工作通常包括数据清洗、数据格式统一化、数据合并等方面。非标准化的数据,意味着在数据准备阶段就要耗费大量的时间,延缓了人工智能技术部署速度和使用效率。

Swami所说的现象在人工智能落地的各个场景普遍存在,而非某个行业的个例。他的这一观点也得到了国内人工智能企业界的响应。

“他说的还是轻了,我觉得百分之七十或百分之八十的时间用于了(数据准备)这个事情。人工智能的技术已经可用,但大部分时间耗费在了数据上了”,第四范式的副总裁、主任科学家涂威威接受第一财经记者专访说,尽管这一问题普遍存在,但在一些特定行业里问题尤其突出,医疗领域就是如此。

从2018年开始,上海三甲医院瑞金医院与第四范式开始战略合作,使用人工智能技术筛查糖尿病,以期实现病人的尽早发现、尽早治疗。瑞金医院主导这一合作的是中国工程院院士、瑞金医院副院长宁光院士。

“宁光院士还是非常有远见的,他十年前就开始做医院数据的标准化。但无奈在之前那个阶段,信息化水平确实一般,我们合作项目里涉及到几十万病人的数据,相对(其他医院)来说已经是非常好的数据,但我们依然花了很多的精力来做数据的处理”

这些医疗数据已经实现无纸化,均是电子化的病例,但在这些数据基础上直接部署人工智能仍然困难。举例来说,不同医生对于同一疾病的症状描述差异,都可能意味着需要花时间重新甄别和筛选。

更深层次的原因在于,人工智能出现之前,既往医疗数据对于医生和医院来说价值并不大。

“原来医院搞的信息化质量堪忧,因为在人工智能技术出现之前,数据存下来对医院不能直接产生作用。医生坐诊、看病就够了,这些医疗数据对他们来说没有特别重要的意义”,涂威威表示。

“金融行业就不必花这么多时间(用于数据清理),因为金融领域的数据质地非常好“,第四范式的技术已经布署在金融、零售、互联网、医疗等不同行业,涂威威比较下来发现,”相比金融或互联网行业,医疗信息化还处于刀耕火种阶段。

医疗信息化需要在与数据使用方的合作磨合中逐步改进。目前瑞金医院的数据质量有了极大的提高。涂威威 认为,“慢慢的,数据的问题会越来越少。”

人工智能在数据可用性方面遭遇的问题,中外并无差异。

“数据准备其实是要进行机器学习模型开发的必备的阶段”,Swami对第一财经记者表示,不管哪个市场,数据底层的问题都是一样的,都要从数据的清洗到ETL(Extract-Transform-Load,数据从来源端经过抽取、转换、加载至目的端的过程),然后做好了数据的准备之后,才能够开始机器学习模型的建构。

经过数据筛查和清洗这个“苦活”、“累活”的阶段,人工智能就开始发挥比较大的作用了。据涂威威介绍,在一些慢病的筛查阶段,比如发现早期糖尿病,人工智能的准确率已经不亚于经验老道的医生,而人工智能无疑效率更高。

除了在医疗领域落地,人工智能在药物研发方面也有了进步。在这次疫情期间,机构开始使用机器学习来进行新冠病毒治疗方案的研发。

总部在深圳的晶泰科技,同时在北京、波士顿设有研发实验室。晶泰科技搭建了云端智能药物研发平台,在这个平台上,晶泰科技使用亚马逊的AWS GPU搭建机器学习框架,实现大规模的模型训练及参数优化。

在新冠疫情爆发后,晶泰科技对近3000个已通过美国药监局(FDA)审核的上市药物、以及超过1万种中药成分分子,进行了老药新用的扫描,找到了183个可能对新冠病毒有潜在治疗效果的药物。作为合作方,Swami介绍称:在这之后,晶泰科技对药物的活性进行了排序,然后通过更加高精度的计算方法,最终锁定了38个药物。

“在全球,人们正在使用人工智能应对人类所面临的一些重大的挑战。”Swami评价说。

亚马逊内部有一种广泛的认知,即人工智能还处于“Day One(第一天)”的阶段。“打个比方,就是我们刚醒过来,需要喝杯咖啡的阶段。即使在这么早期的阶段,机器学习领域就已经出现了非常多的创新了。