您的位置:首页 >科技 >

达观数据陈运文:期待机器人能将人类从繁重的工作当中解脱出来

2019-12-10 15:04:04来源:亿欧

12月6-8日,为期三天的“2019世界创新者年会”在北京顺利举办。本次大会由中国企业联合会指导,由亿欧·EqualOcean、工业和信息化科技成果转化联盟联合主办,本次大会以“科创4.0:共建全球化新未来”为主题,集结了来自美国、英国、印度、新加坡、印尼、尼日利亚、巴西、日本、以色列等十余个国家或地区的6000名创新者,总结2019年世界科技与产业创新的成果,预测2020年最新创新趋势。

本次论坛邀请了华为诺亚方舟实验室计算视觉首席科学家田奇教授、氪信科技创始人兼CEO朱明杰博士、文安智能创始人陶海教授、魔珐科技创始人兼CEO柴金祥教授、MINIEYE创始人兼CEO刘国清博士、联想创投董事总经理王光熙、达观数据创始人兼CEO陈运文博士、踏歌智行创始人兼首席科学家余贵珍教授、小鹏汽车首席科学家郭彦东博士,共同探讨和分享作为科学家创业者在创业路上的收获与感悟,探索科学技术与商业化的结合机会,助推产学研领域协同发展。

达观数据创始人兼CEO陈运文做了《从RPA到RPA+AI,技术质变引发需求量变》主题演讲

主题演讲,演讲的核心观点有:

1 我们希望能够把白领们从繁重的工作当中解脱出来,把重复性的工作都能够自动化地去做。

2 整个的技术产业的发展,也是从前沿的学术、到工业落地,再回过头来吸收学术界的很多先进成果,这是一个相互转化的过程。

3 在未来,我们相信智能化的机器人技术和人工智能结合落地可以做越来越多有价值的工作。

主要内容经整理如下:

谢谢亿欧提供这么好的机会,作为达观数据的创始人,给大家分享达观数据主要做的工作,以及作为一个科学企业家的创业历程。

陈运文

我自己是做计算机技术的,从复旦大学毕业以后,我第一份工作是在百度,也非常感谢百度让我积累了非常好的工程经验。我自己的体会是,作为一个计算机博士,在学校里做的更多还是理论性的工作,但真正要能够把技术落到实地还是要做很多工程化的工作。所以前面朱博士演讲的内容我很有感触,就是在整个人工智能具体应用场景里面,机器学习的算法所占比例并不高,要有更强大的工程能力才行,把具体的应用扎扎实实做起来。

在这个过程当中,对我自己有很大触动的点是:我参加很多次国际的算法比赛,有一些比赛还是蛮有收获。因为很多比赛需要团队作战,而团队要想拿到全球最顶尖的成绩,单靠一个人单打独斗是不行的,需要很多志同道合的兄弟一起拼搏和努力。在几个月的时间里,不断的优化算法,才能达到非常好的效果,这其实就是团队的管理组织调动,把大家的聪明才智共同发挥出来的过程。所以我觉得参加一些比赛对我自己,在创业早期的时候,是非常有帮助的,至少能够让我们知道怎么样把一个团队调动起来打胜战。

我们达观做的事情就是去教会计算机怎么样做文字的自动化处理工作,在学术界我们称之为自然语言处理。这个里面一般分为两部分,一部分叫自动阅读,一部分叫自动写作。顾名思义就是我们要教会软件机器人像人一样去阅读文字资料,或写作文字资料。这个看上去好像不是很难,但其实自然语言处理技术是人工智能里面最难的一项技术之一。因为文字特别的抽象,短短几个字可能蕴含着非常深刻的意思。而让计算机去理解这些意思,是一件特别特别难的事情。所以直到今天,自然语言处理仍然还有很多很多的难题没有解决。但我们一直在思考,今天已经相对成熟的技术可以运用在哪一些应用场景上面。我们做了很多的工作,也想了很多的办法。

达观数据成立于2015年,我们当时在上海浦东的张江,人家说北有中关村南有张江,所以张江这地方有很多像我一样的工程师,我们做的工作就是每天写代码。我们就在张江的一个孵化器开始我们的创业,花挺多心血开发我们的系统,也积累很多文字资料来积累我们的模型,所以挺不容易。现在回想起来早期也是在不断的摸索方向、不断的找问题。我们发现文字资料处理是一件特别有意思的事情,在这方向上面我们做了非常多的工作。

我觉得在中国机会还是非常多的,关键在于你要认准一条路,扎扎实实的走下去,中间不要动摇,我认为这一点特别重要。我们在这过程中做的工作就是让计算机能够进行文字的处理工作。其实这里面很多技术都是在学术界已经研究了很多年的技术,比如中文分词、命名实体识别、句法分析、语义分布模型等,每一个都有很多相关的学术论文和研究成果,这些研究成果我们也吸收了很多产业界的需求和学术界的经验,把它们综合在一起做了很多基础性的研发工作。

但我们发现,中文的处理真的很难。我们一般要从字词级做分析,再到句子级做分析,最后到整个文章篇章级做分析,才能教会计算机去真正理解一个词语、一篇文章的具体意思。这过程中其实有很多很多的难点,一般来说字词级的处理计算机来做很容易,但越到篇章级,更宏观方面的理解和分析让计算机来做就更难。所以今天我们是把一些实实在在能的工作,让计算机去做,所以大家看一下我们今天做的IDPS文本智能化处理平台,我们做日常文档的处理工作,让计算机能够像人一样对文档资料进行阅读、审批、抽取、比对等等这一些动作,这些动作是非常有意义的一件事情,我们也把这些技术和我们讲的RPA技术结合在一起来做相关的工作。我们这一部分涉及到OCR就是光学识别技术,也是学术界研究了很多年的技术,我们把它真正产业化,把它落地到我们的具体应用当中去,用来处理我们日常的各种照。

在我们的具体场景中可以看到各行各业中大量的文档处理工作都是靠人来做,非常的费时费力。我们想开发出的计算机软件,或者我们讲软件机器人,能够把白领们从繁重的工作当中解脱出来,把重复性的工作都能够自动化地去做。

我觉得这里面有今年有一个非常重要、非常热的一个新的技术,我们称为RPA技术,它叫机器人流程自动化。这个技术是存在已经十几年了,只不过说有了人工智能的技术加持之后,我们利用RPA技术是可以把原来大量白领日常的手工工作,让计算机自动化去处理。我们觉得传统的RPA技术相对还是比较简单的,它只是模拟我们的键盘和鼠标操作而已,它更像一个外挂。但是有了人工智能技术,尤其是文字资料处理以后,加上NLP就可以像白领一样去完成很多工作,所以这个技术也是国内外最近一两年特别热门的一个技术,软银的孙正义非常看好这个领域,在美国的很多企业都有非常巨大的发展。

我们看到这个技术在工业界有很好的应用,能够把大量的工作自动化。我给大家看一下像我们日常的处理工作,传统的RPA很难解决复杂逻辑,比如说你要做各种财务的核算、文档的审核等等这一些工作,我们现在让RPA结合NLP技术后,计算机可以自动去做。

整个的技术产业的发展,也是从前沿的学术、到工业落地,再回过头来吸收学术界的很多先进成果,这是一个相互转化的过程。我们现在这个阶段,差不多在发展中期的阶段,我们能把传统的简单工作能够自动化、并引入自然语言的处理。这些技术以后能把相对更复杂的日常工作自动化,我们相信会有越来越多需要我们人来做的工作是可以自动化去处理的,所以我们觉得在流程自动化当中我们用智能的RPA解决了流程办公化最后一公里的问题,因为它可以像人一样做文档的获取、写入、提交、上传、下载这一些动作,但是真正的大脑还是需要我们有非常先进的AI技术才能够完成的。

这边给大家看一下具体的例子,比如说我们的RPA系统去处理财务报表和发票的流程,机器人自动化要比人的效率要高很多。原来的人处理一份发票的验证和登陆工作要几分钟的时间,现在不到一秒钟就可以完成,所以它的效率提升非常巨大,这就是用计算机批量的自动化、智能化处理技术去完成相关的工作。

再给大家看一下这个动图,这是我们做的合同自动化审核。目前人工审核一份合同,要花很久的时间,但大家看到机器人有了人工智能技术以后再叠加上RPA,它就可以以非常快的速度不到一秒钟完成一个合同的审查工作。这是人工智能技术和RPA技术具体的工作场景。

从图上看,如果我们有六台电脑,每一台电脑装一个具备自然语言处理能力的机器人,这六台电脑可以像我们白领24小时工作,这给我们创造的价值是非常巨大的。这就是一个智能化的白领、数字化的白领,它代替人在工作。

现在我给大家具体介绍一些应用的场景。

比如我们让机器人像我们的银行员工一样,自动进行国际外汇结算等操作,右图是我们机器人的后台脚本正在运行,左图是机器人正在完成相关的动作。机器人在自动地填写表单、自动地进行营业执照的处理、自动地填写报送材料。

我们机器人也可以自动抽取各种文档资料,登录到后台管理系统里面自动操作键盘和鼠标,不需要人去干预。我们的机器人也可以做对账,对账是非常繁琐的事情,现在的机器人可以自动登录到系统进行对账清算清缴的工作。

我们机器人也可以把复杂的水单、台账进行汇总处理,也可以自动写报告。比如银行的信贷报告,右图是机器人在自动写报告,换成人工写的话要写好几天。现在机器人不到一天就写完报告了,所以这对人来讲也是会大幅度减轻我们的日常工作负担。

我们可以审核合同,比如大量的日常质检、风控等。我们在政府做智能化的行政审批,原来靠大量的公务员完成行政审批的工作,现在可以让计算机自动完成行政审批,审批的速度比人快很多,而且它更加客观、更加公正。审批完成的材料也可以实时同步到各个委办部的系统里面。同时在制造业中,机器人可以派单;在财务工作中,机器人拖拽出财务的处理流程,自动化地去完成财务的核算工作;在繁琐的报税工作中,机器人可以自动化地完成税单的填写和报送的工作。这些都是我们日常工作当中很繁琐的,会涉及到大量文档资料阅读、填写、报送的动作,我们现在都可以让机器人自动完成,甚至还可以你收发邮件,打开邮件读取信息、核对等。

在未来,我们相信智能化的机器人技术和人工智能结合落地可以做越来越多有价值的工作,包括企业各行各业的应用、未来的智慧政务,我们相信这些技术都能够发挥越来越多的作用。

我们达观也作为中国人工智能界,尤其是文本智能化处理领域的领军企业,也期望在这领域产出越来越多的价值。我们也感谢来自方方面面的企业给我们达观各种各样的帮助,让我们能够一路成长到今天。

我们也期待未来在我们的技术引领下,能够有越来越多机械性、重复性的工作可以让机器人代替人去完成,能够把我们人类从重复性的枯燥工作当中解脱出来。我们也期待达观能够成为这个领域的领军企业。

好,谢谢大家。