撰文丨黄兆琦
编辑丨常亮
如今,名片全能王、扫描全能王、启信宝已经是不少商务人士必备的手机APP,其实它们都诞生于同一家公司——合合信息。当传统的手写或打字录入信息被“扫一扫”替代,我们的数据采集和处理方式就发生了根本性变革,人工智能开始在文字识别上替代人力。
中国的文字识别技术(OCR)起步较晚,到20世纪80年代才有实质性的进展,落后于西方国家和日本约十年。然而,目前合合信息的产品已经拥有了来自全球的10亿用户,其合作企业遍布海内外地区,在世界OCR技术领域居于领先地位。
此外,合合信息充分发挥在大数据采集和分析方面的优势,在新冠疫情防控期间快速上线了基于启信宝的“全国疫情防控物资企业查询平台”,助力缓解医疗资源供需紧张的局面,实现物资高效对接。
陈青山先生是合合信息联合创始人,同时也是启信宝的CEO。此次亿欧科创专程访谈陈先生,试图探究:合合信息为何能在文字识别技术上做到世界领先?在现代企业数字化转型的过程中,合合信息将扮演什么样的角色?
名片、票据、身份证、银行卡、账单……这些文字凭证在我们日常生活和工作中随处可见,然而,在数据量爆炸的时代,收集和整理此类碎片化信息毫无疑问是极其困难的,大量劳动力消耗的背后,还隐藏着数据出错的风险。
近年来,全球数据产生量迅猛增长。预计到2020年,全球数据产生量将达到51ZB,同比增长23%。在2018-2020年期间内,大数据市场整体的收入规模将保持每年约70亿美元的增长,预计2020年将达到560亿美元。数据信息的高速增长为人工处理信息带来了困难,也导致劳动力成本不断上升。
由此可见,以机器智慧替代人力,完成对海量数据的结构化处理是大势所趋。
文字识别技术在工作场景中的降本增效作用是显著的。“原来录一张名片要花上几分钟,现在几秒钟就可以,这是个数量级的变化,能带来10倍的好处才能吸引客户。”陈青山先生如此说道。
事实上,合合信息的产品和技术的确能带来“十倍级”的效率提升。据估算,通过AI文字识别技术代替人工录入信息,如果一年工作250天来算,大概能节省45万人每年的工作量。在数据的精准度上,AI技术也毫不逊色。利用文字识别录入信息准确率可以达到99%,远高于人工录入90%的准确率。
合合信息在AI文字识别技术上的优势成功帮助用户降本增效,其在C端市场推出了名片全能王、扫描全能王、启信宝等APP,全球用户数已达10亿。OCR市场从来不乏参与者,合合信息为何能占领市场先机?
“对于我们来说,技术产品加上时机是关键,但是时机也不是我们主动判断的事情,它也跟我们的积累有关系。”陈青山认为,合合信息能够在C端市场取得成功的关键因素在于技术和时机。
合合信息的创始团队都是技术出身,以手写识别输入法起家,在安卓、IOS出来之前,就已经开始积累手机APP产品开发经验,从而建立起技术先发优势。在合合信息的人才架构中,76%是研发人员,96%是本科及以上学历,37%是硕士,还有一个博士团队:负责未来3-5年科技的发展趋势,确保在技术上的领先性和前瞻性。
在2010-2014年移动互联网兴起之时,合合信息由于早期技术积累深厚,在对产品的理解上更注重手机APP的客户体验,从而在一些竞品中脱颖而出,建立起良好的产品口碑;2014年以后,国家开放企业工商信息查询,合合信息顺势推出启信宝,其业务由“名片信息数字化”向“企业信息数字化”拓展。
除了定位于C端市场的名片全能王、扫描全能王、启信宝这几个知名APP以外,合合信息在B端也拥有了招商银行、浦发银行、海通证券、申万宏源证券等重要客户。那么,它如何实现由C端向B端市场的扩张?
“对于C端和B端的结合点,我们有底层技术和用户上的协同性。”陈青山先生对此给出了答案。
在技术上,合合信息的C端与B端产品依托的数据采集和结构化的底层技术具有复用性,边际成本较低。同时,二者的客户也具有相似性,名片全能王的用户以商务人士为主,其所在企业组织很可能就是合合信息的潜在B端客户。技术和用户层面的协同作用有利于合合信息将服务向各企业组织拓展。
合合信息的B端客户以银行、券商和保险公司为主,其选择以金融行业作为进军B端市场的突破点,是因为金融行业本身数据量大,并且整体在数字化能力、意识和进程上都比较领先,能够更好地与合合信息的产品和服务相匹配。
合合信息的启信宝涵盖国内2.1亿家企业和组织机构名录,700多亿条实时更新的商业数据。在启信宝的基础上,合合信息打造出商业大数据平台,能够完成金融领域中的智能风控、智能拓展客户、智能合规审查等业务场景。
陈青山向我们阐释了合合信息在招商银行的项目案例:“招行大约有15000位一线信贷经理都在使用我们打造的风险防控大数据体系。并且,针对像招商银行这样数字化程度较高的金融机构,我们还可以提供基础平台服务,如机器学习和大数据治理,对它们直接进行AI技术赋能。”
合合信息的大数据平台在招商银行项目上的成功应用为其进一步拓展客户资源打下了坚实基础。在随后的郑州银行项目中,合合信息完成了交付模块、对接技术以及SaaS产品的标准化。
陈青山对其B端产品标准化的过程解释道:“各个项目模式有它的共性所在,我们将这些业务场景以及具体功能和痛点沉淀到标准化的SaaS产品里面去,从而能够复制到其他机构中。”
根据企业规模、业务需求的不同,合合信息可以提供由5-7万到数百万的不同配置的产品服务。陈青山先生表示,在券商行业中,70%的远程开户系统的身份证识别验证系统都是由合合信息提供的。
此外,合合信息将SaaS产品“化整为零”,提供半定制化的服务,将其功能嵌入到企业原有的系统中去。这样一来,企业的实施成本大大降低,员工可以不需要适应新的操作系统就能实现工作效率提升。
陈青山认为这种“化整为零”是模式带来的好处是多方面的:“首先实施周期短,实施成本也低;第二,避免另外上一套系统,节省了内部员工学习的时间;第三,我们的产品嵌入企业系统里之后,它的功能在需要的时候才出来,不需要的时候就不存在,比较灵活。”
在金融行业积累了一定经验后,合合信息能够完成更复杂、更多种类的商业数据处理工作,其B端客户也在向房地产、制造业等领域扩散。针对一些数字化基础比较差的企业,合合信息还能够首先帮助它们进行数据清洗和结构化处理,为下一步业务场景智能化升级做好准备。
合合信息基于技术和用户上的协同效应,以金融行业为切入点,实现产品市场由C端向B端延伸,并通过“化整为零”的方式实现了标准化产品推广。在助力企业数字化转型方面,合合信息可谓是成效显著。
商业数据的采集和处理在全球都拥有很大需求,合合信息早在2010年就受到了美国媒体和部分跨国公司关注,比如《华尔街日报》、三星、微软、黑莓公司。它在国际化布局上做了怎样的努力?
在谈及国际竞争格局时,陈青山先生对合合信息在东亚市场的竞争力信心十足:“东亚文字一定是我们最厉害。”在中文、日文、韩文的识别上,合合信息都处于全球领先地位。
除了在中国市场拥有亿级用户数量以外,合合信息在日本和韩国市场也大显身手。
陈青山表示:“海外B端客户的要求会更高,我们当初拿下三星这个客户的时候,三星是对横的、竖的、有阴影的、倾斜的等各种识别难度较高的2000张名片进行识别准确率统计,这样严格的测试更能体现硬碰硬的技术实力。”
在日本,合合信息推出企业版名片全能王,能够帮助企业集中处理各个分散的名片信息,以适应其精细化管理模式。而在韩国市场,合合信息打败了俄罗斯竞争对手ABBY,成为了三星手机全线识别类模块的技术提供商,并持续至今。
在英语和西欧文字上,由于合合信息的识别技术具有很好的复用性,其产品在欧美地区推广起来并不困难。并且,对于从右往左阅读的阿拉伯文,合合信息也能克服技术难关,在提高产品的国际化水平上做了充分准备。
目前,合合信息的产品在海内外市场齐头并进。名片全能王、扫描全能王面向全球发布,在Google、Apple应用商店上架,全球用户数已超过10亿。
在国内市场,华为、小米手机中的识别功能均由合合信息提供,并且名片全能王、扫描全能王在多个品牌手机中成为预装应用;在海外金融B端市场,合合信息的重要客户有PayPal、瑞士的Swiss RE、印度的ICC Bank等,市场认可度较高。
总结来看,合合信息在C端市场推出名片全能王、扫描全能王、启信宝等APP,打响了品牌口碑和知名度;在B端市场帮助企业降本增效,向数字化、智能化转型。此外,合合信息以国际化视野面向全球用户,成功让中国的文字识别技术走出国门。
通过“AI+大数据”为商业数据和现代企业赋能,这一直是合合信息所坚持的自身定位。未来,它将继续深耕人工智能与大数据技术,紧密追踪商业需求,打造出具备全景商业数据的智能世界。