撰文|夏一哲
编辑|唐钰婷
易用性一直是政务网站痛点:众多政务网站“各自为政”,在新媒体平台一拥而上,缺乏统一协调和管理;为便民而设立的线上政务往往让用户“手足无措”。
除了易用性外,黑客还威胁着政务网站:攻击篡改网页,为赌博等非法页面引导流量,黑客常常把缺乏专业人员和技术的政府网站变作“摇钱树”。
技术相对滞后、资金投入有限的政务网站,亟需专业管家和安保“救场”。开普云(688228.SH)就是随着政务需求崛起的服务商之一。经过二十年的发展,开普云已经为1500余家党政机关客户提供服务。
开普云围绕政务需求“贴身短打”,新开辟的大数据平台业务逐渐成长为第一大业务。然而,政务客户数量和市场规模有限,新增客户数量不断减少,业绩增长前景已不乐观。将科创板募资悉数投入研发的开普云,将如何满足新政务需求,推动新一轮增长?
政务网站易用性提升一直饱受内部和外部双重因素的拖累。
各地、各级政府信息化和数字化工作进展程度不一,不同级别、不同系统内各部门机关虽然都有内部政务系统,但是分属不同服务商,数据互通在技术上很难实现,形成“各自为政”的状态。
从外部看,官方网站已经成为各级政府的标配。它们也积极拥抱微博、短视频等新媒体平台,但是渠道的内容和功能却无法协调配合,呈散兵游勇之状。
对内提升系统的易用性和效率,对外实现线上政务对线下服务的补充甚至替代,整合现有平台,消灭“信息孤岛”,已成必然趋势。在政务网站集约化需求的推动下,“职业管家”开普云得以施展拳脚。
对已有平台进行集约化改造,首要难题就是数据格式的统一。政府各部门原有的内部系统技术体系、数据标准、表单文档格式往往各不相同,形成“信息孤岛”和“数据烟囱”。
在线政务服务最为基础的文档处理和数据处理应用,往往就是相互割裂的应用系统。前者操作简单,通过电子印章等技术可以实现凭证留痕,却缺乏数据逻辑处理功能;后者尽管有完备的数据管理功能,却无法实现凭证留痕和归档。
针对这一痛点,开普云研发出基于智能文档的信息交换专利技术,打通文档应用和数据应用。利用基于XML版式的文档描述语言,开普云公司智能文档(IDF)分为表现层、逻辑层、安全层、数据层,对应实现纸面表单样式仿真、数据校验计算、授权加密和数据交换,整合了原本孤立的两大系统。
基于类似的整合思路,开普云研发出多源异构数据交汇技术,实现对原有政务内外网B/S架构应用系统的整合:这些应用系统原本接口众多,甚至因为时间久远,部分原开发厂商已经“失联”。该技术能够实现数据的快速采集并统一汇聚至新平台,打通了数据在异构平台之间的流转通道,从而大幅降低系统数据采集难度。
技术加持之下,开普云构建了互联网智慧门户和政务服务平台结合的产品矩阵,在政务市场无往不利。前者主要实现宣发功能,实现全媒体数字内容采集、编辑、储存、检索和发布等功能;后者则打通后台,实现部门内部的信息共享,为终端用户提供线上政务服务。
从2016年到2018年,开普云已经为1500余家党政机关客户提供服务,其中包括中共中央纪律检查委员会、最高人民检察院等党和国家机构,还有20%左右的省级政府、国务院组成部门和直属机构。北京市、海南省、四川省、湖南省、安徽省的省级政府网站集约化平台均出自开普云之手。
与此同时,开普云也在积极拓展互联网内容服务平台的客户群。虽然目前金融和媒体领域客户依然比较少,但是开普云已经承担中国石油、中国广核、神华集团等大型央企的智慧门户项目,实现对微软、甲骨文和IBM等国际巨头类似业务的国产替代。
凭借技术领先和业务成功,开普云逐渐成为行业代表。国家标准《XML在电子政务中的应用指南(GB/Z 19669-2005)》的制定、国务院办公厅《政府网站发展指引(国办发〔2017〕47号)》的课题研究,都出现了开普云的身影。
近两年,各种媒体呈现多功能一体化趋势,国内主流媒体开始利用互联网这一载体,将传统媒体资源进行整合,打造新型媒体。开普云因势而变,推出融媒体平台,为党政机关、媒体单位提供多渠道统一的全媒体服务。
2016-2019H1开普云主营业务构成
通过技术迭代和丰富产品线,互联网内容服务平台相关产品成为开普云营收的最大来源。从2016年到2018年,该业务营收占比一直在60%以上。
除“管家”外,政务网站还需要“安保支持”。
政务网站技术相对滞后、资金投入有限的弱点与身份权威、流量稳定的优势形成反差,犹如“稚子抱金行于闹市”,成为黑客眼中的“肉鸡”。
为了“巩固防线”,有关部门出台了以《网络安全等级保护条例》、《信息安全等级保护管理办法》为代表的法规、政策,具体案件也开始采取“一案双查”:既要追查黑客等利益团体的违法犯罪行为,也要追究相关部门在网络安全和网站管理上的失察。
2019年,某地直属机关工委的网站被黑客篡改,致使搜索网站自动跳转到赌博平台,成为赌博网站的“迎客松”。当地网安部门针对该部门未落实等级保护技术措施的失职行为,处以该门户网站停机整顿一个月的行政处罚。
防范攻击,首先需要异常监测。大数据技术中的爬虫,能够短时间内采集海量数据,让实时自动监测成为可能。开普云的大数据服务,目前主要满足监测需求。
开普云构建了异地多点多线路的分布式爬虫采集集群,能够对全国2万政府网站首页及400万网站栏目进行从5分钟到24小时不等的数据采集。采集的频率、深度可以根据客户需求进行调整,从而实现定制化服务。
大数据技术还可以提供内容核对的应用支持:政府网站内容多为人工编辑,错谬虽在所难免,但网站的权威性和公信力却系于正误之间。开普云大数据服务的实时计算集群可以对网页错别字、敏感词、隐私信息等项目实时监测,查找、反馈错误。
数据的采集和计算,又可以反哺机器学习,丰富开普云大数据服务的语料库。通过自然语言处理和深度学习,开普云大数据服务平台能够对采集到的网页内容增量学习,发现新词语或新搭配,完善平衡语料库。
经过在数据采集、计算和机器学习领域的长期积累,开普云大数据服务平台已经积累超过200亿条有效网页链接、收录30亿篇有效文章索引、存储近500TB数据规模,逐渐形成规模壁垒。
从数据采集、计算到存取,开普云大数据服务平台形成功能闭环,语料库的丰富度和准确度不断提升,已经能够实现对每天新增约5000万网页的错别字、敏感词、暗链、广告等项目进行监测,日读写次数过亿。
开普云还进一步推出云搜索服务,重点强调人名、地名、机构名、会议、政策等专有名词的检索,专门服务于政务搜索需求。
在大数据的支撑下,开普云相关业务实现较快增长,2019年上半年营收占比提升至41.52%,成为第一大营收来源。
不过,无论是互联网内容服务平台服务,还是大数据平台服务,开普云的主要客户均为政务机关或政务新媒体,较为单一。大数据服务虽然是开普云重点拓展的新赛道,新增客户数量却呈逐年下滑的趋势,收入增速也从2017年的75.74%降低至2018年的28.81%,拓展业务新应用领域已刻不容缓。
2016-2019H1开普云大数据服务业务新增客户数量
通过科创板上市募资,开普云将同时推动互联网内容服务平台和大数据服务平台的升级建设,此外也将投入7377万元户升级研发中心,希望弥补目前体量较小、竞争力较弱的短板。
中国信通院的数据显示,我国大数据市场规模将在2020年达到586亿元,市场规模增速将保持在30%以上,潜力无限。开普云的技术研发已有清晰规划,其大数据平台将由文字监测拓展至图片、音频和视频,同时将开辟政务智能问答、地方政府媒体影响力分析等新业务。
围绕政务需求“贴身短打”的开普云,已经彰显出“咬定青山不放松”继续深挖G端需求的决心。作为更贴心的管家、更具洞察力的千里眼,开普云将成为搭建数字中国的砖石,让数字政务惠及千家万户。
财富趋势加料新科技:人工智能赋能券商 通达信争夺股民
何必为国际标准“削足适履”?中国电研为国货出海正名