2019年8月28日,搜狗公司举行了以“全新「声」态,AI未来”为主题的搜狗听写服务开放暨AI创新联盟发布会。会上,搜狗将其核心技术能力 “搜狗听写”服务开放,并宣布与爱国者、Newmine纽曼、索尼录音笔、万城集团四家录音笔行业头部企业成立AI创新联盟。
从1930年磁带的的发明并且被用于记录声音开始,录音设备的发展经历了1970年的数字录音与存储变革,1990年随身数码形态变革,以及90年代末闪存技术出现后体积进一步缩减开始以“笔”的形态出现,每一代技术以及产品的进化都促成了录音设备形态以及性能上的极大提升。但是到了2000年以后,随着消费电子产品的出现,录音设备相关技术的发展仿佛却停滞了,甚至于开始出现被手机录音抢占市场的情况。
伴随着搜狗此次与四家录音笔行业头部企业共同成立AI创新联盟,这一举措或许能够为传统录音笔行业带来一些新的变化。
目前,搜狗输入法语音请求峰值已超7亿次,稳居全球最大的中文语音应用,依托于此,搜狗听写服务背后的转写技术已处于行业领先地位,其实时语音转写运用了搜狗自研的延迟可控的Adaptive Attention-based端到端建模技术,非实时语音转写功能使用业界领先的深层Transformer-based端到端语音识别技术,语音转写准确率可达95%以上;在语音增强方面,搜狗自研的Smart Voice麦克风阵列算法能够对噪声和混响进行多重深度优化,确保人声的高保真还原。在智能辅助编辑方面,搜狗语音转写可以通过云端智能纠错编辑技术,基于词图搜索和输入纠错模型,针对置信度低的转写结果提供多个候选词,帮助用户对转写结果进行纠正,同时还具备了良好的自动区分说话人、智能文本顺滑和标点预测等能力,可以为用户提供更多便捷功能。
凭借其强大的语音技术以及优秀的软硬件结合能力,搜狗今年3月份推出了AI录音笔C1,其转写准确率高达95%以上,并且拥有实时互译、云端分享、中英同传等多种AI功能,极短时间内就在多个电商平台取得了单品销量第一的成绩,可见搜狗语音转写技术已经得到了市场的检验和认可。此次发布会上,搜狗又推出升级版AI录音笔炫彩版,满足用户更多元化、更时尚的需求,同时将AI录音笔背后经过市场检验的“搜狗听写“服务体系开放出来,进而引领整个录音笔行业的AI化变革,这正是搜狗践行其AI战略的一次有效尝试。
值得一提的是,本次搜狗听写服务实现了与搜狗输入法的打通,这不仅为听写服务带来了流量和数据上的巨大优势,同时更是搜狗输入法“表达信息更简单”使命的延伸,也是搜狗听写服务相比其他语音转写平台的优势所在。
目前搜狗输入法在PC端占有99%的市场份额,在手机端用户日活超4.5亿,搜狗听写服务基于搜狗输入法的用户使用习惯,能够自动构建个性化识别网络,使用户常用语错误率下降40%。搜狗开放听写服务后,可以为市场上90%以上的录音笔产品提供接入服务,让所有有需求的用户享受“录音1小时,出稿5分钟”的极致体验。
作为一家以“让表达和获取信息更简单”为使命的企业,搜狗长期聚焦于如何在最短的时间内以更高效便捷的方式让用户准确获取有效信息。服务于这一宗旨的,搜狗对于未来的关注以及布局也主要围绕这一使命展开。
活动开始,搜狗CEO王小川在介绍搜狗公司AI战略的时候表示:“伴随着人工智能、5G等技术的发展,未来的表达将更加的简单,甚至于会出现由当下主流的文字、图片、语音结合的主流方式直接走向依靠视频传输的视觉类沟通,交流越来越简单将会成为常态。”
录音的本质还是在于对关键信息的备忘或者保存提取,而这自然涉及到一个信息梳理以及整理的过程。相比于语音文件,文字信息更加的能够让人快速的获取信息并且形成条理化的备忘框架,所以将录音内容整理成为文本信息就变得极为关键。但是由于技术的限制,目前行业内人工语音转文字的成本太高,所以通过人工智能技术实现语音转文字的方式反而成为了很好的代替选项。
目前,在智能语音技术领域,国内主要以科大讯飞、云知声、思必驰、搜狗等企业为代表。区别于前几家以AI技术为主的企业,搜狗的优势更在于其AI业务的发展是基于已有的搜索引擎、输入法等互联网业务迁移完成的,通过输入法使得其拥有更多的用户基数以及算法训练样本。
王小川表示:“AI时代,信息科技的发展将会朝着自然交互和知识计算两个方向发展。自然交互主要是通过语音、图像、视觉等技术的综合运用实现交互的呈现以及表达变化,而认知计算则是基于认知科学,实现准确的信息理解以及计算反馈。”
目前,搜狗在自然交互以及认知计算方面均有布局,搜狗的AI合成主播不仅集成了语音、文字、视频等多方面的交互技术,而且还结合唇语识别等技术实现了表情的同步以及配合,让交互更加的符合自然交互的理念。目前搜狗AI主播不仅仅有央视主播这一落地案例,而且还结合打造了全球首个AI俄语主播,司法领域的AI法官等落地应用。
而在认知计算领域,搜狗不仅打造了国内首个跨语种交流和内容获取的搜狗机器同传产品,而且搜狗立知系统还通过语义理解、推理、知识图谱等多项技术实现了从搜索到问答的过渡,特定长尾问题能够实现搜索只展示一条信息并且精准匹配答案的效果。
伴随着此次发布会,搜狗与录音笔行业的几家头部企业达成AI创新联盟,促成搜狗人工智能、语音文本处理等领域的技术以及资源能力下放,这对于录音笔行业的商业模式来说也是一次重大的颠覆和升级。联盟的达成将使录音笔行业从以硬件为主的单一收益模式向硬件+服务的多种收益模式转变,促进录音笔行业实现全面智能升级,与AI创新深度融合。
通过AI录音笔创新、开放搜狗语音转写服务、建立AI创新联盟,搜狗正从产品、技术与产业链三个方向,引领着录音笔行业进入AI时代。
本文作者周文猛,微信:yanshunbds,专注人工智能、5G通讯、AR/VR等企业研究报道,重要资讯分享,欢迎产业界朋友加微信交流。
由亿欧公司主办、粤港澳大湾区研究院(广外)联合主办的“2019大湾区国际科创峰会(BATi)”结合湾区科创和青年特色优势,将第二届大湾区国际科创峰会的主题定位于“科技赋能、青年引领”,将围绕5G生态、硬件创新、工业数字化、AI企服、科技出海等热点展开探讨,欢迎科技创新的观察者参与!
报名链接:https://www.iyiou.com/post/ad/id/875
编辑:周文猛