随着概念的普及,科技公司对人工智能的要求越来越高,成本、准确度、效率都影响着人工智能能否落地融入日常的使用中。对人工智能应用的快速增长也进而催生了对影响人工智能水平的关键要素——机器学习方法的需求。自动化机器学习方法AutoML应运而生。
近年来,在深度学习领域里,出现了一种「新式学习法」,很多人视它改变了设计复杂的深度学习网络,把看似高不可攀的深度学习,「拉」到了人人触手可及的程度。这个新方式,就是 AutoML。
2017 年 5 月,谷歌在 I/O 大会上发布了 AutoML,他们将 AutoML 应用到了深度学习的图像识别和语言建模的两大数据集中,他们提供的 Cloud AutoML 和 Google NAS 算法结合,把完整的机器学习工作做成了云端产品,用户只需要提供数据,Cloud AutoML 将自动构建深度学习模型。换言之,AutoML想要做到的,正如其名:自动化机器学习。
传统的AI模型训练往往要经历特征分析、模型选择、调参、评估等步骤,这些步骤需要经历数月的时间,如果完全没经验,时间会更长。AutoML虽然也需要经历这些步骤,但是通过自动化的方式,可以减少这些步骤的时间。
选择怎样的参数,被选择的参数是否有价值或者模型有没有问题,如何优化模型,这些步骤在从前是需要依靠个人的经验、知识或者数学方法来判断的。
而AutoML可以完全不用依赖经验,而是靠数学方法,由完整的数学推理的方式来证明。通过数据的分布和模型的性能,AutoML会不断评估最优解的分布区间并对这个区间再次采样。所以可以在整个模型训练的过程中缩短时间,提升模型训练过程的效率。
如何促进技术公平,降低技术应用门槛,让不懂技术的用户也可以使用人工智能;如何优化机器学习的流程和结果,辅佐数据科学家们投入更有价值的工作,正是 AutoML 以及人工智能领域未来希望攻克的难题之一。
在2018年谷歌云全球NEXT大会上,李飞飞宣布,谷歌AutoML Vision进入公共测试版,并推出了两款新的AutoML产品:AutoML Natural Language和AutoML Translation。
这个名为Cloud AutoML的宏大项目浮出水面之时,被业内称为“Google Cloud发展的战略转型”——一直以来面向机器学习人工智能开发者的Google Cloud,这次将服务对象转向了普罗大众。你只需在改系统中上传自己的标签数据,大能得到一个训练好的机器学习模型。整个过程,从导入数据到标记到模型训练,都可以通过拖放界面完成。
其实在谷歌发布AutoML前后,机器学习自动化的产品风潮已经吹起:2017年底,微软发布CustomVision.AI,涵盖图像、视频、文本和语音等各个领域。2018年 1 月,他们又推出了完全自动化的平台 Microsoft Custom Vision Services(微软定制视觉服务)。同年,国内也出现了不少相关产品,称能够解放算法工程师,让AI自动化,其中的代表即是百度的EasyDL
EasyDL 在 2017 年 11 月初上线了定制化图像识别服务,并在业内展开公开测试。在 2018 年 4 月、5 月和 7 月陆续发布了定制化物体检测服务、定制化模型设备端计算和定制化声音识别等多个定制化能力方向,并形成了从训练数据到最终定制化服务的一站式端云一体平台。
目前 EasyDL 的各项定制能力在业内广泛应用,累计过万用户,在包括零售、安防、互联网内容审核、工业质检等等数十个行业都有应用落地,并提升了这些行业的智能化水平和生产效率。
此外,旷视原创自研的人工智能算法平台Brain++也集成了行业领先的AutoML技术,对深度学习算法的各个关键环节进行自动化的设计、搜索和优化。
旷视Brain++ AutoML技术以One-Shot方法为核心,力图一次训练即可完成自动化过程,将计算代价减小至传统AutoML方法的万分之一,在可控的时间内搜索出高性能、易部署的模型结构。
相比于市场上的AutoML技术,旷视的AutoML技术有以下优势:
1. 计算代价小。传统的AutoML技术常常需要多次训练模型甚至会遍历部分模型空间,计算代价巨大。旷视的AutoML技术以one-shot方法为核心,只需训练一次即可得到整个模型空间的刻画,大大减小了计算代价,只是平常训练代价的1-3倍。
2. 应用范围广。旷视的AutoML技术提供了一套完整的解决方案,覆盖了大部分业务,包括活体检测、人脸识别、物体检测、语义分割等。
3. 部署方便。旷视的AutoML技术涵盖了数据处理、模型训练、模型压缩、模型量化等流程,自动处理从数据到落地。
4. 精度高。旷视的AutoML技术在诸多视觉任务上,超过人类手工设计,达到了业界最优。