自如回应“租客喝了7个月中水”:已修复,将沟通补偿方案 台风“海神”逐步北上 后期或将影响东北 快手8.0版本上线!品牌与产品全面升级 支持1080P视频上传和播放 200余名防疫人员为服贸会做现场保障 参会人员配发中药预防饮 【地评线】京彩好评:更新技术出口目录是应时应势之举 2020年服贸会9月4日开幕:参展企业数量超往年 个人可提前两天预约参观 最新数据持续向好引海外点赞中国经济复苏 全国消费扶贫月:农产品流通过程中的税收优惠政策了解一下 徐州三十一中女教师殴打辱骂多名学生 已被停职 塑料书皮真“有毒”吗?哪种最安全?听专家怎么说 正当防卫认定新规来了,5张图带你看明白! 阿达来提·艾再孜:民法典将护佑“全面小康”行稳致远 【桂声漫画】防疫学业两手抓——大学,我来了! 我国成为3月份以来全球主要服务贸易国中唯一出口增长国家 中央财政对受灾困难群体予以倾斜和优先保障 防汛救灾工作有力有序 王毅:维护南海稳定,携手化解挑战 【地评线】京彩好评:更新技术出口目录是应时应势之举 中国改革低保等现行社会救助制度 打造多层次分类救助体系 疫情之下“审判执行不停摆” 中国最高法要求确保完成全年审判执行任务 商务部:愿与日本深化防疫和经济社会发展合作 中方再驳蓬佩奥涉华无端指责:蓬佩奥之流的险恶用心早已被世人识破 2020年服贸会9月4日开幕 设置7类活动 东北抗联遗址“云展播” 感受传承历史培育家国情怀 木里矿区非法开采为镜鉴 青海层层出手宣示生态保护决心 昨天,今天!胜利,唯有胜利! 中国创新发展目标明确 在人工智能和先进制造业等方面有规划 世界旅游合作与发展大会将在京开幕 促旅游业再繁荣 美国国务院限制中国在美外交活动 外交部回应 商务部回应印度禁用中国118款APP:严重关切 坚决反对 北京开展有限空间专项执法检查 持续至9月11日 中央财政对受灾困难群体予以倾斜和优先保障 防汛救灾工作有力有序 云南省原副省长赵廷光逝世 享年89岁 应急管理部消防救援局前方指挥部完成各项任务正式撤离四川 男童泳池排便被索赔1.5万元 家长回应:不接受赔偿数额 商务部:调整发布《中国禁止出口限制出口技术目录》不针对具体企业 宇宙全尺度暗晕什么模样?8个“放大镜”接力模拟出清晰图像 250万贫困人口遭受洪涝灾害 官方紧急施措防范因灾返贫致贫 西银高铁陕西段联调联试正式启动 应急管理部自然灾害工程救援成都基地挂牌成立 跨境服务贸易负面清单何时推出?商务部:年底前将出台 内蒙古推荐50项国家重点研发计划项目获国家立项支持 “日军细菌战罪证”上线,让历史说话! 中方回应美方限制中国在美外交活动:于法无据、于理不合、于情不通 疫情阴霾渐散 外媒感受“中国式”热闹 实验室设计、人员培训……中国抗疫医疗专家组在几内亚分享这些经验 中科院科研人员在新型半导体激光器研发上取得进展 王毅将出席金砖国家外长视频会晤 三部门:防卫过当应兼具两个条件,缺一不可 5G手机首次击穿千元关口 上游芯片厂商芯片迭代速度加快 二战以来首次!CBO:美国政府债务明年将超过经济规模
您的位置:首页 >股票 >

人工智能背后的“人工”:谁在训练AI?

2020-08-12 18:12:40来源:第一财经

“抬头是山,低头是煤。”曾在山西传统煤矿工作8年, 整天盯在电脑屏幕前监测矿井瓦斯浓度的郭梅从来没有想过,有一天自己的工作会和人工智能有了联系。

两年前,因为孩子来省会城市太原上学,郭梅在附近求职,做起了数据标注。同样是盯在电脑屏幕前,现在郭梅每天的工作是给图片、文本或者声音进行标注,再把它们交给机器训练和学习。从一开始每天只能标注两三百张,到现在的日均完成1300多张,郭梅按件计酬的收入逐渐提升,已高于当地平均收入水平。

人工智能行业里有句话:有多少智能,背后就有多少人工。像郭梅一样,AI数据标注师成为了随着人工智能发展而出现的新兴就业岗位。2020年2月,“人工智能训练师”正式成为新职业并纳入国家职业分类目录。

他们被称为人工智能背后的人。数据采集和标注是他们的主要工作,目的就是要教会AI认识数据,转化成AI能消化和吸收的“语言”。有了足够多、足够好的数据,AI才能够学会像人类一样去感知、思考和决策,更好地为人类服务。

这项工作看起来简单枯燥,但意义非常。“就像一台车没有汽油走不了,数据就是人工智能发展的燃料。有了我们的数据,机器(算法)不断迭代,就能推动人工智能往更好的方向发展。” 从事数据标注的山西麟诺公司总经理李应维对第一财经表示。

数据标注员工作场景

“从没想过做人工智能”

20出头的李宇龙从未亲眼见过自动驾驶汽车,但他的工作却和自动驾驶的AI算法息息相关。

他曾经在生产电子类产品的工厂工作,转做AI数据标注后,老板交给他的第一个项目就是“车道线打点”。

简单来说,就是给无人驾驶进行车道线标注。当无人车行驶到一段路时,会自动连续拍摄图片,李宇龙要做的,就是对图片上车辆所行驶的车道旁边两侧的线进行标注,识别虚线还是实线,匹配所对应的属性,从而告诉人工智能虚线车辆可以进行变道,实线不可以进行变道。而标注的难点,在于交汇和分岔。

当时的李宇龙,还不知道数据标注师到底是什么,更对人工智能没有具体概念,老板只交给他一套规则,让他按照规则在电脑上认车道线。好学的他在短时间内就掌握了规则和难点,总结出了标注车道的规律。

他把自己的工作比作“幼教“,当他拿出一个红苹果给机器并教会它识别,再拿一个绿苹果给它时,因为颜色差异,机器就无法认出了。李宇龙的工作就是不断地帮助机器识别不同的颜色、大小,甚至是被咬了一口的苹果或是坏苹果,直到随便拿出一个苹果,它都能认出来。

李宇龙告诉第一财经记者,数据标注的工作是“按件计酬”,他的日均收入在300元左右。数据显示,2019年,太原市的城镇居民全年人均可支配收入36362元。他说,自己的工资水平在整个基地标注师日均收入中处于中等水平,“据我了解,有人日均收入甚至能破千。”

对于自己的工作,李宇龙说,刚开始接触时,只把它看做一个重复性的工作,并没有想太多。直到后来接触项目多了,涉及的领域包括教育、安防、金融、交通医疗和电商等,每天都在挑战学习能力,也会想要更深入了解自己标注的内容可以应用到的行业。 虽然还没有坐过无人车,但他说,现在看到无人驾驶的时候,会想到这里面也包含了自己的标注成果。

像李宇龙、郭梅的工作一样,第一财经记者看到,在每一间数据标注的办公室里,都是类似的工作场景:一排排电脑屏幕前,年轻的数据标注师根据各自分配的任务,对文本、图片、语音和视频做标记、标重点、打标签、框对象、做注释等方式对数据集作出标注,他们可能在为无人车标注车道线、红绿灯,也可能是在为肺部影像标注病毒数据。

以人脸为例,目前能实现对约150个特征点的标注。疫情期间,采集大量的戴口罩的人脸照片后,数据标注师对人脸的眉毛、眼镜、颧骨等人脸关键点进行精准标注,标注特征点越多,AI就越能精确识别出戴口罩场景下的人脸。最终实现即使不摘口罩,也能实现精确测量体温,或是通过人脸闸机。

数据标注员郭梅

是不是“AI富士康”?

数据标注产业促进了不少城镇和农村就业,在河南、河北、贵州等地,还出现了一些特色的“数据标注村”。

据IDC统计,全球每年生产的数据量将从2016年的16.1ZB猛增至2025年的163ZB,其中80%-90%是非结构化数据,这些数据经过清洗与标注才能被唤醒价值。在我国,每年需要进行标注的语音数据超过200万小时,图片则有数亿张,这就产生了源源不断的清洗与标注需求。 李应维对第一财经记者说, 他预计明年企业的用工将翻一倍,从160多人扩展到300人左右。

李应维公司所在的百度(山西)人工智能基础数据产业基地,已经成为中国人员和产值规模第一的单体数据标注基地。AI数据标注师从业人员超过2000人,实现营业收入超亿元,企业入驻35家。该基地计划在未来5年培养5万名AI数据标注师,并引入更多AI合作伙伴。

百度(山西)人工智能基础数据产业基地负责人尉赤告诉记者,人工智能是个高速发展的行业,数据服务又与人工智能息息相关。“我们的线上众包注册用户有将近2000万人,目前每个月在线上为我们提供服务的人将近5万人。如果按照行业增长速度来看,培养5万人还不一定够。”李宇龙的工作重心已经转向培训

不过,数据标注师看上去是人工智能领域一个“入门”工种:技术门槛低,招工人群范围广泛。他们通过每天数千次的重复动作,和最前沿科技的人工智能产生联系。也因此,外界给这个行业贴上了“AI富士康”的标签。

数据标注带来了技术红利,但如果人工智能发展到一定程度,甚至有可能够取代数据标注师的工作。

艾瑞咨询在一份人工智能相关报告指出,随着算法需求越来越旺盛,依赖人工标注不能满足市场需求,因此增强数据处理平台持续学习能力,由机器持续学习人工标注,提升预标注和自动标注能力对人工的替代率将成趋势。此外,随着 AI对数据的要求越来越高,数据标注行业也正逐步进入精细化阶段。

对于数据标注这一职业的未来,李应维对记者举例,自己公司一名员工入职后,因为表现优异,不久已被百度公司聘用。而且,数据标注师也在为人工智能培养和发现人才。

尉赤则认为,目前大家更多地聚焦在数据加工这件事,但如果再往前看,更多的是数据的优化、还有一些相关的解决方案。数据标注是一个很好的入门,进来之后有机会更深度参与到产业链协作当中,例如后续当数据标注越来越机器化,人工和自动化之间要有机的协同,这也对员工提出了更高的要求。

此外,当数据标注越来越机器化,人工智能训练师是一个转换工种的机会,标注员们现在标注数据,未来可能向数据治理、数据解决方案设计和项目管理等方向发展。

例如,现在李宇龙的工作重心已经转向培训,同时接触到更多的项目管理,根据每个项目对应的特点判断与之匹配的能力。 在他看来,自己比很多传统行业的人们更早地接触到未来的发展方向和未来的生活、工作场景,“看到了未来的发展需求,也就比别人更早找到更多发展机会。”