当前位置: 首页 > 生活百科 > 本文内容

月薪两万!哪些技能让你成为大厂争抢的AI数据标注专家?

发布时间:2023-12-04 08:00:01源自:http://www.zuer8.com阅读

在近期的一周内,我国各大互联网公司如百度、字节跳动、京东、滴滴出行、美团等纷纷发布了AI数据标注员的招聘信息,吸引了众多求职者的关注。据「自象限」搜索,这些岗位要求包括本科以上学历、月薪两万以及与大型人工智能模型相关的工作内容。尽管职位数量有限,但招聘软件上的HR们异常活跃,一天24小时几乎全程在线,日均回复次数在十次以上。这一现象背后隐藏着各大互联网公司在大模型领域的竞争激烈程度,同时也引发了关于普通人是否能从中抓住机遇的思考。

"人均月薪两万、本科以上学历、直通车到百度字节。" 这个年底的招聘市场略显荒凉,但在最近的短短一周之内,突然涌现出大量"AI数据标注员"的岗位,正火热招聘中。据「自象限」搜索,这些岗位不仅有百度、字节跳动、京东、滴滴出行、美团等"梦寐以求的公司",而且月薪在1万到2万元之间,薪资待遇十分诱人,且发布时间短,大多在1周到1个月之间。

除了新鲜感之外,这些岗位的招聘显然非常紧迫。根据招聘软件的数据显示,HR们异常活跃,全天候在线,日均回复次数超过十次,每隔几秒钟就会回复一次。"只要上线,AI数据标注员的招聘信息就会疯狂弹出,就像主播招聘一样。"不少正在求职的人向「自象限」反馈,"上次这种情况还是主播招聘时。"

招聘的热火程度让人联想到各大互联网公司在大型模型领域展开的激烈竞争。

自象限向多位招聘HR进行了咨询:“工作的主要内容是对文心一言大模型回答结果的分析和判断,工作的地点在百度科技园。”猎头回应道。高薪资待遇、挂钩大模型、大厂哄抢……求职者看到了机会,“大模型的风,要带动新一批大厂人扎根了,普通人的机会来了吗?”但事实上,时间紧、任务重的岗位招聘,要求并不算低,基本学历要求本科起步,985、211优先。本科和硕士优先,同时需要具备语言学、中文信息处理、计算语言学、文学等相关专业背景,并对一些AI技术的原理有所了解。

花椒科技告诉我们,面试的基本流程是:“简历初筛-发笔试题-笔试题通过一轮面试-直接发offer-”。在学历方面,猎头强调:“必须得是一本才行,211/985优先。”严格准入门槛,招聘软件上神秘的“AI数据标注员”背后,藏着大厂的大模型棋局。

01我,给大模型当“考官”,月薪两万历时一个多月的面试,中文系毕业的罗文(化名)最终敲定了自己的offer——百度文心一言的AI数据标注员。连她自己都不敢相信,一个纯技术小白现在的日常竟是给大模型当“考官”。

“毕业三年,没有任何AI经验,转行涨薪,幅度近50%,月薪在9k-15k左右”,罗文告诉我们。坐在两台电脑前,罗文每天的主要工作有两项:一是做题,直接给大模型进行“填鸭式”教育;二是给文心一言当“判官”,评判给出的答案对不对、好不好。

所谓“填鸭式”方法是指将编写好的答案强制输入到大模型中,从而提高大模型的训练效果。罗文向「自象限」透露,她曾参与数学题、常识题以及作文题的解答,但她认为,专业知识对于提高答案质量至关重要,如她擅长文学领域,便专注于解答文学类题目,而其他同事如有医学背景,则应专注于医学领域的问答。罗文的话已在一些社交媒体平台上得到证实,有人曾发布帖子表示需要金融专业人员,按每道题1.5-2.4元的价格付费给文心一言解答,每天需解答30多道题。

此外,罗文还需扮演“判卷老师”的角色,对大模型生成的各类问题答案进行评估。对于开放性和没有固定答案的作文题,罗文需先确定问题类别,然后对三个答案进行评分和排序。评分区间为0-5分,若得分低于3分,还需注明具体原因,如“答非所问”(0分、“严重跑题”(1分、“存在逻辑问题或事实性错误,比例较小则为2分”等。

尽管这项工作需要投入大量时间和精力,但其重要性不言而喻,甚至有可能成为直接进入大型公司机会的跳板。猎头公司的一位员工向我们透露:“尽管我们与公司签订合同,但仍有六分之一的机会转正,加入百度集团。”这也可能是为何要求严格控制学历的原因。

「自象限」了解到,百度地图因有稳定的地图业务需求和自动驾驶模型、算法模型训练需求,因此对数据标注的质量要求更高,确实建立了专门的数据标注团队。

在市场上,对“罗文”的需求不仅限于大型模型公司。据「自象限」统计,当前市场上的数据标注岗位主要分为两类。

一类是以自然语言处理(NLP)为主导,包括百度、字节跳动、京东、美团在内的多家大型模型科技公司纷纷设立自己的数据标注团队。这些团队主要负责分析数据、判断大模型生成结果、协助大模型进行逻辑推理等多个细分领域。

另一类则专注于计算机视觉(CV),这是一个相对成熟的方向,人们更为熟悉的是“2D拉框”和“3D拉框”。这类团队主要为滴滴、毫末科技、轻舟智航等汽车制造商提供图像数据质检和标注服务。

「自象限」观察到,11月份成为NLP方向数据标注的重要转折点。在此之前,包括百度、京东在内的多家大型企业在校园招聘和社会招聘中并未设立或只设立了极少的AI数据标注岗位,招聘软件上也没有出现大量相关实习生岗位,通常不对学历设置上限,大专学历为最高限制。然而,突然之间出现了大量岗位需求,这一现象可能与大型模型公司的研发受阻有关。多位业内人士透露,我国的大型模型技术水平可能仅达到GPT-3.5的水平,发展核心仍在于提高数据质量。

与此同时,国外OpenAI不断发布新招揽人才的消息,直逼GPT-5,而我国的企业却高喊着“要落地”、“要应用大模型”,在这种内外双重压力下,一些企业开始采取“人海战术”。

技术研发水平不够,人工能力来补齐,国内大模型厂商开始疯狂争夺“AI数据标注员”,为大模型能力“飞升”再加一把燃料。

02 大厂卷精标,粗标“割韭菜”

实际上,数据标注并非新鲜事物,过去主要是粗标形式,即“拉框”。但近年来,随着大模型的不断进步,粗标已变得不再适用,因此精标的地位逐渐上升。

对于粗标和精标的区别,某大厂员工表示:“一般厂商的外包团队可以进行标注,但是他们只是按照规定的规则进行标注,如果在规定之外的数据,可能会导致标注的通过率不高,但如果由工程师团队进行标注,特别是针对自动驾驶辅助驾驶等回传的数据,他们知道背后的原理,可能不会按照常规的思路进行标注,而是带着解决问题的思路进行标注,可能需要跳出之前制定的标注规则,这样标注数据的质量会更高。”

大模型的火爆也带动了粗标的热潮。目前,粗标求职阵地已经从招聘软件转移到了短视频平台如快手。例如,快手的直播招聘业务“快聘”在发布会上特别提到:“我们要解决数据标注职业线下招聘难,应聘者少的问题。”

在实际操作中,快手对数据标注行业提供了全方位的支持,包括公司资质审核、流量扶持、公司推荐以及数据标注职业推广等方面。其中,快手官方招聘直播间甚至全天滚动播放数据标注求职信息,这在一定程度上成为了一些数据标注公司的“尚方宝剑”。

然而,在招聘过程中,一些数据标注公司过度夸大宣传,如“无需学历,上手即会,小学生都能做”、“拉一个框,打一个标签,就是半个毛”等,这些夸张的宣传让许多求职者心动不已。但实际情况究竟如何呢?一万块钱能否轻易拿到?

为了揭示真相,「自象限」在快手报名后联系了一家热门数据标注公司。该公司表示已经与比亚迪、理想、小鹏、特斯拉等车企签约,直接获取一手数据任务,并出示了大量证书、凭证以证明其正规性。入职的主要任务是接收任务包,在图片上进行拉框、标注和打标签。

经过了解,我们发现几个关键点:数据标注按照计件收费,一个框的价格在一毛到一毛五之间;薪资采用周结方式发放,首月为每周结算,第二个月及之后转为每月结算;新员工需要先行支付2580元的费用,一年内工资累计达到1万元,方可退还;平均需花费七天内的时间进行学习,即可开始执行任务;同时提供兼职和全职岗位,兼职按照框数计算,全职则需要在指定地点线下办公,并提供免费住宿;根据该公司提供的员工工资截图,月工资在5000-6000元不等。

然而,在黑猫投诉平台上,这家公司却成为了数据标注投诉的热门对象。

一些用户的投诉经历与我们的情况相符。根据用户的反馈,主要的投诉点包括以下几个方面:用户需要在未进行拉框操作前先支付2580元费用,而且如果一年内完成拉框任务累计达到1万元,却出现了退款问题;课程内容过于简单,耗时较长,影响了用户的上岗时间;第三,数据标注的结果未能达到预期标准,导致用户无法获得相应的收入;客服人员的服务态度恶劣,对用户的诉求置之不理,甚至拒绝退还已付款项。

一次严肃的数据标注招聘活动,竟然变成了一场“割韭菜”的游戏。那些老老实实进行拉框操作的员工却没有得到任何回报,而那些提供数据标注服务的公司却因为收取费而获得了丰厚的利润。数据质量对于大型模型的运行速度至关重要,即使是OpenAI也不例外。据外媒报道,OpenAI不仅雇佣了多家知名的数据公司来进行数据标注,还组建了自己的团队由数十位哲学博士负责数据质量检查。大型模型的基础在于数据,数据质量直接影响着模型的进化速度。从这个角度看,我们可以发现我国大型模型发展缓慢的部分原因,但随着数据标注问题的解决,我们有望看到真正的突破,例如实现GPT-4等更高级别的模型。

文章推荐

猪儿生活 Copyright©2018-2019 All Rights Reserved
免责声明:本站所有图片、文字除注明原创外均来源于互联网,版权归原作者所有,若侵犯到您的权益,请立即联系我们删除,谢谢合作! 琼ICP备2023010869号-5