在北京798周边的一家咖啡馆里,AI数据标注员廖仔在对话中多次提及该店所使用的咖啡自动售货机。
在这座面积接近三千平方米的咖啡馆里,众多咖啡师正围绕着中间的圆形操作台忙碌着,然而最吸引目光的却是一台形似人形的咖啡制作机器人。听闻,这台机器人的面部设计正是参照了咖啡店的店主理人的模样。
若时光倒流至三四年前,廖仔未曾料到机器人竟能冲泡咖啡,更未曾料及自己将踏入人工智能的竞技场。
出生于1999年的他,拥有专科学历,曾在深圳的一家体制内单位任职。然而,不愿让人生就此止步,廖仔选择离职,并投身于一个与建筑设计相关的课程学习。此后,他从设计师的角色转型进入AI领域,最终在一家大型企业担任外包数据标注师。随着职业的变迁,廖仔的收入也稳步上升,从最初的每月3000元涨至现在的13000元。
处在Gap期的苏打也曾试图进入这个行业。
这位985高校硕士毕业生,过去的工作生涯一直颇为顺利,然而去年因与上司产生分歧而选择离职,此后便陷入了漫长的职业空档期。最近半年,苏打开始考虑转换自己的职业道路。对于当前热门的AI行业,她感到十分心动,而数据标注师这一职位,她也将其视为自己职业转型的可能方向之一。
兼职经历一番后,苏打摒弃了初衷。“这纯粹是耗费脑力的体力活,根本看不到任何晋升的可能。”她向「定焦One」表达了自己的看法。
人工智能领域的专业训练师中,数据标注师这一岗位在2020年正式被编入国家职业分类体系,然而,关于这一职业未来发展的讨论却呈现出截然不同的两种极端观点。
在基础大模型快速发展的阶段,众多大型企业以高额薪酬和“AI红利”为诱饵,吸引了成千上万的求职者加入,全国各地甚至出现了众多以AI训练师为名目的培训班;然而,在从业者群体中,却弥漫着不安与焦虑的情绪,许多人认为自己只是为AI打工的零工,或是成为大模型优化过程中的消耗品,既难以积累技术,又随时可能被AI所替代。
如今,随着大模型开发的重心从“比拼底层参数”转变为“争夺场景应用”,相关岗位的需求亦随之发生转变。标注岗位不再如以往那般大规模扩张,而是呈现出更加专业化和门槛更高的趋势。廖仔的成功转型与苏打的选择退出,恰是这股人工智能浪潮中两个鲜明的例证。
“拧螺丝”的三种姿势:数据标注师的隐秘分层
若想投身于人工智能领域,数据标注可能是一个门槛相对较低的职位——只需在网络上轻轻一点,便能轻松找到一份兼职工作。
定焦One参与了某众包平台的视频审核兼职活动,负责为自动售货机进行数据标记。在正式开始工作之前,求职者需加入一个群组接受培训——对500个视频进行标记,只有当正确率超过90%时,才能通过考核。正式承接任务后,采取计件制支付报酬,费用在0.04元至0.1元之间波动,若标记错误还需扣除部分费用。
视频时长大约在十几秒左右,需准确识别顾客从自动售货机取出的商品类型与数量。这项工作表面上看似简单,但实际操作起来却颇具挑战。众多饮品和零食的包装设计相似,夜晚光线昏暗更易造成误判。我们尝试对“定焦One”软件标注的20段视频进行分析,耗时25分钟,但只有14条视频的标注是完全准确的。
群内负责教学的讲师反复激励大家:起初犯错率较高是常见现象,随着经验的积累,操作将越发娴熟,准确率也将逐步提升,熟练掌握后,每日最多能处理3000个视频。
从事过此类兼职的人士在社交平台上纷纷吐槽:这项工作实在难以持续,长时间盯着屏幕对眼睛的负担太重。尤其是在那个被称作11群的近200人规模的大群中,成员的流动频繁,有人离群而去,也有人不断加入,整个群体仿佛一条永不休止的虚拟生产线。
苏打也在类似的一个微信群里。
近期,她浏览招聘网站时,注意到一家知名企业发布了关于数据标注工作的兼职信息。该岗位对专业背景和过往经验没有特定要求,但设置了唯一的标准——应聘者的学历必须达到985或211高校的硕士及以上水平。
这份工作主要涉及对大型模型的思考过程及其输出结果进行评价。评价内容包括输出结果的准确性、是否充分考虑到用户的情绪和感受,以及思考过程是否具备逻辑性和效率等。
经过筛选,苏打也被纳入了一个微信群。与此类似,在正式承接订单之前,必须先接受培训和通过测试。
苏打拿到了一份篇幅超过数十页的文件,其中详尽地阐述了各项评分指标及评估准则。依据这一评分机制,她必须完成两至三轮的试标环节,只有达到标准才能承接订单。在通过测试之后,她在实际标注工作中还需确保准确度。若准确度未达到一般水平,她将丧失标注资格,并需重新接受测试。
据苏打观察,她所在群里测试的通过率并不高。
这份工作的挑战在于,记忆和理解所需的投入相当巨大。在开始标注之前,必须先充分理解并牢牢掌握他们的评价框架和评分准则。更令苏打感到痛苦的是,这些准则并非一成不变。有时,即便面对类似的问题和答案,她以相同的思维模式进行评分,却得到了完全不同的结果。
这就像是一张张没有标准答案的试卷,我们无法通过努力或学习来提高正确率,只能不断地原地打转,消耗自己的脑力和体力,最终得到的报酬却少得可怜。苏打向“定焦One”透露,这份兼职是按照件数来计费的,标注的单件费用仅在3到7元之间。
比苏打幸运一些,廖仔没有这些严苛的KPI和考核标准。
廖仔负责的是国内另一家知名互联网公司的外包任务。他带领一支由十名标注员构成的团队。在项目中,类似的小组不止一个,它们负责对那家大公司的模型进行评估、鉴定,并制定标注规范。廖仔会每日分配标注任务,并向团队成员传达明确的规则和评判准则,以保证评估的公正性。除了进行数据标注的工作,他还需要与算法团队以及产品研发团队进行交流,依据来自上下游的反馈信息,对模型的评估与鉴定进行相应的调整。
廖仔继续以咖啡机器人为例,指出若要让AI学会制作咖啡,必须向其详细说明整个制作流程,涵盖咖啡树的生长方式、咖啡豆的品种种类、分子结构的特性以及研磨方法等。随后,通过在每个环节进行数据标注,对AI进行精准调整,并将其反馈至模型,促使AI能够进行自主的学习训练。
自动售货机标注这一环节,主要考查的是工作人员的体力和注意力,通过不断的重复和熟练操作来提高工作效率;而对大模型的思考过程及其输出结果进行评分,则需要具备较高的理解力和记忆力,就如同在解答一系列没有固定答案的考卷;至于大模型评估,除了进行数据标注,还需负责流程管理和沟通协调,这一部分工作具有一定的自主性。
人们常把数据标注类比为AI生产线上的“螺丝工”。然而,在廖仔眼中,即便是在拧螺丝这一环节,他也至少明白了选用何种工具、采取何种方法才能提升拧螺丝的效率。
尴尬的岗位:重要,但是廉价
Jackson位于产业链的上游位置,他得以从更为全面的生产流程中洞察数据标注的重要性。
杰克逊毕业于海外一所知名研究生院,目前在上海的某科技企业中担任基础模型训练的职务。他向「定焦One」透露,这一过程大致分为三个阶段:首先是预训练阶段,其次是监督微调,最后是强化学习。
预训练所需的数据量常常达到十几TB,这些数据主要源自公开爬取的信息、模型生成的数据、外部采购的数据以及企业内部的数据。在这一阶段,对人工标注的需求相对较低。
数据标注师主要介入的,是后两个阶段。
微调阶段,即所谓的监督微调(Supervised Fine-Tuning,简称SFT),其核心目的是使经过预训练的通用语言模型能够更好地适应特定的任务需求或对话环境,从而提升其输出的准确性与人类期望的契合度。具体来说,这一阶段旨在通过输入特定的数据集,指导模型学会“如何正确地给出回应”。
强化学习从人类反馈中汲取精华,其核心要义在于运用人类偏好的数据资源,对模型的输出质量进行优化提升。
用更贴近日常的表达来说,SFT的目标是编写一个答案供AI去学习和效仿;而RLHF则是在AI提供了若干答案之后,协助AI挑选出一个更贴近人类喜好的答案。
廖仔所从事的主要是难以衡量的工作类型;相比之下,苏打从事的是可以按件计酬的工作。例如,文中提到的自动售货机标签等相对简单的数据搜集任务,很快就会由人工智能来接管。
Jackson指出,在微调与强化阶段,可以借助自动化工具,或者采用其他模型所输出的数据,然而,这些数据在内容的多维性、准确性以及专业性方面,往往不及人工标注的信息。举例来说,DeepSeek生成的内容,其特征一目了然。
最佳的成果自然是由人工进行细致标注,然而,相较于打造一个无懈可击的模型,AI企业的管理者们更倾向于关注成本问题。即便模型能够合成一个较为理想的替代版本,这样的结果也是他们可以接受的。
Jackson估计,进行一次全面的微调与强化训练,往往需要数十万条数据,并且随着模型的不断更新迭代,所需数据量也将呈几何级数增长。观察发现,在国内,具备足够财力进行人工数据标注的顶级大厂寥寥无几,而多数团队则依赖于其他模型来生成所需数据。
依据公开信息,字节跳动在AI领域的资金投入在2024年已高达800亿元,而2025年的投入预计将增至1600亿元。在本年2月份,阿里巴巴集团的首席执行官吴泳铭宣告,在未来三年的规划中,阿里计划投入超过3800亿元,以构建云计算及AI硬件的基础设施。
即便这些行业领先者,在各个环节上也需精打细算。数据标注这一成本可控的环节,往往由大型企业通过外包或众包的方式实施,已逐渐成为行业惯例。
苏打每日兼职的时间大约在三个到四个小时,她核算过,时薪大约在三十到六十元。她表示,在这三四个小时里,她必须全神贯注,丝毫不能松懈。这样的付出与所得,若非对这一行业充满热情,实难持之以恒。
苏打加入的微信群持续有人加入。即便你不参与,总有人愿意接手,因此报酬自然难以提升。
数据标注的重要性并非问题所在,真正的问题在于这项工作缺乏技术门槛。大模型的生成与优化过程极为复杂细致。每条数据都如同布偶身上的针脚、斑马身上的毛发,其对于整体的作用难以捉摸。在流水线上,标注师难以形成个人能力上的独特优势,因而极易被取代。
没有壁垒,就难有议价能力。
根据招聘网站上的公开资料,兼职数据标注师的日薪普遍在120至500元这个区间内,而外包职位月薪大多落在9000至17000元之间。对于几家知名大公司的正式职位,月薪范围则在15000至25000元之间。与技术人员和算法工程师的岗位相比,这一薪资水平并不算特别高。
被自己训练的AI替代:谁能突破金字塔?
由于缺乏发展潜力,苏打最终选择了放弃兼职工作,并且不再考虑申请任何与数据标注相关的工作岗位。为此,她特地找了一位在AI数据标注领域拥有丰富经验的朋友进行了咨询。
这位朋友在大型模型风靡之前便投身于我国一家顶级模型团队,之后又转至另一知名企业。身处朝阳产业,占据高薪职位,众多人羡慕她抓住了行业机遇,然而她却建议苏打要谨慎考虑这份工作。毕竟,数据标注师这一职业的发展前景受限,难以进入AI领域的核心领域。
Jackson也持类似的观点。
他以金字塔作比喻,描绘了当前人工智能领域从业者的层级分布:底层为标注工作,中部涉及应用开发,向上则是微调与后续训练,而金字塔的顶端则是基础模型的设计与预训练阶段。“目前的情况是,背景因素几乎决定了一切,想要从金字塔底层逐级攀升至顶端,难度相当大。”
所谓的背景主要涉及教育程度和学术经历。比如,众多职位都将学历设定为必备条件。Jackson指出,在应用领域,本科学历是基本要求,而在微调和后续训练阶段,硕士学历则是起步点,至于基础模型的研究,通常需要博士学历。
以他在算法岗位上的求职为例,寻找工作需考量学历、实习经历、竞赛成绩以及论文发表等多个方面。在人工智能领域,学术背景尤为重要。若缺乏出色的论文成果,即便来自排名靠前的院校,也难以融入知名企业的AI团队。
位于金字塔顶端的,大多是那些来自顶尖学府的博士,他们还需撰写大量学术论文。他这样概括道。
与此同时,标注师们培养出的模型正与标注师们暗中竞争。这种竞争是否会使得AI取代标注师们,如同达摩克利斯之剑一般,悬挂在标注师们的头顶之上,成为他们心中的忧虑。
Jackson提出,在众多成熟的文本模型中,模型生成的数据已取代了80%的人工标注。其内在机理在于,当模型不够强大时,对标注的依赖性较高;而随着标注数量的增加,模型的能力得以提升,进而AI有可能在这个任务或该领域取代标注师。
在海外的一些高科技企业,这样的情况已经发生。
彭博社消息,苹果公司已在2024年1月解散了一个与Siri人工智能服务相关的团队。该团队此前主要负责监听并分析用户与Siri的互动数据,以实现数据的标注并洞察用户需求。值得注意的是,由于自动标注技术的显著提升,特斯拉在2022年6月也减少了200名负责为辅助系统标注视频的美国员工。
另一方面,大厂战略的变化,也影响着数据标注师的职业前景。
2023年伊始,基础大模型领域成为各大科技巨头争相涉足的竞技场,百度、字节跳动、阿里巴巴、腾讯等知名企业纷纷高调宣布对自主研发的大模型进行投资,而数据标注岗位也因此变得至关重要,成为不可或缺的基础性工作。
自2024年起,该赛事的热度显著下降。众多知名企业纷纷调整战略方向,不再专注于“打造参数更高的模型”,而是致力于“推动模型的实际应用”。
这一转变,对数据标注这一基础职业的岗位供应和预算规划产生了直接影响。因此,用于支撑大型基础模型训练的数据标注需求可能会减少。未来,企业所需的不再是数量庞大的“数据标注者”,而是那些“既了解业务又熟悉模型”的专业人才。
自然,这种需求并未彻底消散。一方面,Jackson指出,伴随着人工智能技术的不断进步以及大型模型的逐步应用,将涌现出众多新的应用领域。每当新领域出现,便需有人负责数据标注。因此,对于数据标注的需求将持续保持长期且庞大的规模。另一方面,清华大学发布的《智能数据产业发展观察报告》显示,2024年,对数据标注服务的需求企业数量从2023年的457家激增至1195家。此外,IDC的数据预测表明,到2025年,我国人工智能基础数据服务的市场规模将超过120亿元,且在2019至2025年期间,其年均复合增长率(CAGR)预计将达到约47%。
这些增长主要表现为“横向增量”,即新应用场景引发的标注需求增加,而非“标注师”这一职业本身的发展路径被拓宽。对于大多数从业者来说,他们依旧是在为生产线上的工作付出努力。
已经被AI“抢”过一次饭碗的廖仔对自己的职业未来充满信心。
廖仔在迁至北京前,曾在上海的一家设计企业担任了两年的设计师职务。那时,人工智能对设计领域的冲击已然显现,他所在的企业亦顺应潮流,着手向AI领域转型,并计划打造一款客服领域的大型模型。廖仔积极自荐,投身于这一AI项目中,该项目的参与为他开启了一扇通往新世界的大门。
此后,他选择了离开原公司,投身于对人工智能的深入学习之中。随着今年春节的结束,他成功加入了目前所在的企业。无论每天下班多晚,廖仔都会坚持花两个小时研究AI相关知识,此外,他还创立了名为“炸毛疯兔”的小红书账号,用以分享和记录自己的AI学习心得。
“凡事发生,皆有利于我。”在交流时,廖仔一再引用这句古语。
咖啡店员工偶尔会带来一些新推出的食品让顾客品尝,服务态度周到细致。然而,那台引人注目的咖啡机器人却一整天都没有制作出一杯咖啡。至少在目前,这台机器人对于这家咖啡馆来说,更多的是一种摆设。尽管未来充满不确定性,但人类的能动性始终是至关重要的。
*文中廖仔、苏打、Jackson皆为化名。