• 我的订阅
  • 科技

AI大模型折叠:数据标注“民工”月入不过5000,单价从5毛降到4分

类别:科技 发布时间:2023-10-09 17:10:00 来源:巴比特资讯

原文来源:Tech 星球

AI大模型折叠:数据标注“民工”月入不过5000,单价从5毛降到4分

图片来源:由无界 AI生成

郑雯至今觉得记得几个月的下午,那天,她一个小时就赚了2毛钱。她毕业于湖南的一所专科学校,是一名大模型数据标注师,每天的工作并不复杂——给自己领取的原始数据(如图像、视频、文本等)添加标签。

但大模型对于数据的质量要求很高,那天当时一张图片被要求反复修改了8次才通过,整个修改过程花费了一个1小时。也就是说,她这一个小时只赚了2毛钱,而正常情况下可以赚到12块,可以拉600个框。“钱并不好赚”,她反复强调。

这几乎是所有数据标注从业者的共识。数据标注的一端承载着从业者们不足5000元的月薪,他们如蚂蚁雄兵般构建起大模型的基石。而另一端则是互联网大厂们的AI梦想,他们希望借此超越Chat GPT 4。

数据标注采用最原始的计件制算工资,并不存在职场上的勾心斗角。唯一的苦恼这份过于枯燥的工作,让他们中的大部分很难坚持完3个月。并且,几乎所有人都告诉Tech星球,你最好别去。

可他们不知道的是,要不了多久,他们中的大部分可能会失去这份枯燥的工作。因为,那些简单的数据标注将会被AI取代。

从5毛到4分,价格暴跌

林双在2017年赚到了一笔“快钱”:15天6000多元。对于专科毕业的林双来说,这个收入着实可观。那是人们对AI期望爆棚的时候,几乎没有人怀疑过它的未来,所有的投资机构都坚信这里可以诞生十亿、百亿甚至千亿规模的企业。

几乎所有AI技术的背后都是算法、算力、算据的竞争,庞大的数据是技术优劣的底层。背景光鲜的程序员们坐在“北上广”的办公室里,通过代码迭代算法描绘AI蓝图,而大专生、宝妈等在三四线城市的格子间处理庞大数据包中的图片、文字、语音等。

ChatGPT也不例外。一位百度文心一言项目组的员工称,大模型本身并没有什么新技术,也没有太高的技术壁垒,关键的问题是算力壁垒形成的参数壁垒。

大模型时代的数据标注员和以前的也并没有特别大区别,为数不多的差距可能是更加舒适的办公环境和对标注质量的更高要求。一位数据标注的从业者向Tech星球介绍,一般刚刚入行时,他们会组建一个10人左右的团队,这其中有一个人承担质检工作,如果不合格,就要员工打回去重做。而数据的质量则决定着大模型的优劣。

数据民工们也并不关心,AI技术又有什么新的分支,他们更在意的是单价,因为这里是计件算工资。

“那会儿单价高的时候,拉一个2D框就有1毛多,我最高的时候干了10多个小时,一天就赚了600多元”,林双回忆道。不过,这不是最高的,一位标注人员称,早期2D拉框的价格最高能达到5毛钱。

拉框是数据标注中常见的一种操作,标注员根据要求对图片中的物体,如车辆、红路灯、障碍物等画框标注。拉框分为2D和3D,后者的价格会更贵一些。

但这种热度并没有持续多少,伴随着越来越多人涌入以及AI行业整体发展的不够顺利,标注一个图片的单价越来越低,林双称现在最低的只有4分钱。

“如果是拉框,行业的平均单价是在0.15元左右,但还是要看项目,如果自己可以接到单,接到一手单的最低要求应该是100个入职员工,那规模挺大,3D的框有可能达到3毛钱一个,不过很少可以有达到5毛的。”

当然,如果你本身具备医疗、金融方面的专业知识,那么单价则会更高。比如,很多医疗大模型会要求标注员有是临床专业,且有相关从业经验。

大部分从业者每个月的收入都不过5000元,其中也不乏少数的幸运儿。杨硕本来在四川经营一家服装店,但疫情影响了他的生意,他在今年转型做大模型数据标注,现在,他每个月有8000元收入,“我是和公司签了合同,交了9500元的加盟费,合同里写着每个月最低收益是7000元。”

究竟谁赚到了钱

阿里、腾讯、字节这样的互联网大厂,以及上汽、领克等车企是数据标注业务分发的源头,想要以最好的价格直接从源头获取订单,数据标注公司们需要具备一定的规模。

一位数据标注公司员工对Tech星球称,他们直接从大厂拿到订单,但是大厂要求他们得有500人,因此他们会选择通过加盟或者子公司的方式来达到人员要求。

二者的区别是加盟适用于初入行的人组建工作室,如果要成立子公司,一般一个区域就只有一家。小白工作室需要收加盟费,2.5万或者3万。子公司是一个区域的独家代理商,需要缴纳5万费用。而他们可以三年以内保证订单的充足,并负责3年内的技术培训,这些工作室或者子公司们组成一个大的工会,几百到几千不等。

上述数据标注公司员工称,大模型的火热再次将数据标注行业推上热潮,现在几乎每天都有人去他们公司拜访。

但事实上,经营一个数据标注公司并不容易。数据标注公司告诉你的是,这个行业前1到2个月比较难做,因为员工需要爬坡期,前期只需要5-8个人就够了,40多岁的阿姨都没有问题的。

稳定是数据标注公司或者工作室最重要的因素。但是Tech星球接触的大部分标注员工往往都因为枯燥无趣在3个月内“光速”离职,新员工并不是马上可以到岗实操,人员流动性大的结果就是数据标注的质量和周期不够稳定。缺钱的宝妈是数据标注工作室最喜欢招纳的人群。

“找兼职肯定不行的,会有空档期,房租和电脑投入了,会亏钱,最好的方式是全员坐班”,开过数据标注工作室的人魏铭向Tech星球介绍。

大部分数据标注公司的回款周期是3个月起步,最多半年,但他们需要以月付的方式给员工工资,这需要一定程度的资金储备,“一个人3500,100个人,3个月就是105万。”

张建曾经加入过一个又200多号员工的工会。第一年,他们赶上行业的爆发期,2D拉框的单价高达5毛,那一年他所在的工会赚了400多万。

但是第二年,行情急转直下。标注的单价变低,员工的流动性更快,空档期增加,再加上两个大项目都没有结算,一整年过去,他们亏了300多万。“老板都说短时间内坚决不碰数据标注”,张建表示,“他们现在正在和上游打官司。”

这是利润微薄的生意。海天瑞声是目前数据标注行业内首家主板上市公司,去年这家公司有2.63亿元营收,利润只有2945万元,净利润率刚刚超过10%。但今年上半年,由于客户数量减少,这家公司便陷入了亏损。

随时可能被替代的“螺丝钉”

依靠着肯尼亚工人蚂蚁搬家式的积累,最终OpenAI的语言对话大模型能力脱颖而出。这些被称为数据民工的普通人支撑起了山姆·奥特曼(OpenAI创始人)的AI梦,但如果不出意外,他们手中的大部分工作,很快就会被自己参与创造的新产品所取代。

在国外,Open AI 前员工于2021年成立的Anthropic今年已经融资51.5亿美元,是其过去两年融资总额的7倍还多。这家公司提供了一种新的方法,可在较少人工参与的情况下,便训练出模型。

今年,AI初创公司refuel推出了一个名为Autolabel的开源工具,可以使用市面上主流的大模型来对数据集进行标注。该公司的测试结果称,Autolabel的标注效率相比人工标注提高了100倍,成本仅为人工成本的1/7。

在国内,一家名为视智未来的公司也在打造标注大模型。他们在接受采访时表示,有些项目已经用GPT交付了,准确率方面达到了80%多,与人工接近。

不过,海天瑞声认为,AI一定不会实现完全的自动化标注,因为机器如果想要持续演进,使其更接近于人类的判断和理解,就一定需要人类作为引导。

几乎所有从事过数据标注的人员,都向Tech星球透露着同一个观点:数据标注是一个没有门槛的工作,只需要你熟练使用电脑即可。

但事实上,如果简单的标注可以用AI来完成,那么人工参与的将是难度更高的数据筛选和标准工作,这也意味着行业的门槛将会不断提高,尤其是ChatGPT、文心一言类的大语言模型。

作为对照,早在ChatGPT走红前,OpenAI就组建十几位博士生来“打标”。而百度在海口的数据标注基地拥有数百名专职大模型数据标注师,标注师的本科率达到100%。

这类大语言模型的特点是,标注员需要具备一定的知识储备和逻辑分析能力。根据《财经十一人》报道,标注师们需要判断问题类型,随后给5个回答分别打分并排序,分数区间为0-5分,如果打分低于3分,还要标注出具体原因,例如“答非所问(0分)”、“严重跑题(1分)”、“存在逻辑问题,存在事实性错误,比例较小给2分”等。

数据标注的另一个热门领域是自动驾驶。据德勤的报告显示,2022年自动驾驶领域的标注需求占整个AI下游应用的38%,预计到2027年,比例将上涨到52%。相较于大语言模型,对于自动驾驶领域的模型而言,那些简单的拉框操作依然有着较为宽松的学历要求。

标注员们是人类从移动互联网时代到人工智能时代的基石,Tech星球接触到的大部分从业者大多不清楚AI将带给他们那些改变,也不知道他们为了AI的发展做出的贡献,他们只是互联网时代的新一代螺丝钉,而且随时可能被替代。

(备注:文中人物皆为化名。)

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-10-09 21:45:01

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

标注员:AI狂飙下的“电子民工”
...—过去满天飞的标注广告中,“无门槛、在家兼职可做、月入过万”等宣传让公众对这一职业感到好奇又不信任。已经在迭代中的数据标注从业者,渴望得到“正名”。 岗位大热,但前景并不明
2024-01-10 16:07:00
数据标注工:训练AI,被AI替代
...:单框价格高3倍,项目量大。一个60~70人的团队,能拿到月入30万的业绩。“现在市场上都是产值(单人每天标注产生的价值)不到百元的项目,以前一天大几百。”一位从业者说。那时
2023-07-19 16:28:00
月入养老金不足200元,农民工养老短板如何补上?
月入养老金不足200元,农民工养老短板如何补上?改革开放以来,由于农村家庭联产承包责任制的实施,大量农村剩余劳动力进入城市,但由于户籍制度改革滞后,进城务工的农民并不能直接转为城
2023-07-31 14:04:00
一家店月入10万,全靠男人的“面子”?看看吧
不少男人涌入商场,只为了花钱洗脸?近年来,基础护肤步骤“洗脸”也“内卷”起来。在各大商业综合体或步行街,都能看到专注面部洗护的“洗脸吧”,洗一次价格低至几十元。与“男士止步”的传
2024-04-06 21:13:00
打胶也能月入4万元,透露了什么社会趋势?
...层建筑安装幕墙。图/新华社做美缝的95后装修工人,也能月入三四万元?据潮新闻报道,年末岁初,跳槽高峰时期,不少年轻人想跳槽一家心仪的公司,升职加薪,但也有年轻人独辟蹊径,中途
2024-01-18 09:32:00
核心要点:90后农村青年正热衷返乡创业。根据农业农村部公布的数据,2022年底中国返乡入乡的创业人员累计达到1120万,他们的创业足迹遍及县城、乡镇和村庄。和浩浩荡荡的创业人潮相
2023-06-11 15:14:00
月入五千,能不能击败95%的人
...了,你在哪个层次?”“中金公司公布最新人均月收入,月入5000元以上就是富人。”“中金数据:月薪五千以下占总人口95%,看完你还焦虑吗?”有人对此表示认可,认为“这才是去掉互
2023-02-14 14:04:00
...虽然你们的工程款数额大,但合同中没有对工程量、工程单价等进行具体约定,如果开庭审理,需要先行通过司法鉴定程序核算工程价款,诉讼周期会比庭前调解程序长很多。你拿到工程款还要给农
2022-12-27 07:28:00
“实习生也月入过万”,这一行业严重缺人
...成,这些岗位平均招聘月薪都突破了2万元。 实习生都能月入过万AI岗位的高薪并非偶然,因为行业正处于快速爆发期,企业纷纷为此不惜重金抢人才。艾媒咨询发布的《2024年中国企业
2025-03-25 08:53:00
更多关于科技的资讯:
12月3日上午,一票跨境电商网购保税进口商品经杭州海关所属义乌海关审核验放后,从义乌保税物流中心发往购买的消费者手中。值得注意的是
2025-12-04 09:42:00
腾讯游戏魔方工作室迎来十五周年,《暗区突围》手游爆料地图更新
12月3日,腾讯游戏魔方工作室迎来十五周年庆。魔方多款游戏主创来到直播现场爆料,为玩家带来产品最新进度,备受玩家关注的《洛克王国》IP新作《洛克王国
2025-12-04 14:20:00
从日常随拍到户外探索 年轻人用手持设备定格热爱
脚踩陆冲板的年轻人手持全景相机,以第三人称视角“跟拍”运动瞬间;旅行博主捕捉下360°无死角的风景,剪辑时通过手动调整视角制作出炫酷转场
2025-12-04 14:20:00
在具身智能竞速加速升温的当下,真实场景的客观评测成为检验机器人模型能力最关键的一环。近日,“具身进化论”在查询最新发布的RoboChallenge测试结果时注意到
2025-12-04 15:20:00
中国移动AI听障康复智能体落地 为2780万听障人士架起沟通桥梁
12月3日是国际残疾人日。当日早间,央视财经频道《第一时间》重磅报道了中国移动自主研发的全国首个AI听障康复智能体——“中移无障碍”
2025-12-04 15:22:00
防沉迷+护安全,墨宝·AI学生机成未成年人用机优选
在数字化设备快速发展的当今,未成年教育正面临着网络沉迷、电子产品使用导致近视等前所未有的挑战。那么,究竟有没有科学、有效且合理的解决方案呢
2025-12-04 15:23:00
当地时间12月3日,国际权威财经媒体英国《银行家》(The Banker)杂志在伦敦揭晓年度银行榜单,中信银行荣膺“2025年中国年度银行”(Bank of the Year China 2025)大奖
2025-12-04 15:37:00
重新定义测序技术 “金标准”! Sequel® II CNDx三代测序仪正式上市
近日,贝瑞基因与PacBio在京举行三代Sequel® II CNDx基因测序仪上市发布会,正式宣布这款基于三代测序技术平台的产品获得国家药品监督管理局批准的医疗器械注册证
2025-12-04 16:38:00
165无限满帧体验,一加 Ace 6T首销到手价2399元起
2025 年 12 月 3 日,一加正式发布「性能旗舰新选择」一加 Ace 6T。作为一加Ace系列全新力作,一加 Ace 6T全球首发搭载第五代骁龙8移动平台
2025-12-04 19:41:00
“质造+智创”领航户外照明赛道
当前,国内户外照明市场呈现明显的区域集群效应,长三角(江浙沪)与珠三角(广东)形成双核引领格局。其中,高杆路灯作为重要细分品类
2025-12-04 22:41:00
南京作为我国软件产业发展的先行区和重要聚集地,产业规模居全国前列。在迈向高质量发展的过程中,软件企业普遍出现研发周期长
2025-12-04 20:11:00
国内首个AI钢管智能检测模型在中油宝世顺公司投入运用
河北新闻网讯(张辉、李少波)“焊缝影像在屏幕如放电影一样一帧接一帧闪过,1分钟能完成4米钢管检测,两分钟能审核1000张检测影像并标注疑似缺陷的位置
2025-12-04 17:15:00
浙江日报义乌12月3日电 (记者 拜喆喆 何贤君 共享联盟·义乌 吴峰宇) 3日,义乌今年第1亿个跨境电商进口订单完成打包
2025-12-04 08:41:00
中国科大新实验终结爱因斯坦与玻尔世纪之辩
大皖新闻讯 大皖新闻记者从中国科学技术大学获悉,该校潘建伟、陆朝阳、陈明城教授等组成的研究团队,利用光镊囚禁的量子基态单原子
2025-12-04 11:03:00
中新经纬12月4日电 “北京市场监管”微信号4日消息,为应对AI合成技术滥用风险,规范电商直播行业秩序,近日,北京市消费者协会(以下简称“北京消协”)联合京东
2025-12-04 11:06:00