• 我的订阅
  • 财经

腾讯把 12 亿用户,都变成了免费的「标注民工」

类别:财经 发布时间:2024-08-15 14:33:00 来源:AppSo

你有没有想过,当你在网上进行简单的验证码操作时,其实你已经无意间成为了一名「标注民工」?

昨天晚上,我在登录 QQ 邮箱和 LOL 官网的时候。

发现腾讯的验证码变了。

不再是之前的验证码了,而是变成了一段 Prompt 加六张 AI 生成的图。

腾讯把 12 亿用户,都变成了免费的「标注民工」

右下角赫然写着:

图片由混元 AI 生成。

腾讯,终于把用验证码做标注的手,伸向了他那 12 亿的用户。

拿验证码当标注系统,让用户免费标注,其实在远古时代,就已经不是什么新鲜事了,但是用生成式 AI 来跟验证码做结合,这确实还是我,所看的头一回。

先说说验证码这个东西。

这玩意从最开始发明起,其实只有一个目的,就是为了区分机器和人。

简称「CAPTCHA」,全称就贼长了,「Completely Automated Public Tuning Test to Tell Computers and Humans Apart」

翻译过来是,「全自动区分计算机和人类的图灵测试」。

你看看,图灵测试。

刚开始,有个斯坦福公益验证码系统,reCAPTCHA。

它最成名的项目,就是用验证码来数字化海量的书籍和旧报纸。那时候的 Ocr 真的不咋地,而且很多年前的书和报纸那糊的真的差强人意。

当时,reCAPTCHA 系统会向用户在验证码上,展示两组扭曲的单词,其中前面的一组是计算机已经识别的,另一个是计算机难以识别的。

腾讯把 12 亿用户,都变成了免费的「标注民工」

如果用户正确输入前半部分,那么 reCAPTCHA 就会假设用户输入的后半部分也是正确的,然后把录入结果返回至 reCAPTCHA 的项目主机。

结果返回主机后,主机还会把这个结果再派发给多个用户进行交叉验证,以确保没有不小心或故意输错单词的情况。

他们用这个系统,在十几年里,数字化了几千万的书籍和报纸。

本来一切都挺美好的,然后,Google 下场了,他们把 reCAPTCHA 给收了。

没过多久,就让用户开始识别,Google 街景中,那些难以识别的门牌号了。。。

这其实,就是明晃晃的让你当标注民工,无偿来给Google标注训模型了。

Google 那时候几亿用户,每天验证码会被调用上千万次。

这大概就好像,让几百万个人每人为给你干 5 秒钟活儿,然后一分钱都不给一样,你说这是不是已经,把白嫖玩到极致了。

直到后面,离谱的东西越来越多,你要标注的东西,也越来越多。

比如这些奇奇怪怪非人视角让你选一个 bus 的照片。

腾讯把 12 亿用户,都变成了免费的「标注民工」

当然最离谱最好玩的,得数 15 年的 12306,当时开脚本抢票的太多,12306 的流量压力实在太大,被逼的开启了神迹级的验证码,据说人类首次正确率仅为 8%,得错 3 次以上的人占比有 65%。

这种逆天验证码的题目是这样的。

腾讯把 12 亿用户,都变成了免费的「标注民工」

刘慈欣我不敢打包票,但是范伟我是全认出来了。。

时间走走停停,一眨眼,来到了 2024 年。

为了自己家的混元大模型,腾讯也把手,伸向了验证码。

腾讯把 12 亿用户,都变成了免费的「标注民工」

让我们开始,来做 AI 绘图大模型的标注了。

这部分的标注,其实不是啥图片美学质量的标注,而是对于图片理解和映射的标注。

通俗地讲,就是语义理解。

现在做的,还是最基础最简单的分类,我们标起来,还是挺轻松的。毕竟里面都知道,左上角是鸭子,中间是老虎,左下角是蜜蜂,右下角是赛车。

而那两张白杨树林,其实,你选任意一个,或者选两个,都能过。

比如我这个图:一簇在悬挂花盆在生长的多肉。

其实你会看到有两张都跟多肉有关,而根据定语,一簇,更符合左上角第一张图,右上角那个其实不是一簇是一堆,但是我选了他,依然能过。

而你想把两个都选,你也都能过。

所以这个标注之心啊,一点都不藏着掖着。

但是确实这个做法很有用,比如还是这句 Prompt,真正核心难点是一簇。

用这种方式,对整体的语义理解,确实有非常大的帮助。

而且现在明显还是初期,给的 Prompt 和图,都非常的简单,标注的难度也不高,甚至一些大厂的标注模型直接机标可能都应付的过来。

但是如果下一次,是「一只在清朝宫殿里生长的杜鹃花」呢?

一只、清朝宫殿、杜鹃花。难度直接拉满。

甚至另外几个选项给你的也不是差异这么大的动物汽车啥的,给你的都是菊花、杜鹃花、喇叭花、玫瑰花,来吧你就选吧,加油啊标注民工。

要知道,标注真的很贵的,之前跟国内一家做 AI 绘图大模型的公司聊过,才知道他们标注分为机标和人标,而人标的成本,大概是数据量的十分之一。

也就是你拿出去 3000 万的数据,人工标一次,就得 300 万 RMB 干出去。

而腾讯 12 亿用户,每天验证码起码也是千万的量级,这标注费用,你可以算算这省了多少钱吧。

所以说,大厂在如今还在大数据的时代,优势是真的大。。。

不过这种标注,目前来看还是只能解决语义理解的标注,但是能把这个解决也已经很牛逼了,虽然美学一般,但是语义理解能达到极强,这就是妥妥的国内版 Dalle3。

而 Dalle3 的短板大家肯定也清楚,实在太丑了。

而要标美学表现,难度其实就大很多,真的得找懂设计、懂美学的人来标注。

Midjourney 当年其实就是吃了这波红利。

第一波获得用户,而且获得的还是一大波的有美学背景的专业用户,然后每次你生图的时候给你生成4张图拼一块的一张整图,你还必须选一张你觉得最好的进行提取或优化。

腾讯把 12 亿用户,都变成了免费的「标注民工」

这就是一种强行的数据标注。

所以 Midjourney 在如今的美学表现上一骑绝尘,是因为他们在美学的标注上,做的太好了,而别的家想在这块赶上,基本不可能,因为最高质量的那波用户,基本已经全在 Midjourney 那了。

而腾讯未来想做这件事,其实在我看来,还真是有可能的。

因为你其实看 Midjourney 的路径,核心点就一个:海量的专业用户。

腾讯缺专业用户吗,怎么可能会缺,12 亿用户捏在手上,用户画像做的那么齐全,我想把有设计师背景的用户挑出来,难吗?一点都不难。

我想给挑出来的这些设计师背景的用户推送美学标注的验证码,难吗?也不难。

所以啊,现在在我看来,腾讯的验证码标注,才刚刚向前迈了半步,后面的模型空间,还很大。

唯一问题就是,腾讯内部有点封闭,用户画像数据 PCG 做 QQ 的那边肯定有,但是混元跟 PCG 不是一个事业群,也不知道能不能拿得到。。。

能拿到的话,那就是王炸。

但是不管怎样。

你我都已经,身在其中了。

10 年前,就已经是了。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-08-15 17:45:08

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

手机版腾讯会议app的下载与使用经验
今天介绍安卓手机腾讯会议APP的下载与使用经验,善用新科技,提升生产力!01手机版腾讯会议的下载1.手机浏览器百度搜索腾讯会议,会看到画面十分绚丽的宣传界面。十分绚丽的宣传界面2
2022-12-25 18:08:00
微信提醒警惕仿冒腾讯客服电话:带+86的千万别信
快科技4月28日消息,今日,微信安全中心官微发布提醒,警惕仿冒微信官方客服的诈骗电话。官方称,近期收到境外用户的反馈,称接听到来电显示为+864006700700的电话,对方自称
2025-04-28 19:05:00
微信“扫一扫”药盒直达腾讯健康药箱 超500万用户“扫码”懂用药
...日讯打开微信“扫一扫”扫描药盒上的二维码,即可直达腾讯健康药箱,疾病科普、用药提醒、续方购药等服务“码上”开启。日前,腾讯健康与阿斯利康公布,双方在呼吸哮喘、糖尿病、心血管疾
2024-01-11 17:03:00
线上买车险成消费新趋势 腾讯微保车险保费同比增长70% 2024-12-18
中国消费者报北京讯(记者聂国春)据腾讯微保最新统计,该平台2024年车险业务增速、规模实现双跨越,微保车险主动询价用户量同比增长50%,平台成交车险保费同比增长70%。腾讯微保车
2024-12-18 17:47:00
一个视频会员可以几个人用?我们测了测“爱优腾芒”
...难免会麻烦些。如果你在固定设备上登录,则影响不大。腾讯视频:最多5个设备同时登录但别人用你会员需要先登你的微信或qq腾讯视频的会员有两种,即腾讯视频VIP会员或腾讯视频超级影
2023-01-06 01:00:00
腾讯视频李啦:与其迎合,不如引领
...走过的烂泥坨,到自己手里也能开出遍野的花。5月16日,腾讯视频出品的精品竖屏短剧《重返八零共白首》,就是这样一个“引起舒适”的故事
2025-05-28 23:57:00
腾讯入局,月之暗面估值飙升百亿元?知情人士:只投了一点点
...最新一轮的估值报价已达30亿美金,新入局的投资方包括腾讯、高榕创投等机构,这意味着中国大模型创业公司已经踏入200亿俱乐部。今年2月,月之暗面刚获得了由阿里领投的10亿美元融
2024-05-22 12:10:00
爱奇艺刚被骂,腾讯视频也“多设备登录”直接封号!网友:逼你一人一个VIP
本文转自:北京商报2月13日,#腾讯视频回应多设备登录被封号#的消息引发关注。据报道,网友魏女士反馈称,自己的腾讯视频账号登录了一台平板,三个手机,导致账号被封禁。(账号封禁期间
2023-02-13 17:43:00
在线地图持续进化,BAT技术“鲜”发制人
...;百度地图也发布全新版本,上线“自动驾驶级”导航;腾讯地图推出“全真数字地图”。在技术推新上,三家正面对抗意味十足,似乎谁都想做新技术的领跑者,最大限度覆盖更多用户的需求,争
2022-12-19 10:00:00
更多关于财经的资讯:
聚力金融“五篇大文章”,服务东北亚新格局 交通银行吉林省分行坚持以高质量金融服务赋能外贸高质量发展
8月27日,第十五届中国—东北亚博览会在长春开幕。交通银行吉林省分行携创新产品和服务精彩亮相,充分展示了交通银行业务综合化
2025-09-04 15:46:00
京沪楼市8月份活跃度提升,现存房地产经纪相关企业超百万家
据媒体报道,8月份,在政策优化的推动下,北京、上海楼市的成交表现出一定韧性。其中,北京新房、二手房成交相比7月份均有小幅增长
2025-09-04 16:00:00
北京银行:上半年净资产收益率创近三年同期新低
近日,北京银行发布2025年半年度报告。报告期内,公司实现营业收入362.18亿元,同比增长1.02%;实现归属于母公司股东的净利润150
2025-09-04 16:08:00
浙江杭温铁路联络线工程公司注册成立
近日,浙江杭温铁路联络线工程有限公司成立,法定代表人为陈彬,注册资本为5亿元,经营范围包含:建设工程施工;公共铁路运输
2025-09-04 16:12:00
联创光电成立数智科技公司,含半导体分立器件业务
近日,江西联创数智科技有限公司成立,注册资本1亿元,经营范围包含:光电子器件销售,半导体照明器件销售,通信设备销售,半导体分立器件销售等。企查查股权穿透显示,该公司由联创光电(6
2025-09-04 16:12:00
聚和材料在无锡新设半导体子公司
近日,无锡聚光半导体有限公司成立,注册资本1000万元,经营范围包含:半导体分立器件制造;半导体器件专用设备制造;集成电路制造;电力电子元器件制造等。企查查股权穿透显示,该公司由
2025-09-04 16:12:00
吉林银行长春同志街支行在新民大街开展金融教育活动
金融为民,初心如磐;消保护航,使命在肩。作为扎根春城、服务百姓的金融力量,吉林银行同志街支行始终将“守护消费者权益”视作践行金融初心的重要基石
2025-09-04 16:17:00
平安产险受邀出席湾区金科保险业专场活动,分享AI赋能先进实践
8月14日,由深圳市金融科技协会(以下简称“金科协”)主办的第76期湾区金科(FinTech)沙龙-保险业专场活动在深圳成功举办
2025-09-04 16:18:00
经常HUI企 中银护航——跨境资金集中运营 助力集团国际化布局
鲁网9月4日讯为深入贯彻落实国家关于金融支持实体经济发展的政策方针,提升金融服务质效,中国银行临沂分行始终坚持为广大企业提供专业
2025-09-04 16:20:00
海南农商银行副行长邹燕玲带队赴北京走访重要企业深入交流银企合作与产业发展
消费日报网讯(记者 郑红梅 □ 洪开祥)为密切银企关系,推动授信尽快落地,海南农商银行总行党委委员、副行长邹燕玲日前带队赴北京
2025-09-04 16:22:00
湖北长晟三期投资发展公司成立,注册资本约151亿
近日,湖北长晟三期投资发展有限责任公司成立,注册资本151.2亿元,经营范围包含:自有资金投资的资产管理服务;以自有资金从事投资活动
2025-09-04 16:24:00
雅砻江流域水电开发公司增资至507亿
近日,雅砻江流域水电开发有限公司发生工商变更,注册资本由473亿元增至507亿元。企查查信息显示,该公司成立于1995年,法定代表人为孙文良,由国投电力(600886)、川投能源
2025-09-04 16:24:00
拓维信息成立云智科技公司,含多项AI业务
近日,湖南拓维云智科技有限责任公司成立,注册资本1000万元,经营范围包含:人工智能行业应用系统集成服务;人工智能应用软件开发;人工智能公共数据平台等。企查查股权穿透显示,该公司
2025-09-04 16:24:00
长青集团新设绿能科技公司,含AI软件开发业务
近日,北京源创绿能科技有限公司成立,法定代表人为徐新霞,经营范围包含:人工智能应用软件开发;软件开发;软件销售;生物质能技术服务等。企查查股权穿透显示,该公司由长青集团(0026
2025-09-04 16:24:00
中信戴卡等在金华新设汽车零部件制造公司
近日,戴卡(金华)汽车零部件制造有限公司成立,注册资本2.5亿元,经营范围包含:汽车零部件及配件制造;汽车零部件研发;汽车零部件再制造
2025-09-04 16:36:00