我的订阅
科技

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

突破数据墙！27岁华裔MIT辍学创业8年，年化收入逼近10亿

类别：科技发布时间：2024-09-26 13:37:00 来源：新智元

【新智元导读】震惊！就在刚刚，Scale AI创始人Alexandr Wang宣布：公司的年化收入已经达到近10亿美元。OpenAI的年收入，也仅仅是35-45亿美元。数据墙愈渐紧逼的今天，Scale AI早早踩对了风口，如今终于一飞冲天了。

就在刚刚，创业成功的27岁亿万富翁Alexandr Wang宣布——

Scale AI的年化收入，几乎达到了10亿美元！

这个数字，足够震惊整个硅谷的。

这Scale AI是什么来头，能在营收上取得如此惊人的成绩？

原来，它主攻的就是如今AI模型的一大软肋——对数据的巨大需求。

我们正在进入LLM开发的第三阶段。第一阶段是早期的试验，从Transformer到GPT-3 第二阶段是规模扩展第三阶段是创新阶段：除了o1之外，还需要哪些突破性进展才能让我们达到新的proto-AGI范式

Scaling Law的存在意味着，随着模型变大，对数据的需求也呈现指数级增长，越来越多的人担心大模型会耗尽可用数据。

Scale AI的主营业务——做AI模型的「数据工厂」，恰好处于这个风口之上。

如果能攻克「数据墙」这个AI进步的巨大瓶颈，Alexandr Wang理所当然会赚得盆满钵满。

在AI浪潮中，赚得盆满钵满

生意能做这么大，源于Scale AI越做越成功的一项大业务。

在AI生态圈中，为大公司提供基础设施或服务支持的业务，市场需求巨大。

Scale AI做的就是后者——为这些公司提供人工数据标注员。帮AI公司提高LLM的准确性。Meta、谷歌等大公司，都是它的客户。

而且，今年Scale AI的生意越做越红火了。

跟去年同期相比，它今年上半年的销售额增长了近4倍，已经接近4亿美元。

可以肯定地说，Scale AI是从AI热潮中受益最多的私营企业之一。

投资者们当然也看到了这一点。

今年5月，Scale AI以138亿美元的估值，进行了新一轮融资。

投资者包括Accel、Founders Fund、Index Ventures、Thrive Capital和Greenoaks Capital等。

并且，除了亚马逊和Meta之外，Scale AI还吸引了各种各样的新投资者：思科、英特尔、AMD等风险投资部门参与其中，而且很多注资过的公司也回归了，包括英伟达、Coatue、Y Combinator等等。

就在近期，Wang手下的高管团队，再度进行了调整。

首席技术官Arun Murthy将离开公司，而去年离开风投公司Benchmark的前优步高管Jason Droege将加入公司担任首席战略官，直接向Wang汇报。

首席策略官Jason Droege解释自己为什么要加入Scale AI：这让我有机会参与到我一生中技术领域最根本的变革中

在Droege看来，Scale解决了人工智能中最困难的挑战之一：通过数据改进模型。做到这一点需要卓越的人才、复杂的运营和对AI未来发展的强烈愿景。虽然团队迄今已经取得了瞩目成就，但仍处于起步阶段。

2023年上半年开始，公司收入激增

这家成立8年的初创公司，一直负责合同工的招聘和培训，但尚未实现盈利。

然而就在今年上半年，它成功改善了运营的毛利率——每产生1美元收入，只需要花费约1.2美元，而在去年上半年，这一数字为1.5美元。

如今仅考虑业务成本（比如合同工的工资），Scale AI保留的收入只有一半。毛利率这一财务指标，略低于50%。比起2022年上半年约57%的毛利率，这个数字有所下降。

这一水平，大大低于科技投资者对软件公司的期望。

但尽管如此，5月份的融资还是为Scale AI提供了雄厚的资金实力。截至上半年末，公司还有约9.8亿美元的现金。

从去年上半年开始，公司收入就开始激增。因为构建LLM的客户需要很多合同工，通过向聊天机器人提交问题、撰写答案，来训练AI模型。

在给投资者的PPT上，Scale AI自称是「一个人机混合系统，以低成本生产高质量数据」。

根据外媒消息，它还通过一家名为Outlier的子公司，雇佣了数十万个小时工，来进行数据微调。

显然，Scale AI选择聚焦LLM客户，是一种战略转型。

此前，它还有一项类似业务，主要是利用菲律宾和肯尼亚的低成本劳动力，为自动驾驶汽车公司标注数据。但近年来，这项业务的增长已经放缓。

现在，即使雇佣薪酬更高、更专业的合同工，Scale AI的收入也依然能提高，因为它可以将这些更高的成本转移给客户。

当然，现在Scale AI也并非硅谷投资者眼中稳赚不赔的投资。投资者担忧的问题，包括公司较低的毛利率，以及过度依赖少数几个大客户的问题。

天才少年辍学创办独角兽

Scale AI由Alexandr Wang和Lucy Guo于2016年创立，由著名创业孵化器Y Combinator投资。客户包括Meta、微软、英伟达、OpenAI、丰田和哈佛医学院。

2019年，Scale AI成为独角兽。

2022年，Alexandr Wang成为全球最年轻的白手起家的亿万富翁。

Wang于1997年出生于新墨西哥州，父母都是在新墨西哥州洛斯阿拉莫斯国家实验室的物理学家。

高中阶段，他开始通过网络自学编程，开始参加世界级编程大赛，如美国计算机奥林匹克竞赛（USACO）。

17岁，他成为美国知名问答网站Quora的全职码农；18岁，考入麻省理工学院攻读机器学习；在MIT大一刚结束后的暑假，他就和Guo一起创办了Scale，并且拿到了Y Combinator的投资。

Wang跟爸妈说，「这就是我夏天随便玩玩的事。」

Scale AI刚起步时，有些人确实觉得这就是一个笑话，毕竟公司当时只有三名员工。

不过，在不断地融资和发展之下，Scale AI发展飞速，到2021年已经成长为价值73亿美元的独角兽企业，2023年初公司规模也扩展到了700人。

Wang透露，随着企业客户竞相训练生成式AI模型，Scale AI的这方面业务快速增长。

2023年，公司年度经常性收入增加了两倍，预计2024年底将达到14亿美元。

由于Scale AI的惊人成就，Alexandr Wang已经被硅谷公认为「下一个扎克伯格」。

AI模型的「数据工厂」

AI领域公认的三个基本支柱——数据、算法和算力。

算法领域，前有谷歌、微软的大型研究院，后有推出过Sora和GPT系列模型的OpenAI；算力领域有供货全球的英伟达，但在Scale AI还未诞生的2016年，数据领域仍处于空白。

19岁的Alexandr Wang在看到这一点后，做出了辍学创业的决定，「我创办Scale的原因是为了解决人工智能中的数据问题」。

大部分数据都是非结构化的，AI很难直接学习这些数据；而且大型数据集的标注一项资源密集型工作，因此，「数据」被很多人认为是科技领域最辛苦、最卑微的部分。

但Scale AI却在短时间内就获得了巨大成功。他们可以为不同行业的企业客户量身定制数据服务。

在自动驾驶领域，Cruise和Waymo等公司通过摄像头和传感器收集了大量数据，Scale AI将机器学习与「人机回路」监督相结合，管理和标注这些数据。

他们曾经开发的「自治数据引擎」，甚至推动了L4级自动驾驶的发展。

Wang表示，Scale AI将自己定位为整个AI生态的基础设施供应商，构建「数据铸造厂」，而不仅仅是在子公司Remotasks中雇佣大量的合同工进行人工标注。

他强调，来自专家的、包含复杂推理的数据是未来人工智能的必备条件。

传统的数据来源，比如从Reddit等社区的评论中抓取数据存在局限性。Scale AI构建了一些流程，模型先输出一些内容，例如撰写研究论文，在此基础上，人类专家可以改进这些内容，从而改进模型的输出。

「虽然人工智能生成的数据很重要，但想要获得有一定质量和准确性的数据，唯一方法是通过人类专家的验证。」

Alexandr Wang在Scale AI的官网上这样写道，「数据丰富不是默认情况，而是一种选择，它需要汇集工程、运营和AI方面最优秀的人才」。

Scale AI的愿景之一是「数据丰富」，从而将前沿LLM扩展到更大数量级，「为通向AGI铺平道路。在达到GPT-10的过程中，我们不应该受到数据的限制」。

业内盛赞的LLM排行榜更新

Scale AI对业界所做的贡献，不仅是数据标注这么简单。

今年5月，Scale AI重磅推出了全新LLM排行榜——SEAL，开始对前沿模型开展专业性评估。

对于这个榜单，Jim Fan大加赞赏。他认为SEAL是LMSys的非常好的补充和参照，提供公开模型的私密、安全、可信的第三方评估。

对此，Andrej Karpathy也深以为然。

随着OpenAI最强模型——o1的推出，SEAL排行榜也第一时间进行了评测。

除了在高级编程、数学和科学等领域表现出色之外，o1系列也为「prompt engineering」（提示工程）引入了新的变化。

在工具使用和指令跟随方面，o1-preview表现出色。而在编程能力方面，o1-mini夺得榜首，o1-preview紧随其后位居第二。

- 编程排行榜

在SEAL编程排行榜上，o1-mini以1271分的成绩领跑，紧随其后的是o1-preview，得分为1198。

评估数据集使用了1000个提示词，用于测试各种编程任务，涵盖从代码生成到优化和文档创建等多个方面。

过程中，每个模型的响应都会从正确性、性能和可读性三个维度进行评估，综合运用人工审核和代码执行测试的方法。

- 指令跟随排行榜

在对精确指令跟随能力的评估中，o1-preview以87.27 分的成绩领先，超越了知名Claude 3.5 Sonnet和Llama 3.1 405B Instruct。

评估数据集包含1054个跨领域的提示词，涉及文本生成、头脑风暴和教育支持等多个方面。

提示工程的变化

与我们熟悉的GPT、Gemini或Claude等模型相比，o1模型的提示词使用和可操控性明显不同。

根据OpenAI的建议，简单直接的指令有助于充分发挥o1的潜力。

与之前的模型不同，用户应避免要求模型进行思维链推理。他们还指出，提示词中的无关上下文对o1模型的干扰可能比之前的GPT系列更大，因此在检索增强生成（RAG）提示中加入一些示例很重要。

Cognition Labs发现，要求模型「think out loud」（大声思考）实际上会损害性能，而只要求给出最终答案反而会提高性能，因为o1模型无论如何都会产生内部的思维链。他们还指出，冗长或重复的指令会损害性能，而过于具体的指示似乎会影响模型的推理能力。

虽然o1在基准测试中取得了出色的结果，但让它完成你自己的具体任务似乎需要更多努力——它们往往会忽视明确（甚至是强调的）关于如何解决问题的指令。

由此可见，现实世界的提示和基准测试中使用的提示之间，实际上存在着不小的差距：后者旨在只包含明确的、自包含的、最小呈现的问题，没有关于如何解决它们的建议或意见。

需要注意的是，o1-preview响应的延迟，特别是其「首个token的时间」，明显高于GPT-4o。不过，o1-mini用更快的token推理速度弥补了「思考」的时间。

一些实测

- 词汇约束

在官方示例中，o1在臭名昭著的「strawberry这个词中有多少个R？」等「陷阱」任务上，有着不小的改进。

为了验证这一点，我们向o1-preview提出了一个新编写的谜语：

「说出一个拉丁语源的英语形容词，它以相同的字母开头和结尾，总共有十一个字母，并且词中所有元音按字母顺序排列。」

在第一次尝试中，模型成功解决了这个谜语，答案是：sententious。

但如果反复提问同一个，o1却并不能次次做对：

sententious ✅

facetiously ❌

transparent ✅

abstentious ❌

facetiously ❌

- 解码密码

同样令人深刻的，还有一个解码复杂密码的例子。

类似的，我们也尝试了这个提示词的各种变体，包括ROT13密码、Atbash密码、Base64编码、反转字符串等各种组合。

然而，大多数测试都不成功——在7次尝试中，o1-preview只有2次能够解码给出的加密信息（《沙丘》中的「迎恐祷词」（the Litany Against Fear））。

在每个prompt中，o1都被要求从OpenAI给出的示例中推断出一种编码方式。

在以下每个测试中，o1都未能在一次尝试中解码目标消息：

ROT13密码 → 反转字符串 → Base64编码 → 反转字符串

ROT13密码 → Base64编码 → ROT13密码 → 反转字符串

ROT13密码 → Base64编码 → ROT13密码

ROT13密码 → Base64编码 → Atbash密码

ROT13密码 → Base58编码

在第一次尝试中成功解码的两个测试是：

Atbash密码 → Base64编码

ROT13密码 → Base64编码

这里展示了第一个成功的例子——其他测试除了使用的编码不同外，都是相同的：

结论

总结来看，OpenAI的o1模型在推理能力方面都取得了重大突破，在AIME、Codeforces、Scale的SEAL排行榜等关键基准测试中表现出色。

这些结果表明，o1-preview和o1-mini是解决复杂推理问题的强大工具。然而，要充分发挥这些模型的潜力，可能需要比用户习惯的其他模型发布更多的实验和尝试。

以上内容为资讯信息快照，由td.fyun.cc爬虫进行采集并收录，本站未对信息做任何修改，信息内容不代表本站立场。

快照生成时间：2024-09-26 14:45:11

本站信息快照查询为非营利公共服务，如有侵权请联系我们进行删除。

信息原文地址：

更多关于华裔,收入,突破,创业,数据,数据的资讯：

华裔美女高管，凭什么火爆外网？

...开年，全球顶级资管公司贝莱德发布全球投资展望，一位华裔女高管走入大家的视野。她的名字叫李薇，35岁就坐上了贝莱德全球首席投资策略师的位置，已经连续三年代表贝莱德解读全球投资展

2025-01-25 18:15:00

美国华裔女子创业卖饺子，年入450万美元

据CNBC报道 41岁的华裔女子纳迪娅·刘·斯佩尔曼（Nadia Liu Spellman）花费12万_美_元开了一家速冻饺子餐厅

2024-01-20 10:36:00

超越泰勒·斯威夫！30岁华裔成最年轻白手起家女富豪

...，成为全球最年轻的白手起家女性亿万富豪。目前，这位华裔创业者目前身家估值达12.5亿美元，其财富传奇源于她在人工智能领域的早期布局。作为全球仅有的6位40岁以下白手起家女亿万

2025-04-24 12:01:00

河北沧州以赛聚才

...管理系统”在大赛中获得优胜奖。我好了公司的创始人是华裔人工智能专家、博士苟师元和老年病专家吴莉娜。倪建华介绍，苟博士曾担任贝尔实验室、福特公司等企业的算法高级研究员，有多个国

2024-10-18 05:24:00

ETF规模逆势增长总数将突破900只创业板相关ETF份额年

...，2023年前三季度，1325家创业板上市公司，合计实现营业收入2.79万亿元，实现净利润2142.14亿元，展现出强劲的成长韧性

2024-02-03 01:16:00

新西兰人口普查数据公布：近半数华裔从事管理或专业岗位

... 新西兰近日发布最新人口普查结果，数据显示，自称有华裔血统的总人数达到近28万人(279,039人)，相当于新西兰总人口的5

2024-12-04 22:02:00

投资热土创业沃土宜居乐土

...灵红很高兴，老屋“焕新”，村里的环境变好了，自己的收入也提高了。在北斗湖畔的普贡村，“普贡和美”旅居示范项目已正式落地。作为城乡融合型的项目，“普贡和美”旅居示范项目盘活农民

2024-06-18 06:07:00

挪超主力华裔自曝：拒绝到中超踢球，但愿意归化，身价高于侯永永

...归化方式，转而引进性价比高的归化球员，包括有血缘的华裔，这种甚至是不需要额外开支的。目前包括小奥斯卡、塞尔吉尼奥、陈达毅等球员都在归化进行中或者有归化意图。近日，华裔球员郑泽

2025-02-10 09:14:00

华裔小将归化难，一个待遇谈不拢，一个要求确保进国足

...斯4-0大胜贝西克塔斯，本场比赛为阿贾克斯首开记录的是华裔球员菲慈佔·天乐，这也是他个人的欧联杯正赛首球！登场的66分钟里，菲慈佔·天乐完成了两次射门，斩获一粒进球，还创造了

2024-09-28 12:20:00

更多关于科技的资讯：

厦门动漫嘉年华启幕众多热门国漫IP集中参展

厦门动漫嘉年华各项活动精彩纷呈。（记者林铭鸿摄）厦门网讯（厦门日报记者林露虹）展览面积超5万平方米，汇聚众多热门国漫IP

2026-01-01 08:41:00

助力低空应急产业发展——三明市应急管理局引进低空防御项目

东南网1月1日讯 2025年12月30日，由三明市应急管理局引进，南京云麒防务科技有限公司投资的福建鹏鑫智能科技有限公司

2026-01-01 09:33:00

太长高速太原收费站完成智慧化升级

近日，太长高速太原收费站智慧化升级改造全面完成并投入运营。项目以数字化转型为核心，围绕高峰期通行效率低、车辆拥堵等运营痛点

2026-01-01 07:17:00

沈洁任蓟州区代理区长扫码阅读手机版

据“掌上蓟州”微信公众号消息，天津市蓟州区第二届人民代表大会常务委员会第三十五次会议决定：沈洁为天津市蓟州区人民政府代理区长。

2025-12-31 23:10:00

福建省消委会发布元旦消费提示：警惕“伪智能”陷阱科技消费需

东南网12月31日讯（本网记者卢金福）元旦佳节将至，消费市场迎来新一轮热潮。面对促销活动纷至沓来、消费场景多元拓展的新形势

2025-12-31 23:29:00

皖企长鑫科技向上交所递交IPO招股书

大皖新闻讯 2025年12月30日，总部位于合肥的长鑫科技集团股份有限公司（以下简称“长鑫科技”）正式向上海证券交易所递交招股书

2025-12-31 21:33:00

双语视频丨这一年，我们没有走遍世界，但世界，走进了《Glob

大河网讯这一年，我们没有走遍世界，但世界，走进了《Global Talk》。2025年，《Global Talk》结识了来自全球近30个国家和地区的朋友——他们带着各自的故事

2025-12-31 22:33:00

上药控股山东总部携手浪潮智慧建筑打造智慧、绿色医药园区新标杆

近日，上药控股山东总部携手浪潮智慧建筑，构建涵盖16大智能化系统的智慧园区体系，以智慧云平台为中枢推进全要素数字化升级

2025-12-31 22:59:00

石家庄二中新添“AI学伴”，有道AI答疑笔以“引导式答疑”助

河北新闻网讯为推动教育资源均衡发展，让智能科技惠及更多青少年，12月18日，石家庄市“希望工程”事业发展中心、石家庄市青少年发展基金会联合网易有道

2025-12-31 17:18:00

警惕伪智能陷阱科技消费要验真

中国消费者报福州讯（记者张文章）12月31日，福建省消费者权益保护委员会聚焦“科技+消费”核心场景发布消费提示，提醒广大消费者警惕伪智能陷阱

2025-12-31 17:33:00

三亚海旅免税城五周年庆典点燃免税消费热情

中国消费者报海口讯（记者黄劼）2025年12月30日，三亚海旅免税城迎来开业五周年。海旅免税以“High Five 5•五周年狂欢庆典”为主题

2025-12-31 17:33:00

麦当劳中国第4400家LEED认证绿色餐厅落户福州

福州新华都大厦餐厅盛大开业，“开心书屋”全国首发麦当劳中国第4400家LEED认证绿色餐厅落户福州辞旧迎新之际，麦当劳中国第4400家LEED认证绿色餐厅“福州新华都大厦（五四路）餐厅”盛大开业

2025-12-31 17:49:00

“艾白”来了！福州日报社首位机器人员工正式上岗！

“艾白”来了！12月31日，福州日报社首位机器人员工正式上岗！

2025-12-31 17:49:00

嘀嗒出行发布《2025职场顺风车用户画像及体验洞察报告》

河北新闻网讯（记者李春炜）12月31日，嘀嗒出行发布《2025职场顺风车用户画像及体验洞察报告》，基于嘀嗒顺风车大数据和近万名嘀嗒顺风车用户调研

2025-12-31 18:04:00

倒计时1小时！《色彩中国》2026即将开播扫码阅读手机版

2025-12-31 18:56:00

头条订阅服务

突破数据墙！27岁华裔MIT辍学创业8年，年化收入逼近10亿