• 我的订阅
  • 科技

大模型创业太累大牛逃回大厂:融资1亿美金捉襟见肘 还胖了30斤

类别:科技 发布时间:2024-11-26 15:30:00 来源:浅语科技

大模型创业太累,又一大牛决定重回大厂。

Yi Tay,曾是Reka AI联合创始人,也曾是谷歌大模型PaLM、UL2、Flan-2、Bard的重要参与者。

大模型创业太累大牛逃回大厂:融资1亿美金捉襟见肘 还胖了30斤

本周是他回到谷歌的第一周,也是他离职创业一年半之后,选择回归老身份的开始。

他将继续担任谷歌DeepMind高级研究员,向谷歌大神、也是他之前的老板Quoc Le汇报。

回顾过去这段创业经历,他表示学到了很多,比如基础设施方面的知识、如何从头开始训练大模型等等。

但与此同时,他也经历了一些不那么好的时刻:

公司费劲筹集的一亿多美金,对于一个不到15个人的团队仍然紧张,还差点卖身自救。

个人层面,他的身心健康受到了很大影响。由于工作强度大和不健康的生活方式,他还长胖了15公斤。

为此他表示:

放弃舒适区并创业对我个人来说真的很可怕。

大牛重回谷歌大厂

去年三月末,他官宣离职谷歌参与创业RekaAI,并担任该公司的首席科学家。

在此之前,他在谷歌大脑工作了3.3年,参与诸多大模型的研究,撰写累计约45篇论文,其中16篇一作,包括UL2、U-PaLM、DSI、Synthesizer、Charformer和Long Range Arena等,约20次产品发布,妥妥大牛一位。

大模型创业太累大牛逃回大厂:融资1亿美金捉襟见肘 还胖了30斤

从技术角度上讲,他坦言学到了很多关于在谷歌没法学到的知识。

比如学会使用Pytorch/GPU 和其他外部基础设施,以成本最优的方式从头构建非常好的模型。

为此他还在个人网站上分享了相关经验:训练模型的首要条件是获取计算能力,但这一过程就好像买彩票。

并非所有硬件都是一样的。不同算力提供商的集群质量差异非常大,以至于要想训练出好的模型需要付出多大的代价,这简直就是在抽签。简而言之,LLM 时代的硬件彩票。 这与在谷歌使用TPU相比,这些GPU的故障率让他大吃一惊。

此外他还吐槽外部代码库的质量远远落后谷歌的质量,这些代码库对大规模编码器-解码器训练的支持非常少。

但这种持续遇到问题持续解决的经验, 并非痛苦反而很有趣,并且最终凭借着自身技术实力也挺了过来。

在创业初期,他们的旗舰模型Reka Core在Lmsys首次亮相,就跻身第7位,公司排名前五,实现了对GPT-4早期版本的超越。

目前他们主要有四个模型,适用于不同的应用场景。

大模型创业太累大牛逃回大厂:融资1亿美金捉襟见肘 还胖了30斤

而真正“打倒”他驱使他离职的,是更为现实的原因。

就公司层面来说,作为初创企业,其资金、算力和人力跟其他实验室相比都要少得多。

就算他们分批筹集了一亿多美金,对于一个不到15人的团队仍然不够。

今年5月Reka AI还被曝出卖身自救,Snowflake正就以超过 10 亿美元收购Reka AI的事宜谈判。

不过现在来看,收购事宜还没有谈成。在Yi Tay宣布新动向后,他们紧急发声,现在公司还在积极招人ing。

大模型创业太累大牛逃回大厂:融资1亿美金捉襟见肘 还胖了30斤

而就他个人来说,这是段非常紧张的时期。尤其刚开始创业的时候妻子怀孕,他不得不同时兼顾两边,由此身心健康受到很大的损害。

并且由于高强度的工作和不健康的生活方式,他长胖了15公斤。

不过他自己也曾透露过自己有睡眠障碍。

大模型创业太累大牛逃回大厂:融资1亿美金捉襟见肘 还胖了30斤

种种原因,他决定重回谷歌,回归到一个研究者的身份。

大模型创业太累大牛逃回大厂:融资1亿美金捉襟见肘 还胖了30斤

在初创企业世界探索了一年半之后,我决定回归我的研究根基。

在分享经历的开始,他写下了这样一句话。

回到谷歌之后,他将探索与大模型相关的研究方向,以高级研究员的身份,向大神Quoc Le汇报。

在博客的最后,他感谢了创业这段时间始终联系的谷歌老朋友。

并且还特地感谢了在新加坡同他共进晚餐的Jeff Dean,并且提醒他Google 很棒。(Doge)

大模型创业太累大牛逃回大厂:融资1亿美金捉襟见肘 还胖了30斤

谷歌老同事:欢迎回来

一些谷歌老同事在底下纷纷表示:Welcome back!感觉像是过了十年。

大模型创业太累大牛逃回大厂:融资1亿美金捉襟见肘 还胖了30斤

值得一提的是,像这种大牛重返大厂并非个例。

今年8月谷歌以25亿美元打包带走了明星AI独角兽Character.AI的核心技术团队,远高于Character.AI 10亿美元的估值。

其中包括两位创始人——Transformer“贡献最大”作者Noam Shazeer和Daniel De Freitas。其中Noam Shazeer出任Gemini联合技术主管。

这样看起来,对于这些大牛来说,大模型创业确实不易,重返大厂确实是个不错的选择,至少钱够算力够、安安心心做研究。

而随着新一轮的洗牌期到来,更多技术大牛朝着科技巨头聚拢,也已经初见端倪。

大模型创业太累大牛逃回大厂:融资1亿美金捉襟见肘 还胖了30斤

责任编辑:若风

文章内容举报

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-11-26 17:45:12

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

AI大牛杨红霞离职创业,曾为字节和阿里大模型研发主力 | Long China 50独家
...ChatGPT在国内卷起了大模型的竞速,大厂组建战队,技术大牛出山,全行业进入了对技术型人才的渴求期。彼时的字节,也开始招兵买马,并快速在智创、搜索、AI Lab组建团队,试
2024-05-24 13:40:00
关于王慧文病情和光年之外,我所了解的情况
...点的核心论据就是光年之外没有拉来预想中的 AI 算法「大牛」。但要注意的是,今天做大模型创业,一个大牛不是做成与否的充要条件,关键是能否组建起一支有战斗力的综合技术、工程、产
2023-06-27 13:51:00
Kimi陷入ofo式处境,杨植麟会是下一个戴威吗?
...信任。单从资本的角度来看,Kimi的牌桌上已经有了多个大厂的身影。进入2024年,杨植麟似乎一直在坐过山车,3月Kimi凭借着长文本能力快速出圈
2024-11-23 11:59:00
AI大牛履新南大副校长!高校人工智能热度高涨,3年9名大厂科学家回归学术
...从字节离职并筹备自己的AI创业项目。去年7月,另一名AI大牛何恺明离开Facebook研究院,加入麻省理工电气工程与计算机科学系。何恺明本科就读于清华大学物理系,博士师从商汤
2024-08-05 09:54:00
美团宣布收购“光年之外”
...局。在大模型火爆之前,王兴就已经很感兴趣。就在各家大厂入局之时,美团也已经在扩张算法团队。这次收购对美团来说,其力量也得到很大补充。现在,正是互相需要。
2023-06-29 18:08:00
张一鸣熬夜看论文 AI博士年薪500万 大模型搅动创业圈
...虽然年薪高达数百万甚至上千万,但看透大公司病的技术大牛们,一个个地离开了大厂体系,自立门户。3月,阿里巴巴技术副总裁贾扬清宣布和团队一起辞职创业,创业方向为AI,公司关注包括
2023-05-09 10:37:00
谷歌 AI 绘画 4 大牛携手创业,天使估值 7 个亿
最近的谷歌像个大漏勺,这不,又有AIGC核心成员联手跑路咯!量子位独家获悉,这回跟谷歌saybyebye的,是文生图核心团队——AI绘画模型 Imagen论文的四位核心作者,出走
2023-03-04 23:21:00
...态大模型的研发。百度、腾讯、阿里、字节跳动等互联网大厂也在“争分夺秒”开发自有大模型。在OpenAI发布GPT4.0后
2023-03-16 09:23:00
百度AI基因明星创业公司,卓世科技破局大模型商业落地
...寻这家企业的大模型商业化落地破局之道。 1、前百度AI大牛们,“集结”卓世科技“现在大家终于开始重点关注大模型如何实现商业模式闭环问题了,PMF模式是否已经跑通,产品是否能
2024-11-20 14:06:00
更多关于科技的资讯:
《2026胡润全球富豪榜》昨发布厦门上榜企业家人数大幅增加字节跳动创始人张一鸣蝉联中国首富,安踏丁世忠仍是厦门首富厦门网讯(厦门日报记者 李晓平)昨日
2026-03-06 08:33:00
厦门“她经济”升温 带动春日消费热潮
各大商场景区纷纷推出优惠活动,鲜花依旧是热卖品项。图为市民在天虹超市选购鲜花。厦门网讯(文/图 厦门日报记者 沈彦彦)“三八”妇女节临近
2026-03-06 08:33:00
【奋进“十五五”·代表委员献良策】张云泉委员:推进算力与智能体技术创新,夯实AI核心技术根基
全国政协委员张云泉。中国网3月6日讯(记者 谢露莹)今年是“十五五”规划开局之年,如何在新一轮科技革命和产业革命加速演进中占先机
2026-03-06 08:48:00
向新向优 河北力量|全国第一!河北算力指数折射发展新动能
全国第一河北算力指数折射发展新动能整理/河北日报记者 米彦泽 制图/喻萍算力是数字经济时代的新型生产力,是人工智能的基石之一
2026-03-06 09:18:00
向新向优 河北力量|覆盖率100%!共享智造赋能107个重点产业集群
覆盖率100%共享智造赋能107个重点产业集群■阅读提示2024年以来,河北省委、省政府审时度势,以“共享智造”为钥,开启县域特色产业跃升之门
2026-03-06 09:18:00
【宅男财经|财眼观两会】全国政协委员、新希望集团董事长刘永好接受中新经纬采访时称,作为民营企业家,最关注的是民营企业的健康
2026-03-06 10:08:00
借力资本市场,聚力燕赵智造。3月7日,河北资本市场大讲堂系列活动第五期将在沧州举办。活动聚焦股权投资关键领域,特邀国内创投领军机构深创投集团核心专家团队
2026-03-06 09:14:00
王冠一摘要:在信息化深入发展的背景下,企业会计工作正面临数据规模扩大、业务流程加速以及管理需求升级等多重变化。以数字技术为核心的会计创新成为推动企业财务治理能力提升的关键途径
2026-03-06 06:44:00
潜入实验室的“最前线”,在最不确定的阶段,为颠覆性的火种提供第一口氧气。——杭州城西科创投资发展有限公司副总经理江天2026年2月3日
2026-03-06 07:14:00
今年2月13日,一家名叫“月境未来”的科技公司在上城区正式成立。你可能没听过这个名字。但两个月前,那款刷爆朋友圈的App——“死了么”
2026-03-06 07:45:00
春节期间,来自贵州的创业者冉伟在杭州拿到了中国数谷·未来数智港首张OPC(One Person Company,一人公司)营业执照
2026-03-06 06:44:00
山东移动莱阳分公司:数字档案 “智” 变记,让民生服务暖到心坎里
胶东在线3月5日讯(通讯员于永真徐冰鑫)“以前查退休档案得跑两三趟,现在手机上点点,半小时就收到电子证明,太方便了!” 家住山东莱阳市的张阿姨
2026-03-05 23:14:00
3月5日,针对近日网络流传阿里巴巴“千问模型核心团队集体离职”“开源策略调整”等不实信息,阿里集团向媒体辟谣表示:1、目前千问模型团队稳定
2026-03-05 22:29:00
中新经纬3月5日电 《政府工作报告》起草组成员、国务院研究室副主任陈昌盛表示,要降低中小企业应用大模型的成本,鼓励地方搞一些算力
2026-03-05 22:19:00
华瑞银行获评上海市银行同业公会2025年度“上海银行业发展研究优秀成果”
近日,上海华瑞银行研究课题《信用风险评估建模中目标表现期选择的实证研究》,获评上海市银行同业公会2025年度“上海银行业发展研究优秀成果”
2026-03-05 17:15:00