• 我的订阅
  • 科技

大模型创业太累大牛逃回大厂:融资1亿美金捉襟见肘 还胖了30斤

类别:科技 发布时间:2024-11-26 15:30:00 来源:浅语科技

大模型创业太累,又一大牛决定重回大厂。

Yi Tay,曾是Reka AI联合创始人,也曾是谷歌大模型PaLM、UL2、Flan-2、Bard的重要参与者。

大模型创业太累大牛逃回大厂:融资1亿美金捉襟见肘 还胖了30斤

本周是他回到谷歌的第一周,也是他离职创业一年半之后,选择回归老身份的开始。

他将继续担任谷歌DeepMind高级研究员,向谷歌大神、也是他之前的老板Quoc Le汇报。

回顾过去这段创业经历,他表示学到了很多,比如基础设施方面的知识、如何从头开始训练大模型等等。

但与此同时,他也经历了一些不那么好的时刻:

公司费劲筹集的一亿多美金,对于一个不到15个人的团队仍然紧张,还差点卖身自救。

个人层面,他的身心健康受到了很大影响。由于工作强度大和不健康的生活方式,他还长胖了15公斤。

为此他表示:

放弃舒适区并创业对我个人来说真的很可怕。

大牛重回谷歌大厂

去年三月末,他官宣离职谷歌参与创业RekaAI,并担任该公司的首席科学家。

在此之前,他在谷歌大脑工作了3.3年,参与诸多大模型的研究,撰写累计约45篇论文,其中16篇一作,包括UL2、U-PaLM、DSI、Synthesizer、Charformer和Long Range Arena等,约20次产品发布,妥妥大牛一位。

大模型创业太累大牛逃回大厂:融资1亿美金捉襟见肘 还胖了30斤

从技术角度上讲,他坦言学到了很多关于在谷歌没法学到的知识。

比如学会使用Pytorch/GPU 和其他外部基础设施,以成本最优的方式从头构建非常好的模型。

为此他还在个人网站上分享了相关经验:训练模型的首要条件是获取计算能力,但这一过程就好像买彩票。

并非所有硬件都是一样的。不同算力提供商的集群质量差异非常大,以至于要想训练出好的模型需要付出多大的代价,这简直就是在抽签。简而言之,LLM 时代的硬件彩票。 这与在谷歌使用TPU相比,这些GPU的故障率让他大吃一惊。

此外他还吐槽外部代码库的质量远远落后谷歌的质量,这些代码库对大规模编码器-解码器训练的支持非常少。

但这种持续遇到问题持续解决的经验, 并非痛苦反而很有趣,并且最终凭借着自身技术实力也挺了过来。

在创业初期,他们的旗舰模型Reka Core在Lmsys首次亮相,就跻身第7位,公司排名前五,实现了对GPT-4早期版本的超越。

目前他们主要有四个模型,适用于不同的应用场景。

大模型创业太累大牛逃回大厂:融资1亿美金捉襟见肘 还胖了30斤

而真正“打倒”他驱使他离职的,是更为现实的原因。

就公司层面来说,作为初创企业,其资金、算力和人力跟其他实验室相比都要少得多。

就算他们分批筹集了一亿多美金,对于一个不到15人的团队仍然不够。

今年5月Reka AI还被曝出卖身自救,Snowflake正就以超过 10 亿美元收购Reka AI的事宜谈判。

不过现在来看,收购事宜还没有谈成。在Yi Tay宣布新动向后,他们紧急发声,现在公司还在积极招人ing。

大模型创业太累大牛逃回大厂:融资1亿美金捉襟见肘 还胖了30斤

而就他个人来说,这是段非常紧张的时期。尤其刚开始创业的时候妻子怀孕,他不得不同时兼顾两边,由此身心健康受到很大的损害。

并且由于高强度的工作和不健康的生活方式,他长胖了15公斤。

不过他自己也曾透露过自己有睡眠障碍。

大模型创业太累大牛逃回大厂:融资1亿美金捉襟见肘 还胖了30斤

种种原因,他决定重回谷歌,回归到一个研究者的身份。

大模型创业太累大牛逃回大厂:融资1亿美金捉襟见肘 还胖了30斤

在初创企业世界探索了一年半之后,我决定回归我的研究根基。

在分享经历的开始,他写下了这样一句话。

回到谷歌之后,他将探索与大模型相关的研究方向,以高级研究员的身份,向大神Quoc Le汇报。

在博客的最后,他感谢了创业这段时间始终联系的谷歌老朋友。

并且还特地感谢了在新加坡同他共进晚餐的Jeff Dean,并且提醒他Google 很棒。(Doge)

大模型创业太累大牛逃回大厂:融资1亿美金捉襟见肘 还胖了30斤

谷歌老同事:欢迎回来

一些谷歌老同事在底下纷纷表示:Welcome back!感觉像是过了十年。

大模型创业太累大牛逃回大厂:融资1亿美金捉襟见肘 还胖了30斤

值得一提的是,像这种大牛重返大厂并非个例。

今年8月谷歌以25亿美元打包带走了明星AI独角兽Character.AI的核心技术团队,远高于Character.AI 10亿美元的估值。

其中包括两位创始人——Transformer“贡献最大”作者Noam Shazeer和Daniel De Freitas。其中Noam Shazeer出任Gemini联合技术主管。

这样看起来,对于这些大牛来说,大模型创业确实不易,重返大厂确实是个不错的选择,至少钱够算力够、安安心心做研究。

而随着新一轮的洗牌期到来,更多技术大牛朝着科技巨头聚拢,也已经初见端倪。

大模型创业太累大牛逃回大厂:融资1亿美金捉襟见肘 还胖了30斤

责任编辑:若风

文章内容举报

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-11-26 17:45:12

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

AI大牛杨红霞离职创业,曾为字节和阿里大模型研发主力 | Long China 50独家
...ChatGPT在国内卷起了大模型的竞速,大厂组建战队,技术大牛出山,全行业进入了对技术型人才的渴求期。彼时的字节,也开始招兵买马,并快速在智创、搜索、AI Lab组建团队,试
2024-05-24 13:40:00
关于王慧文病情和光年之外,我所了解的情况
...点的核心论据就是光年之外没有拉来预想中的 AI 算法「大牛」。但要注意的是,今天做大模型创业,一个大牛不是做成与否的充要条件,关键是能否组建起一支有战斗力的综合技术、工程、产
2023-06-27 13:51:00
Kimi陷入ofo式处境,杨植麟会是下一个戴威吗?
...信任。单从资本的角度来看,Kimi的牌桌上已经有了多个大厂的身影。进入2024年,杨植麟似乎一直在坐过山车,3月Kimi凭借着长文本能力快速出圈
2024-11-23 11:59:00
AI大牛履新南大副校长!高校人工智能热度高涨,3年9名大厂科学家回归学术
...从字节离职并筹备自己的AI创业项目。去年7月,另一名AI大牛何恺明离开Facebook研究院,加入麻省理工电气工程与计算机科学系。何恺明本科就读于清华大学物理系,博士师从商汤
2024-08-05 09:54:00
美团宣布收购“光年之外”
...局。在大模型火爆之前,王兴就已经很感兴趣。就在各家大厂入局之时,美团也已经在扩张算法团队。这次收购对美团来说,其力量也得到很大补充。现在,正是互相需要。
2023-06-29 18:08:00
张一鸣熬夜看论文 AI博士年薪500万 大模型搅动创业圈
...虽然年薪高达数百万甚至上千万,但看透大公司病的技术大牛们,一个个地离开了大厂体系,自立门户。3月,阿里巴巴技术副总裁贾扬清宣布和团队一起辞职创业,创业方向为AI,公司关注包括
2023-05-09 10:37:00
谷歌 AI 绘画 4 大牛携手创业,天使估值 7 个亿
最近的谷歌像个大漏勺,这不,又有AIGC核心成员联手跑路咯!量子位独家获悉,这回跟谷歌saybyebye的,是文生图核心团队——AI绘画模型 Imagen论文的四位核心作者,出走
2023-03-04 23:21:00
...态大模型的研发。百度、腾讯、阿里、字节跳动等互联网大厂也在“争分夺秒”开发自有大模型。在OpenAI发布GPT4.0后
2023-03-16 09:23:00
百度AI基因明星创业公司,卓世科技破局大模型商业落地
...寻这家企业的大模型商业化落地破局之道。 1、前百度AI大牛们,“集结”卓世科技“现在大家终于开始重点关注大模型如何实现商业模式闭环问题了,PMF模式是否已经跑通,产品是否能
2024-11-20 14:06:00
更多关于科技的资讯:
11月17日从中北高新区获悉,山西中北测控科技有限公司自主研制生产的加装测量存储系统圆满完成航空航天领域使用场景验证,各项性能指标均达到行业领先水平
2025-11-18 08:20:00
烟台工程职业技术学院成功入选国家级“IITC工信人才AI实训云平台”首批应用院校
鲁网11月18日讯近日,工业和信息化部人才交流中心公布了“IITC工信人才AI实训云平台”首批应用院校名单,烟台工程职业技术学院凭借在数字化基础设施与产教融合方面的深厚积淀
2025-11-18 15:49:00
OPPO Reno15 系列正式发布,潮流实况玩法“超出圈”
2025年11月17日,成都——OPPO正式发布全新一代Reno15系列手机。作为潮流与实况照片引领者,Reno15系列行业首发全息光刻工艺
2025-11-18 15:54:00
中国工程院院士邬贺铨、郑纬民点赞阿里千问APP:坚持走专业严谨的路线 期待中国AI走向世界舞台中心
11月18日消息,阿里巴巴千问APP近日开启公测,接入全球性能第一的开源模型Qwen3并免费开放。两位中国工程院院士就此分别接受了媒体采访
2025-11-18 16:57:00
摘要:数字化浪潮为以“身体体悟”为核心的太极拳传承带来了范式性变革。本研究采用质性研究方法,以“虚”与“实”这一对源自太极拳本身的核心哲学概念为理论透镜
2025-11-18 17:40:00
【宅男财经|专家面对面】据央视财经综合多家外媒报道,美国苹果公司首席执行官蒂姆·库克有可能最早于明年卸任,现任公司硬件工程高级副总裁特努斯被普遍视为最有可能的继任者
2025-11-18 17:48:00
埃尔韦·朗斯兰:杨佴旻,多彩水墨的艺术大师
杨佴旻是一位能够把千年传统与炫目现代性对比共存的画家。作为多彩水墨绘画的领军人物,他将古老技法转化为一种极具现代感的绘画语言
2025-11-18 17:51:00
河北新闻网讯(杨自立、田海颖)近日,廊坊市科技局公布2025年度市级科技企业孵化器认定和众创空间备案名单,廊坊开发区润泽人工智能产业孵化器
2025-11-18 18:43:00
11月18日,记者从尖草坪区了解到,在尖草坪区科技局的“牵线”下,中北大学的专家教授组团走进太原响臻云信息工程有限公司
2025-11-18 19:28:00
破解“AI+智造”人才难题,燕京理工学院这场论坛汇聚产学智慧
河北新闻网讯(杜啸飞)11月7日至8日,燕京理工学院举办第六届智能制造技术发展论坛暨“AI+智造”创新融合与人才培养主题论坛
2025-11-18 18:40:00
2025年“福满榕城 奋勇争先”短视频征集展播——《苍霞变形记丨“人民之城”的“幸福密码”》。
2025-11-18 21:37:00
2025青岛虚拟现实创新大会要来:北航青岛研究院以科创助推产业跃升2.0时代
鲁网11月18日讯一副简约的框架眼镜,镜片后可能隐藏着快速滚动的信息流;一间平平无奇的房间,戴上头显后,就能摇身变为绚丽仙境……当科幻电影中的沉浸式场景逐渐成为现实
2025-11-18 15:45:00
大皖新闻讯 11月18日,记者从合肥市政府新闻办召开的新闻发布会获悉,近年来,合肥市围绕科技创新与产业升级需求,大胆改革科技金融政策机制
2025-11-18 15:44:00
AI赋能千行百业一线故事(十六):数智驱动,唤醒高校“沉睡”的专利
数智驱动,唤醒高校“沉睡”的专利——AI赋能千行百业一线故事(十六)10月24日,邯郸职业技术学院知识产权学院工作人员演示AI+专利转化运用生态服务平台
2025-11-18 08:42:00