• 我的订阅
  • 科技

大模型创业太累大牛逃回大厂:融资1亿美金捉襟见肘 还胖了30斤

类别:科技 发布时间:2024-11-26 15:30:00 来源:浅语科技

大模型创业太累,又一大牛决定重回大厂。

Yi Tay,曾是Reka AI联合创始人,也曾是谷歌大模型PaLM、UL2、Flan-2、Bard的重要参与者。

大模型创业太累大牛逃回大厂:融资1亿美金捉襟见肘 还胖了30斤

本周是他回到谷歌的第一周,也是他离职创业一年半之后,选择回归老身份的开始。

他将继续担任谷歌DeepMind高级研究员,向谷歌大神、也是他之前的老板Quoc Le汇报。

回顾过去这段创业经历,他表示学到了很多,比如基础设施方面的知识、如何从头开始训练大模型等等。

但与此同时,他也经历了一些不那么好的时刻:

公司费劲筹集的一亿多美金,对于一个不到15个人的团队仍然紧张,还差点卖身自救。

个人层面,他的身心健康受到了很大影响。由于工作强度大和不健康的生活方式,他还长胖了15公斤。

为此他表示:

放弃舒适区并创业对我个人来说真的很可怕。

大牛重回谷歌大厂

去年三月末,他官宣离职谷歌参与创业RekaAI,并担任该公司的首席科学家。

在此之前,他在谷歌大脑工作了3.3年,参与诸多大模型的研究,撰写累计约45篇论文,其中16篇一作,包括UL2、U-PaLM、DSI、Synthesizer、Charformer和Long Range Arena等,约20次产品发布,妥妥大牛一位。

大模型创业太累大牛逃回大厂:融资1亿美金捉襟见肘 还胖了30斤

从技术角度上讲,他坦言学到了很多关于在谷歌没法学到的知识。

比如学会使用Pytorch/GPU 和其他外部基础设施,以成本最优的方式从头构建非常好的模型。

为此他还在个人网站上分享了相关经验:训练模型的首要条件是获取计算能力,但这一过程就好像买彩票。

并非所有硬件都是一样的。不同算力提供商的集群质量差异非常大,以至于要想训练出好的模型需要付出多大的代价,这简直就是在抽签。简而言之,LLM 时代的硬件彩票。 这与在谷歌使用TPU相比,这些GPU的故障率让他大吃一惊。

此外他还吐槽外部代码库的质量远远落后谷歌的质量,这些代码库对大规模编码器-解码器训练的支持非常少。

但这种持续遇到问题持续解决的经验, 并非痛苦反而很有趣,并且最终凭借着自身技术实力也挺了过来。

在创业初期,他们的旗舰模型Reka Core在Lmsys首次亮相,就跻身第7位,公司排名前五,实现了对GPT-4早期版本的超越。

目前他们主要有四个模型,适用于不同的应用场景。

大模型创业太累大牛逃回大厂:融资1亿美金捉襟见肘 还胖了30斤

而真正“打倒”他驱使他离职的,是更为现实的原因。

就公司层面来说,作为初创企业,其资金、算力和人力跟其他实验室相比都要少得多。

就算他们分批筹集了一亿多美金,对于一个不到15人的团队仍然不够。

今年5月Reka AI还被曝出卖身自救,Snowflake正就以超过 10 亿美元收购Reka AI的事宜谈判。

不过现在来看,收购事宜还没有谈成。在Yi Tay宣布新动向后,他们紧急发声,现在公司还在积极招人ing。

大模型创业太累大牛逃回大厂:融资1亿美金捉襟见肘 还胖了30斤

而就他个人来说,这是段非常紧张的时期。尤其刚开始创业的时候妻子怀孕,他不得不同时兼顾两边,由此身心健康受到很大的损害。

并且由于高强度的工作和不健康的生活方式,他长胖了15公斤。

不过他自己也曾透露过自己有睡眠障碍。

大模型创业太累大牛逃回大厂:融资1亿美金捉襟见肘 还胖了30斤

种种原因,他决定重回谷歌,回归到一个研究者的身份。

大模型创业太累大牛逃回大厂:融资1亿美金捉襟见肘 还胖了30斤

在初创企业世界探索了一年半之后,我决定回归我的研究根基。

在分享经历的开始,他写下了这样一句话。

回到谷歌之后,他将探索与大模型相关的研究方向,以高级研究员的身份,向大神Quoc Le汇报。

在博客的最后,他感谢了创业这段时间始终联系的谷歌老朋友。

并且还特地感谢了在新加坡同他共进晚餐的Jeff Dean,并且提醒他Google 很棒。(Doge)

大模型创业太累大牛逃回大厂:融资1亿美金捉襟见肘 还胖了30斤

谷歌老同事:欢迎回来

一些谷歌老同事在底下纷纷表示:Welcome back!感觉像是过了十年。

大模型创业太累大牛逃回大厂:融资1亿美金捉襟见肘 还胖了30斤

值得一提的是,像这种大牛重返大厂并非个例。

今年8月谷歌以25亿美元打包带走了明星AI独角兽Character.AI的核心技术团队,远高于Character.AI 10亿美元的估值。

其中包括两位创始人——Transformer“贡献最大”作者Noam Shazeer和Daniel De Freitas。其中Noam Shazeer出任Gemini联合技术主管。

这样看起来,对于这些大牛来说,大模型创业确实不易,重返大厂确实是个不错的选择,至少钱够算力够、安安心心做研究。

而随着新一轮的洗牌期到来,更多技术大牛朝着科技巨头聚拢,也已经初见端倪。

大模型创业太累大牛逃回大厂:融资1亿美金捉襟见肘 还胖了30斤

责任编辑:若风

文章内容举报

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-11-26 17:45:12

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

AI大牛杨红霞离职创业,曾为字节和阿里大模型研发主力 | Long China 50独家
...ChatGPT在国内卷起了大模型的竞速,大厂组建战队,技术大牛出山,全行业进入了对技术型人才的渴求期。彼时的字节,也开始招兵买马,并快速在智创、搜索、AI Lab组建团队,试
2024-05-24 13:40:00
关于王慧文病情和光年之外,我所了解的情况
...点的核心论据就是光年之外没有拉来预想中的 AI 算法「大牛」。但要注意的是,今天做大模型创业,一个大牛不是做成与否的充要条件,关键是能否组建起一支有战斗力的综合技术、工程、产
2023-06-27 13:51:00
Kimi陷入ofo式处境,杨植麟会是下一个戴威吗?
...信任。单从资本的角度来看,Kimi的牌桌上已经有了多个大厂的身影。进入2024年,杨植麟似乎一直在坐过山车,3月Kimi凭借着长文本能力快速出圈
2024-11-23 11:59:00
AI大牛履新南大副校长!高校人工智能热度高涨,3年9名大厂科学家回归学术
...从字节离职并筹备自己的AI创业项目。去年7月,另一名AI大牛何恺明离开Facebook研究院,加入麻省理工电气工程与计算机科学系。何恺明本科就读于清华大学物理系,博士师从商汤
2024-08-05 09:54:00
美团宣布收购“光年之外”
...局。在大模型火爆之前,王兴就已经很感兴趣。就在各家大厂入局之时,美团也已经在扩张算法团队。这次收购对美团来说,其力量也得到很大补充。现在,正是互相需要。
2023-06-29 18:08:00
张一鸣熬夜看论文 AI博士年薪500万 大模型搅动创业圈
...虽然年薪高达数百万甚至上千万,但看透大公司病的技术大牛们,一个个地离开了大厂体系,自立门户。3月,阿里巴巴技术副总裁贾扬清宣布和团队一起辞职创业,创业方向为AI,公司关注包括
2023-05-09 10:37:00
谷歌 AI 绘画 4 大牛携手创业,天使估值 7 个亿
最近的谷歌像个大漏勺,这不,又有AIGC核心成员联手跑路咯!量子位独家获悉,这回跟谷歌saybyebye的,是文生图核心团队——AI绘画模型 Imagen论文的四位核心作者,出走
2023-03-04 23:21:00
...态大模型的研发。百度、腾讯、阿里、字节跳动等互联网大厂也在“争分夺秒”开发自有大模型。在OpenAI发布GPT4.0后
2023-03-16 09:23:00
百度AI基因明星创业公司,卓世科技破局大模型商业落地
...寻这家企业的大模型商业化落地破局之道。 1、前百度AI大牛们,“集结”卓世科技“现在大家终于开始重点关注大模型如何实现商业模式闭环问题了,PMF模式是否已经跑通,产品是否能
2024-11-20 14:06:00
更多关于科技的资讯:
内功修炼+市场开拓 河钢张宣科技镀锌产线强势创效
河北新闻网讯(董佳倩)近日,河钢集团张宣科技传来捷报,其镀锌产线凭借“内功修炼+市场开拓”实现经营创效。9月份,该公司镀锌丝产品销量环比增长77%
2025-10-27 18:01:00
全球合同管理系统市场正以15.5%的年复合增长率狂奔,443.9亿元的庞大市场背后,是AI技术对传统合同管理方式的彻底颠覆
2025-10-27 17:36:00
鲁网10月27日讯10月24日,记者在青岛市崂山区委宣传部召开的媒体见面会上获悉,近年来,青岛市崂山区以前瞻布局推动虚拟现实产业高质量发展
2025-10-27 16:24:00
京东11.11直播技术全面升级,立影3D技术、JoyAI大模型重构沉浸式购物体验
随着京东 11.11 大促的火热进行,京东直播再度升级技术布局,以 “立影 3D 技术”“JoyAI大模型”等创新技术
2025-10-27 15:39:00
电机能效提升领域再添标杆!25 项产品 / 技术入选全国节能降碳示范名单
为深入贯彻国家 “双碳” 战略,加快电机领域节能降碳技术创新与成果转化,中国电子节能技术协会此前启动 “全国节能降碳示范产品 / 技术推荐” 征集工作
2025-10-27 15:42:00
吉刻现场|硬核登场!吉林选手角逐第三届全国博士后创新创业大赛
10月26日,第三届全国博士后创新创业大赛在福建泉州(晋江)开幕。本届大赛,吉林省派出23个项目团队组成的参赛队伍角逐三个大赛道
2025-10-27 14:09:00
厦心医院实现手术\
厦门网讯(厦门日报记者 楚燕 通讯员 许良友 付磊 刘云芳)10月23日,一项载入医学史册的创新手术在厦门大学附属心血管病医院(以下简称“厦心医院”)圆满完成
2025-10-27 08:11:00
新闻纵深·解码钢铁大模型|邯钢构建六大领域全链条智能大模型:“聪明大脑”带来极致能效
邯钢构建六大领域全链条智能大模型“聪明大脑”带来极致能效编者按当钢铁遇上人工智能,一场“智变”正悄然发生。为生动展现人工智能为钢铁产业生产
2025-10-27 08:12:00
第十一届NJSD软件开发者会议在软件谷举行江苏规模最大,1400名软件工程师在宁“聚会”南报网讯(记者于洁尘通讯员林园园)70多位业界“大咖”登台演讲
2025-10-27 08:20:00
南报网讯(通讯员郑瑞于品华杨刚记者徐宁)近日,南化公司自主研发的橡胶防老剂中间产品RT培司(4-氨基二苯胺)除盐技术取得突破
2025-10-27 08:21:00
南报网讯(通讯员杨淏涵记者张希)日前,南京林业大学与乐惠国际南京基地签署《校企全面合作协议》《产业研究院共建协议》,全面开启校企战略合作
2025-10-27 08:22:00
高效,是都市青年的通行证:InstaShake以“一杯营养”重塑健康生活方式 —— 新锐品牌以“零添加、无预制、纯手工”的坚守,为上海都市人群注入鲜活能量
在生活节奏不断加速的上海,追求健康与追求效率似乎成为一道单选题。然而,新锐健康饮品品牌InstaShake正以其独特的“零添加
2025-10-27 08:39:00
济宁银行锚定金融“五篇大文章” 多维发力赋能区域经济高质量发展
鲁网10月27日讯近年来,济宁银行围绕做好金融“五篇大文章”,深入洞察科技企业、中小微企业以及重点产业链金融需求,以产品创新破解融资难题
2025-10-27 11:07:00
汪昌莲据《经济日报》报道,“两三元就能买品牌饼干薯片”“上百种散装零食任意挑选”……从县城到乡镇,在街角与量贩零食店不期而遇已成逛街“标配”
2025-10-27 11:10:00
受冷空气影响,气温先降后升,27日早晨气温较低。26日夜间到27日白天晴间多云,北风转南风2~3级,最低气温市区4℃左右
2025-10-27 11:28:00