• 我的订阅
  • 科技

大模型创业太累大牛逃回大厂:融资1亿美金捉襟见肘 还胖了30斤

类别:科技 发布时间:2024-11-26 15:30:00 来源:浅语科技

大模型创业太累,又一大牛决定重回大厂。

Yi Tay,曾是Reka AI联合创始人,也曾是谷歌大模型PaLM、UL2、Flan-2、Bard的重要参与者。

大模型创业太累大牛逃回大厂:融资1亿美金捉襟见肘 还胖了30斤

本周是他回到谷歌的第一周,也是他离职创业一年半之后,选择回归老身份的开始。

他将继续担任谷歌DeepMind高级研究员,向谷歌大神、也是他之前的老板Quoc Le汇报。

回顾过去这段创业经历,他表示学到了很多,比如基础设施方面的知识、如何从头开始训练大模型等等。

但与此同时,他也经历了一些不那么好的时刻:

公司费劲筹集的一亿多美金,对于一个不到15个人的团队仍然紧张,还差点卖身自救。

个人层面,他的身心健康受到了很大影响。由于工作强度大和不健康的生活方式,他还长胖了15公斤。

为此他表示:

放弃舒适区并创业对我个人来说真的很可怕。

大牛重回谷歌大厂

去年三月末,他官宣离职谷歌参与创业RekaAI,并担任该公司的首席科学家。

在此之前,他在谷歌大脑工作了3.3年,参与诸多大模型的研究,撰写累计约45篇论文,其中16篇一作,包括UL2、U-PaLM、DSI、Synthesizer、Charformer和Long Range Arena等,约20次产品发布,妥妥大牛一位。

大模型创业太累大牛逃回大厂:融资1亿美金捉襟见肘 还胖了30斤

从技术角度上讲,他坦言学到了很多关于在谷歌没法学到的知识。

比如学会使用Pytorch/GPU 和其他外部基础设施,以成本最优的方式从头构建非常好的模型。

为此他还在个人网站上分享了相关经验:训练模型的首要条件是获取计算能力,但这一过程就好像买彩票。

并非所有硬件都是一样的。不同算力提供商的集群质量差异非常大,以至于要想训练出好的模型需要付出多大的代价,这简直就是在抽签。简而言之,LLM 时代的硬件彩票。 这与在谷歌使用TPU相比,这些GPU的故障率让他大吃一惊。

此外他还吐槽外部代码库的质量远远落后谷歌的质量,这些代码库对大规模编码器-解码器训练的支持非常少。

但这种持续遇到问题持续解决的经验, 并非痛苦反而很有趣,并且最终凭借着自身技术实力也挺了过来。

在创业初期,他们的旗舰模型Reka Core在Lmsys首次亮相,就跻身第7位,公司排名前五,实现了对GPT-4早期版本的超越。

目前他们主要有四个模型,适用于不同的应用场景。

大模型创业太累大牛逃回大厂:融资1亿美金捉襟见肘 还胖了30斤

而真正“打倒”他驱使他离职的,是更为现实的原因。

就公司层面来说,作为初创企业,其资金、算力和人力跟其他实验室相比都要少得多。

就算他们分批筹集了一亿多美金,对于一个不到15人的团队仍然不够。

今年5月Reka AI还被曝出卖身自救,Snowflake正就以超过 10 亿美元收购Reka AI的事宜谈判。

不过现在来看,收购事宜还没有谈成。在Yi Tay宣布新动向后,他们紧急发声,现在公司还在积极招人ing。

大模型创业太累大牛逃回大厂:融资1亿美金捉襟见肘 还胖了30斤

而就他个人来说,这是段非常紧张的时期。尤其刚开始创业的时候妻子怀孕,他不得不同时兼顾两边,由此身心健康受到很大的损害。

并且由于高强度的工作和不健康的生活方式,他长胖了15公斤。

不过他自己也曾透露过自己有睡眠障碍。

大模型创业太累大牛逃回大厂:融资1亿美金捉襟见肘 还胖了30斤

种种原因,他决定重回谷歌,回归到一个研究者的身份。

大模型创业太累大牛逃回大厂:融资1亿美金捉襟见肘 还胖了30斤

在初创企业世界探索了一年半之后,我决定回归我的研究根基。

在分享经历的开始,他写下了这样一句话。

回到谷歌之后,他将探索与大模型相关的研究方向,以高级研究员的身份,向大神Quoc Le汇报。

在博客的最后,他感谢了创业这段时间始终联系的谷歌老朋友。

并且还特地感谢了在新加坡同他共进晚餐的Jeff Dean,并且提醒他Google 很棒。(Doge)

大模型创业太累大牛逃回大厂:融资1亿美金捉襟见肘 还胖了30斤

谷歌老同事:欢迎回来

一些谷歌老同事在底下纷纷表示:Welcome back!感觉像是过了十年。

大模型创业太累大牛逃回大厂:融资1亿美金捉襟见肘 还胖了30斤

值得一提的是,像这种大牛重返大厂并非个例。

今年8月谷歌以25亿美元打包带走了明星AI独角兽Character.AI的核心技术团队,远高于Character.AI 10亿美元的估值。

其中包括两位创始人——Transformer“贡献最大”作者Noam Shazeer和Daniel De Freitas。其中Noam Shazeer出任Gemini联合技术主管。

这样看起来,对于这些大牛来说,大模型创业确实不易,重返大厂确实是个不错的选择,至少钱够算力够、安安心心做研究。

而随着新一轮的洗牌期到来,更多技术大牛朝着科技巨头聚拢,也已经初见端倪。

大模型创业太累大牛逃回大厂:融资1亿美金捉襟见肘 还胖了30斤

责任编辑:若风

文章内容举报

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-11-26 17:45:12

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

AI大牛杨红霞离职创业,曾为字节和阿里大模型研发主力 | Long China 50独家
...ChatGPT在国内卷起了大模型的竞速,大厂组建战队,技术大牛出山,全行业进入了对技术型人才的渴求期。彼时的字节,也开始招兵买马,并快速在智创、搜索、AI Lab组建团队,试
2024-05-24 13:40:00
关于王慧文病情和光年之外,我所了解的情况
...点的核心论据就是光年之外没有拉来预想中的 AI 算法「大牛」。但要注意的是,今天做大模型创业,一个大牛不是做成与否的充要条件,关键是能否组建起一支有战斗力的综合技术、工程、产
2023-06-27 13:51:00
Kimi陷入ofo式处境,杨植麟会是下一个戴威吗?
...信任。单从资本的角度来看,Kimi的牌桌上已经有了多个大厂的身影。进入2024年,杨植麟似乎一直在坐过山车,3月Kimi凭借着长文本能力快速出圈
2024-11-23 11:59:00
AI大牛履新南大副校长!高校人工智能热度高涨,3年9名大厂科学家回归学术
...从字节离职并筹备自己的AI创业项目。去年7月,另一名AI大牛何恺明离开Facebook研究院,加入麻省理工电气工程与计算机科学系。何恺明本科就读于清华大学物理系,博士师从商汤
2024-08-05 09:54:00
美团宣布收购“光年之外”
...局。在大模型火爆之前,王兴就已经很感兴趣。就在各家大厂入局之时,美团也已经在扩张算法团队。这次收购对美团来说,其力量也得到很大补充。现在,正是互相需要。
2023-06-29 18:08:00
张一鸣熬夜看论文 AI博士年薪500万 大模型搅动创业圈
...虽然年薪高达数百万甚至上千万,但看透大公司病的技术大牛们,一个个地离开了大厂体系,自立门户。3月,阿里巴巴技术副总裁贾扬清宣布和团队一起辞职创业,创业方向为AI,公司关注包括
2023-05-09 10:37:00
谷歌 AI 绘画 4 大牛携手创业,天使估值 7 个亿
最近的谷歌像个大漏勺,这不,又有AIGC核心成员联手跑路咯!量子位独家获悉,这回跟谷歌saybyebye的,是文生图核心团队——AI绘画模型 Imagen论文的四位核心作者,出走
2023-03-04 23:21:00
...态大模型的研发。百度、腾讯、阿里、字节跳动等互联网大厂也在“争分夺秒”开发自有大模型。在OpenAI发布GPT4.0后
2023-03-16 09:23:00
百度AI基因明星创业公司,卓世科技破局大模型商业落地
...寻这家企业的大模型商业化落地破局之道。 1、前百度AI大牛们,“集结”卓世科技“现在大家终于开始重点关注大模型如何实现商业模式闭环问题了,PMF模式是否已经跑通,产品是否能
2024-11-20 14:06:00
更多关于科技的资讯:
大皖新闻讯 2026年,中国智能驾驶的竞争,已从喧嚣的“开城”竞赛,来到底层技术的“暗战”。随着L3级试点政策的“破冰”与商业化前夜的临近
2026-04-15 20:21:00
牢记嘱托开新局 日新江淮往前赶|从“十一个月量产”到“全球交付20GWh”,看天合储能的“滁州速度”
大皖新闻讯 4月14日,随“牢记嘱托开新局,日新江淮往前赶”采访团,大皖新闻记者走进天合储能(滁州)有限公司的生产车间
2026-04-15 20:21:00
深圳香蜜丽格x乔雅登|“乔雅登骨相美学示范中心”正式成立
骨蕴其内,美显于形。2026年4月14日,深圳香蜜丽格医疗美容携手Allergan Aesthetics艾尔建美学,隆重举办“乔雅登骨相美学示范中心”启动仪式
2026-04-15 20:44:00
摩美得气血和胶囊闪耀2026乌镇健康大会:气血通透她力量信任破局
2026年4月12日至16日,备受瞩目的乌镇健康大会盛大举办。作为大健康产业核心平台,本届大会汇聚了全产业链精英,共探行业发展新趋势
2026-04-15 20:44:00
“随手一拍,涨粉飞快。”年轻人拍短视频、发Vlog已成日常,然而,这些“随手拍随手发”可能正在危害国家安全的边缘徘徊。提到国家安全
2026-04-15 22:43:00
近日,中国建设银行正式发布2025年度报告,同步披露了旗下控股子公司建信消费金融有限责任公司(下称“建信消费金融”)的年度经营情况
2026-04-15 17:41:00
孙德士到临沂联通智云数据中心开展调研工作
鲁网4月15日讯4月8日,临沂市副市长孙德士一行前往临沂联通智云数据中心调研指导,深入考察算力基础设施建设、云服务能力及数字赋能应用成果
2026-04-15 17:41:00
会分析、超能算,这个“医生助手”让诊疗过程智慧又高效
河北新闻网讯(田薇)清晨,河北工程大学附属医院诊疗一线高效运转:医生口述要点,规范电子病历一键生成;影像科医生轻点鼠标
2026-04-15 17:51:00
保定市职业技术教育中心召开青年教师个人规划总结暨专业成长手册启用会
河北新闻网讯 为促进青年教师专业发展,搭建成长交流平台,近日,保定市职业技术教育中心召开“复盘·启程”青年教师个人规划总结暨专业成长手册启用会
2026-04-15 18:40:00
记者探馆|新品扎堆、全球汇聚,第六届消博会点燃消费新热潮
大皖新闻讯 4月13日至18日,第六届中国国际消费品博览会在海南海口举办。15日,大皖新闻记者深入展会现场,沉浸式感受这场消费盛会的火热氛围与独特魅力
2026-04-15 19:47:00
牢记嘱托开新局 日新江淮往前赶|从“幼苗”到“森林”,这家生物科技“小巨人”跑出加速度
大皖新闻讯 4 月的江淮大地,春意盎然。4月14日,大皖新闻记者随“牢记嘱托开新局 日新江淮往前赶”采访团来到在滁州经济技术开发区这片热土上
2026-04-15 19:48:00
中新经纬4月15日电 4月15日,2026酒仙桥论坛在北京国家会议中心、北京数字经济算力中心同步启幕。会上,产业链企业
2026-04-15 17:37:00
兆观医疗级智能指环亮相 CMEF 重新定义健康穿戴标准
在可穿戴设备经历了十余年的喧嚣后,行业似乎陷入了一个尴尬的瓶颈。消费级手环数据往往缺乏临床价值,而医疗级设备又难以走出医院冰冷的围墙
2026-04-15 14:06:00
运营筑基・资产长青丨拆解「济南领秀城贵和购物中心」消费REITs的长期主义逻辑
鲁网4月15日讯济南领秀城贵和购物中心以商业运营与资产经营双轮驱动,构筑项目长期可持续的突破性价值沉淀!2025年以来
2026-04-15 15:51:00
107家企业入库 保定市首批“数智场景合伙人”发布
4月10日,市数据局发布保定市首批“数智场景合伙人”入选企业名单,全市共107家企业纳入培育库,同时,优先选取好多素教(浙江)网络科技有限公司等13家数智场景企业与河北携飞数据技术有限公司等21家协同发展企业
2026-04-15 16:32:00