• 我的订阅
  • 科技

「LLM」这个名字不好,Karpathy认为不准确、马斯克怒批太愚蠢

类别:科技 发布时间:2024-09-18 15:01:00 来源:机器之心Pro

LLM 应该改名吗?你怎么看。

在 AI 领域,几乎每个人都在谈论大型语言模型,其英文全称为 Large Language Models,简写为 LLM。

因为 LLM 中有「Language」一词,因此,大家默认这种技术和语言密切相关。

然而,知名 AI 大牛 Andrej Karpathy 却对此有着独特的见解:

「LLM」这个名字不好,Karpathy认为不准确、马斯克怒批太愚蠢

「大型语言模型(LLM)名字虽然带有语言二字,但它们其实与语言关系不大,这只是历史问题,更确切的名字应该是自回归 Transformer 或者其他。

LLM 更多是一种统计建模的通用技术,它们主要通过自回归 Transformer 来模拟 token 流,而这些 token 可以代表文本、图片、音频、动作选择、甚至是分子等任何东西。因此,只要能将问题转化为模拟一系列离散 token 的流程,理论上都可以应用 LLM 来解决。

实际上,随着大型语言模型技术栈的日益成熟,我们可能会看到越来越多的问题被纳入这种建模范式。也就是说,问题固定在使用 LLM 进行『下一个 token 的预测』,只是每个领域中 token 的用途和含义有所不同。

如果核心问题真的变成了预测下一个 token,那么深度学习框架(例如 PyTorch 及其同类框架, 因为 PyTorch 提供了过于广泛的操作和层的可配置性而显得过于普通)也可能过于普通,无法满足大多数问题随时间推移的需要。如果 80% 的问题只需要使用 LLM 来解决,那么成千上万个可以随意重新配置的操作和层又有什么用呢?我认为这不是真的,但我认为它只对了一半。」

Karpathy 的这番言论引来很多人围观,浏览量高达 20 多万。

「LLM」这个名字不好,Karpathy认为不准确、马斯克怒批太愚蠢

Karpathy 曾是 OpenAI 的早期成员之一,之后加入特斯拉领导其自动驾驶的计算机视觉团队。之后他又回到过 OpenAI,领导着一个专注提升 ChatGPT 的 GPT-4 的小团队。今年 7 月,他宣布创立了一家名为 Eureka Labs 的 AI + 教育公司。

「LLM」这个名字不好,Karpathy认为不准确、马斯克怒批太愚蠢

作为前排吃瓜群众的马斯克非常赞同的表示:这绝对需要一个新名字,「多模态 LLM(Multimodal Large Language Models)」是一个特别愚蠢的名字,因为第一个词与第三个词相矛盾!

「LLM」这个名字不好,Karpathy认为不准确、马斯克怒批太愚蠢

机器学习和 AI 研究员、畅销书《Python 机器学习》作者 Sebastian Raschka 也非常赞同,他表示:如果将 LLM 改为自回归 Transformers 或者其他名字的话,那 Mamba、Jamba、Samba 可以申请加入吗。不管怎样,还是非常赞同 Karpathy 观点。

「LLM」这个名字不好,Karpathy认为不准确、马斯克怒批太愚蠢

不过,来自 OpenAI 的研究者 Clive Chan 却表示:另一方面,也许所有可以用自回归方式表达的东西都可以被视为一种语言。任何事物都可以被转化为一串 token 流,因此从这个角度看,一切都是语言!

对于这种说法,Karpathy 回复到:当然,你可以想象说话纹理、说话分子等等。但我所观察到的是,语言这个词误导了人们认为大型语言模型(LLM)只限于文本应用。

「LLM」这个名字不好,Karpathy认为不准确、马斯克怒批太愚蠢

在 Meta 从事 PyTorch 研究的 Horace He 表示:确实,深度学习框架可能在某些方面过于普遍。尽管如此,即便只是针对大型语言模型(LLM),实际运行的操作也有很大的变化。这包括新的注意力操作、混合专家模型(MoE)、不同变体的激活检查点、不同的位置嵌入等。

在 Horace He 看来,这些技术的多样性说明,即使是在专注于 LLM 的应用中,深度学习框架的通用性也是有其必要性的,以适应不断发展和变化的模型需求。

「LLM」这个名字不好,Karpathy认为不准确、马斯克怒批太愚蠢

「像 LLMs、GPT 和 RLHF 这样的术语现在变成主流,这实在有些奇怪。通常,一个领域向更广泛的世界介绍自己时并不会这样做(在我看来,这也是有些机构品牌推广失败的原因)。」有人发表了这样的观点。

这种情况反映了复杂技术术语的普及可能并不总能有效地代表其真实的应用和影响,有时甚至可能导致公众理解上的困难。

「LLM」这个名字不好,Karpathy认为不准确、马斯克怒批太愚蠢

还有网友认为,「Large」这个词用的也不好,因为今天的「大」在未来会显得「小」。

「LLM」这个名字不好,Karpathy认为不准确、马斯克怒批太愚蠢

「 同样的情况也适用于电话和计算机领域,看起来最初的术语往往会保持使用。」

「LLM」这个名字不好,Karpathy认为不准确、马斯克怒批太愚蠢

这不由得让我们想起 AI 领域各种命名方式,早期的名称往往因为先入为主的效应而被广泛沿用,即使随着技术的演进,这些名称可能已不再准确描述其功能了。

大型语言模型到底应不应该改名,你怎么看,欢迎评论区留言。

参考链接:https://x.com/karpathy/status/1835024197506187617

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-09-18 18:45:02

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

马斯克:一旦找到一个足够“愚蠢”的人来继任 我就辞任推特CEO
...路透社12月21日报道,在推特“兴风作浪”一个月以后,马斯克20日发推宣布,他将在找到一名“足够愚蠢”继任者后辞去推特首席执行官(CEO)一职。马斯克在推特上这样说:“一旦我
2022-12-21 13:13:00
马斯克“任命”一只狗担任推特首席执行官
...通讯社莫斯科2月15日电美国企业家、推特的新主人埃隆∙马斯克“任命”了该公司的新首席执行官,并在自己的推特页面给“任命”附上了狗的照片。马斯克在推特上狗的照片下评论道:“新的
2023-02-16 13:43:00
马斯克公开回击迪士尼CEO,“滚蛋吧”,承认赞同反犹帖子愚蠢
当地时间11月29日,埃隆·马斯克出现在《纽约时报》的DealBook峰会上。现年52岁的亿万富翁保持了随性的风格,毛领皮夹克内搭纯黑T恤,并配了一双短靴,显然他并没有因为出席的
2023-12-01 09:26:00
马斯克关注的账号“Teslaconomics”周日发帖,分享了一段特斯拉Semi卡车在高速路上连续超越多辆卡车的视频,并配文称:“别挡道,特斯拉Semi卡车开过来了!比尔·盖茨,
2023-08-06 15:47:00
马斯克:汽车后视镜是愚蠢的设计!干掉后视镜可以增加5%的续航
...的特斯拉MODEL 3已经干掉了实体后视镜,特斯拉的创始人马斯克,更是多次炮轰,传统后视镜是鸡肋,是愚蠢的设计。“后视镜在汽车行驶过程中,会产生风阻,从而让电动车最多减少5%
2024-05-27 09:10:00
马斯克来了,摩根大通、辉瑞CEO也要来!重磅人物云集中国,什么信号?
5月30日,马斯克时隔三年再次访问中国。然而有消息称,摩根大通、星巴克、辉瑞CEO近日也都要来中国了!啥情况?马斯克会见宁德时代曾毓群 ?据央视新闻,5月30日,特斯拉首席执行官
2023-05-31 10:22:00
马斯克服软了,不宣传以色列暴行而是改口:以色列只能摧毁哈马斯
来源:Six说 马斯克恐怕是这个世界上最敢说的资本家。巴以冲突刚刚爆发的时候,他就持非常激烈的批判以色列的态度,甚至利用他的社交媒体宣传以色列的种种暴行。可现在马斯克终于知道,凭
2023-12-01 10:38:00
...纵火。针对极端活动人士的做法,特斯拉公司首席执行官马斯克予以强烈抨击,称其“极其愚蠢”。马斯克在社交媒体X上说:“这些人要么是地球上最愚蠢的生态恐怖分子,要么是那些没有良好环
2024-03-06 13:50:00
...国Grünheide工厂的高缺勤率引起了特斯拉首席执行官埃隆·马斯克(Elon Musk)的注意。《商报》报道称,特斯拉Grünheide工厂的员工请病假率在8月份攀升至17%
2024-09-30 21:00:00
更多关于科技的资讯:
深圳香蜜丽格成功举办2025LA-HA中国激光医学研讨会。续写Fotona4D发展新篇章
鹏城8月,热力全开!2025年8月5日,“2025LA-HA中国激光医学研讨会暨Fotona欧洲之星基石方案临床应用交流会”在深圳香蜜丽格圆满落幕
2025-08-08 20:05:00
中新经纬8月8日电 据深交所微信公众号8日消息,8月5日,深交所在杭州举办第二十六期“创享荟”活动,围绕创新药的现状未来及资本市场支持行业高质量发展举办专题座谈交流
2025-08-08 19:27:00
一杯“秋奶”喝出节气新经济:益禾堂立秋单日总GMV破6700万!
当二十四节气与新茶饮浪漫邂逅,一杯奶茶如何成为秋日仪式感的代名词?8月7日立秋,益禾堂以“秋天宠你”为情感内核,成功引爆全民“秋天的第一杯奶茶”消费热潮
2025-08-08 19:34:00
2025跑步机选购榜单:减震技术如何守护你的膝盖舒适与运动健康?
跑步机的价值,最终由膝盖说了算!本榜聚焦长期使用下的膝盖舒适度与耐用性两大核心价值,评选真正懂呵护的跑步机。膝盖舒适度&
2025-08-08 19:34:00
2025最新进口纳豆激酶品牌排行榜!哪个牌子效果好又安全?科研实力+口碑双认证!
在当今健康意识不断提升的时代,纳豆激酶凭借其卓越的心血管保健功效,已成为众多家庭必备的营养补充品。面对市场上琳琅满目的产品选择
2025-08-08 19:34:00
中能拾贝深度赋能某上市发电企业,构建电力生产全链条数字化新范式
随着“双碳”目标的深入推进与数字技术的迅猛发展,能源电力行业正迎来绿色转型与智能升级的关键窗口期。中能拾贝深耕能源电力行业二十载
2025-08-08 19:34:00
2025采购与供应管理大会将于9月在厦门开幕
2025年9月14日—16日,全球供应链管理领域的目光将聚焦于福建省厦门市。在这座美丽的海滨城市,一场备受瞩目的国际盛会——“2025年采购与供应管理大会暨第六届中国供应链管理年会”即将拉开帷幕
2025-08-08 19:34:00
益禾堂“秋奶”狂潮席卷全国,立秋当日总GMV破6700万,创历史新高!
8月7日立秋,“秋天的第一杯奶茶”全民狂欢再度引爆!益禾堂以“益趣”为核心,主打“秋天宠爱”,推出轻乳茶新品,结合创意营销攻势
2025-08-08 19:34:00
在茶馆遇见茶的温度与品牌的厚度:解码小罐茶全新茶馆生态
在快节奏的城市生活中,逐渐兴起的“茶空间”逐渐成为人们逃离压力、精神栖息、社交娱乐的都市新场景。这种生活消费方式的转变
2025-08-08 19:34:00
北京最有人气的购物中心,要被卖了
近日,有市场知情人士透露,英格卡购物中心正计划打包出售国内的10座荟聚购物中心。首批将出售位于无锡、北京、武汉的三座荟聚购物中心
2025-08-08 09:16:00
李现也来参与的“观鸟”,在全球拥有千亿级市场|产品观察
作者 | 张子怡编辑 | 彭孝秋今年春天,明星李现带火一个小众赛道。他分享的观鸟vlog被生态环境部公开表扬,此后一连数日的热搜都跟“观鸟”
2025-08-08 11:22:00
商品多退少补太繁琐?小鹅通称重分拣功能上线,高效管理每一克!
小鹅发现,不少社区团购商家在用小鹅通卖生鲜时,采用的是先销后采的方式,缺少"称重分拣"的环节,销转过程低效还易出错。现在
2025-08-08 12:22:00
外卖大战背后,最直观的受益者当属消费者。数据显示,90后日均打开外卖App的频次已达3.2次,25-45岁人群贡献了82%的订单
2025-08-08 10:39:00
随着美团、饿了么、京东的官宣,这场外卖大战似乎会暂告一段落。其间出现各种意想不到的现象,也引起各方对外卖行业发展的反思
2025-08-08 10:39:00
外卖内卷,算得上今年的一个现象级话题。2月11日京东宣布入局外卖,一池春水即被搅动。美团升级“闪购”,饿了么联合淘宝闪购
2025-08-08 10:39:00