• 我的订阅
  • 科技

新版Llama 3 70B反超405B!Meta开卷后训练,谷歌马斯克都来抢镜

类别:科技 发布时间:2024-12-09 09:53:00 来源:量子位

OpenAI“双12”刚进行到第二天,就把大模型圈搅得好不热闹!

一边是Meta没预告就发布了Llama 3.3,70B版本就能实现以前405B的性能。

新版Llama 3 70B反超405B!Meta开卷后训练,谷歌马斯克都来抢镜

另一边谷歌的Gemini也上线了新的实验版模型,再一次登上大模型竞技场榜首。

新版Llama 3 70B反超405B!Meta开卷后训练,谷歌马斯克都来抢镜

有网友感叹,o1、Llama 3.3和新版Gemini接连发布,马斯克的Grok3也要来,还有GPT-4.5初露端倪……这简直是最棒的一个圣诞季。

新版Llama 3 70B反超405B!Meta开卷后训练,谷歌马斯克都来抢镜

Llama 3.3:70B实现405B效果

Llama 3.3目前只有70B一个型号。

但在指令遵循(IFEval)、数学(MATH)、推理(GPQA Diamond)等领域,水平都超过了七月份发布的Llama 3.1 405B。

在语言(MMLU)、代码(HumanEval)、长文本和多语种能力上,成绩也和Llama 3.1 405B比较接近。

而在工具使用(BFCL)上,和405B的差距则显得稍大一些。

新版Llama 3 70B反超405B!Meta开卷后训练,谷歌马斯克都来抢镜

不过,Llama 3.3的使用成本要比Llama 3.1 405B低得多。

虽然Llama本身是免费的,但是各个大模型平台的服务价格也可以作为衡量成本的一个参考。

在Meta合作的平台当中,Llama 3.3最便宜的价格是0.1/0.4美元每百万输入/输出Token。

而Llama 3.1 405B,则是1美元每百万输入token,是Llama 3.3的10倍,输出token为1.8美元,是Llama 3.3的4.5倍。

新版Llama 3 70B反超405B!Meta开卷后训练,谷歌马斯克都来抢镜

Meta生成式AI团队领导者Ahmad Al-Dahle表示,Llama 3.3能用70B实现405B的效果,主要是“运用了后训练技术的最新进展”,并点名其中包括在线偏好优化(online preference optimization)。

新版Llama 3 70B反超405B!Meta开卷后训练,谷歌马斯克都来抢镜

Meta AI官方账号也提到,Llama 3.3的进步归功于新的对齐过程和在线强化学习技术的进步。

新版Llama 3 70B反超405B!Meta开卷后训练,谷歌马斯克都来抢镜

目前,Llama 3.3的模型权重已在官网和Hugging Face上开放下载。

新版Llama 3 70B反超405B!Meta开卷后训练,谷歌马斯克都来抢镜

Gemini迎来周岁生日

Gemini 1206上线的这天,刚好是Gemini的一周岁生日。

不过,从节奏和以日期命名的方式来看,Gemini更像是一次例行更新(上一个版本是1121)。

当然成绩还是很不错的,直接登上了lmsys大模型竞技场的榜首。

新版Llama 3 70B反超405B!Meta开卷后训练,谷歌马斯克都来抢镜

而且不只是总成绩夺冠,困难提示词、代码、数学、创意写作等各个单项排名也都是第一。

新版Llama 3 70B反超405B!Meta开卷后训练,谷歌马斯克都来抢镜

实际上,Gemini此前有个1114版本,也当了一周的“榜一大哥”,后来被更新的GPT-4o给比了下去。

现在的最新版本,又让Gemini重新回到了榜单上的王座。

新版Llama 3 70B反超405B!Meta开卷后训练,谷歌马斯克都来抢镜

此外,谷歌AI Studio产品负责人(原OpenAI开发者社区主管)Logan介绍,Gemini 1206拥有2百万token的上下文窗口,目前可通过谷歌AI Studio和Gemini API免费使用。

新版Llama 3 70B反超405B!Meta开卷后训练,谷歌马斯克都来抢镜

谷歌首席科学家Jeff Dean表示,取得这样的成绩是对Gemini生日最好的庆祝方式。

新版Llama 3 70B反超405B!Meta开卷后训练,谷歌马斯克都来抢镜

不过也有网友给谷歌泼了盆冷水,表示o1还没出现在这个榜单上,而且GPT-4.5就要来了,谷歌第一的位置恐怕很快又会被OpenAI夺走。

新版Llama 3 70B反超405B!Meta开卷后训练,谷歌马斯克都来抢镜

One More Thing

除了谷歌和Meta,马斯克xAI也被盛传即将发布Grok 3。

有网友发现,正在测试的Grok 2 mini消失了,认为这是要发Grok 3的征兆。

新版Llama 3 70B反超405B!Meta开卷后训练,谷歌马斯克都来抢镜

除了对Grok 3的猜测,还有一条更确定的消息——此前要充会员才能用的Grok,现在可以免费用了。

不过免费用户用量比较有限,每两小时只能处理10条消息,而图片分析一天只能处理三张。

新版Llama 3 70B反超405B!Meta开卷后训练,谷歌马斯克都来抢镜

有意思的是,我们试了试询问Grok自己,它也表示Grok 3计划在这个月上线。

但抓马的是,点进后面引用的消息源,发现这名博主也是问Grok之后发的帖子……

新版Llama 3 70B反超405B!Meta开卷后训练,谷歌马斯克都来抢镜

那么,在这个发布密集的十二月,你最钟意或者最期待哪一款产品呢?

参考链接:[1]https://x.com/AIatMeta/status/1865079067390956006[2]https://x.com/Ahmad_Al_Dahle/status/1865071436630778109[3]https://x.com/lmarena_ai/status/1865080944455225547

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-12-09 12:45:02

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

马斯克:特斯拉正在训练新的FSD模型 可能会在下个月发布
...6日讯(编辑 牛占林)当地时间周三,特斯拉首席执行官马斯克在社交平台上发文称,该公司目前正在训练一款全新的完全自动驾驶(FSD)模型,可能在下个月底准备好向公众发布。 马斯克
2025-08-06 21:35:00
XAI大模型Grok-1已正式开源 但并不是在马斯克说的上周
【TechWeb】3月18日消息,据外媒报道,马斯克领导的人工智能公司xAI当地时间周日在官网宣布,他们的大语言模型Grok-1已正式开源
2024-03-18 20:19:00
马斯克打脸OpenAI!全球最大模型Grok-1开源
本文经授权转载自钛媒体(ID:taimeiti)作者:林志佳马斯克(Elon Musk)真的实现了他的承诺——把大模型Grok-1开源了
2024-03-20 13:44:00
“言出必行”马斯克,全球最大开源模型Grok真的来了
...的 Grok,一举拿下迄今为止“全球最大开源模型”称号。马斯克又搞了个全球第一。Grok开源美东时间3月17日,xAI 正式宣布开源大模型Grok-1的权重和网络架构
2024-03-18 11:50:00
马斯克偏心 xAI,被曝挖走十多名特斯拉人才训练 Grok AI 模型
...日消息,科技媒体 electrek 昨日(8 月 8 日)报道,埃隆・马斯克(Elon Musk)进一步向其 xAI 公司倾斜资源
2024-08-10 09:42:00
马斯克推出首个AI大模型:善于讽刺,只训练了两个月,部分超越GPT3.5
...:一个善于讽刺的聊天机器人。当地时间11月4日,埃隆·马斯克(Elon Musk)旗下xAI团队发布了首个AI大模型产品Grok
2023-11-06 14:23:00
马斯克要求OpenAI恢复开源,背后是开源闭源路线之争
马斯克起诉OpenAI事件已经发酵了一周。3月7日,马斯克在推特上称,如果OpenAI把名字改为ClosedAI他就撤销诉讼
2024-03-09 22:51:00
市场担忧Sora模型带来两大隐患,马斯克“坐不住”了,秀肌肉
...技惊四座”后,在AI领域一向野心勃勃的特斯拉CEO埃隆·马斯克(ElonMusk)“坐不住”了。日前,马斯克发布了特斯拉一年前模拟真实场景的自动驾驶视频,并称“特斯拉视频的生
2024-02-21 14:59:00
马斯克硬刚OpenAI 用户惨遭池鱼之殃
...的,没听说过主动给人加个上限的。如今开眼了,埃隆·马斯克正在给所有推特用户加“未成年人保护”,而这一切,居然是被AI逼的?如今推特用户每天最多能浏览多少推特,不取决于手速或者
2023-07-04 13:39:00
可生成政治人物图像,马斯克旗下xAI发布Grok-2“手撕”OpenAI
...鲸新闻8月15日讯(记者 朱俊熹)当地时间8月14日,埃隆·马斯克预告已久的新一代AI大模型Grok-2终于面世。马斯克对该模型寄予厚望
2024-08-15 14:26:00
更多关于科技的资讯:
日前,太重智能高端装备产业园区的厂房内一片欢腾。由企业自主研发的智能轴承,成功应用于大型电铲并顺利完成厂内模拟测试,各项性能指标均优于设计标准
2026-01-22 07:03:00
最近有件事儿越来越常见:外国人不光来中国旅游,还专门“打飞的”来看病。不是出于好奇体验,而是真心觉得值!值在哪儿?三个字
2026-01-21 21:52:00
中新经纬1月21日电 广东省政府网站21日公布《广东省人工智能赋能交通运输高质量发展若干政策措施》(下称《政策措施》)
2026-01-21 20:20:00
织金平远公司完成 500kVⅡ 组母线母差保护装置校验及传动
多彩贵州网讯(通讯员 史凡莉)近日,织金平远公司厂区内,500kVⅡ组母线设备区域一派忙碌景象。电热检修部与发电运行部工作人员有条不紊地开展母差保护A屏
2026-01-21 17:15:00
九阳太空厨房已安全稳定运行超1500天
中国消费者报报道(记者桑雪骐)航天员们如何健康、舒适地展开太空生活和吃好一日三餐,是大家都很关心的话题。据了解,这背后其实有一个我国自主研制的太空厨房
2026-01-21 18:05:00
秦皇岛经开区第一小学开展人工智能科技实践活动
河北新闻网讯(李佳新)日前,秦皇岛经开区第一小学开展以“AI探索,智创未来”为主题的人工智能科技实践,通过沉浸式实训活动激发学生的科技探索热情
2026-01-21 18:11:00
马年将至(农历),在广州大夫山森林公园,一些徒步爱好者分享了一种创意玩法——“画马”,相关穿越路线攻略一时引发追捧。所谓“画马”
2026-01-21 18:36:00
三重蝶变,中天钢铁解锁“企业主理”新范式
大寒虽寒,热潮涌动。原点空间路演大厅内,由中天钢铁主理的第37场沙龙——“AI智能体创新大赛总结沙龙”以三重蝶变,为常州“智能体+场景应用”示范城市建设吹响了热力全开的奋进号角
2026-01-21 18:28:00
苏州市女企协秘书长、国浩律师(苏州)事务所合伙人葛霞青律师荣登《钱伯斯大中华区指南2026》推荐榜单
江南时报讯 1月15日,全球领先的法律研究和分析机构钱伯斯(Chambers & Partners)发布《钱伯斯大中华区指南2026》(Chambers Greater China Region Guide 2026)
2026-01-21 15:23:00
盐城盐都:“翼”技傍身 照亮前程
江南时报讯 启动无人机,校准飞行参数,规划测绘航线,精准捕捉地面数据……日前,2026年盐城市盐都区首期无人机测绘操控员技能培训在都U+乐业空间正式开班
2026-01-21 15:24:00
全国首款!仙库3D智能足脊扫描仪正式发布!
近日,深圳仙库智能有限公司(以下简称“仙库”)正式发布仙库3D智能足脊扫描仪XK-CH005,这是全国首款实现“足脊一体”同步评估的硬核科技产品
2026-01-21 16:24:00
国家级备案落地!疯狂体育Foretell革命性AI平台,开启体育智能决策新阶段
2026年1月20日,疯狂体育正式官宣推出旗下AI赛事预测工具Foretell。凭借已经完成的国家互联网信息办公室深度合成服务算法备案资质
2026-01-21 16:47:00
当我们在思考“哪些中国企业创新做得不错”时,CES 2026舞台上的联想集团给出了一个全面而深刻的答案。这不仅仅是一次产品发布会
2026-01-21 16:49:00
近日,剑桥大学教育学院院长Hilary正式受聘为中国素质教育品牌欣乾程的学术顾问。此次合作不仅是国际顶尖学术力量与中国创新型教育机构的一次重要握手
2026-01-21 14:24:00
跨越顶奢与潮饮的“美酒+美食”表达 五粮液全力构建中国白酒全球新叙事
鲁网1月21日讯当一位新加坡米其林星厨在构思新菜单时,正在将中国白酒作为风味拼图中一块充满惊喜的“香料”。在他手中,一杯五粮液可能被用来平衡炙烤龙虾的鲜甜
2026-01-21 12:03:00