• 我的订阅
  • 科技

谷歌开源系模型第二代免费开放!27B媲美Llama3 70B,单H100可跑

类别:科技 发布时间:2024-07-01 09:21:00 来源:量子位

西风 发自 凹非寺量子位 | 公众号 QbitAI

谷歌开源模型Gemma 2开放了!

虽然前段时间Google I/O大会上,Gemma 2开源的消息就已经被放出,但谷歌还留了个小惊喜——

除27B模型外,还有一个更轻的9B版本。

DeepMind创始人哈萨比斯表示,27B参数规模下,Gemma 2提供了同类模型最强性能,甚至还能与其两倍大的模型竞争。

谷歌开源系模型第二代免费开放!27B媲美Llama3 70B,单H100可跑

目前Gemma 2已入驻大模型竞技场(LMSYS Chatbot Arena),Gemma 2 27B排名与Llama3 70B相当:

谷歌开源系模型第二代免费开放!27B媲美Llama3 70B,单H100可跑

而Gemma 2 9B的排名甚至比肩Qwen 2 72B:

谷歌开源系模型第二代免费开放!27B媲美Llama3 70B,单H100可跑

该结果也让网友纷纷表示难以置信。

谷歌开源系模型第二代免费开放!27B媲美Llama3 70B,单H100可跑

此外,VentureBeat表示,两种Gemma 2版本还不够,谷歌很快还将发布2.6B参数模型。

能打两倍大的模型

Gemma是谷歌的开源模型系列,采用Gemini同款技术架构,主打开源、轻量级、免费可商用。

今年二月份,Gemma系列正式上线第一代,共有2B和7B两个版本,笔记本可跑,性能全面超越当时的开源标杆Llama 2。

和羊驼家族一样,基于Gemma也有了很多变种,如CodeGemma、RecurrentGemma、PaliGemma等。

对于第二代Gemma 2,谷歌表示相比于Gemma,性能更高、推理效率更高,单个NVIDIA H100或TPU主机上可跑。

上下文长度方面,Gemma 2为8192 Tokens。

性能方面,Gemma 2与Llama 3、Grok-1基准测试结果对比如下:

谷歌开源系模型第二代免费开放!27B媲美Llama3 70B,单H100可跑

Gemma 2 9B得分全面超越Llama 3 8B,Gemma 2 27B模型表现接近Llama 3 70B,且超越Grok-1和Qwen 1.5 32B:

谷歌开源系模型第二代免费开放!27B媲美Llama3 70B,单H100可跑

与Mistral和Gemma 1的比较结果如下:

谷歌开源系模型第二代免费开放!27B媲美Llama3 70B,单H100可跑

除此外,Gemma 2安全性相比前代也有显著提升:

谷歌开源系模型第二代免费开放!27B媲美Llama3 70B,单H100可跑

技术报告中也有Gemma 2的更多信息。

基于Transformer解码器架构,与Gemma 1不同之处在于,Gemma 2每隔一层交替使用局部滑动窗口注意力和全局注意力机制,引入了分组查询注意力(GQA)以提高推理速度,相比Gemma 1也使用了更深的网络结构。

Gemma 2关键模型参数如下:

谷歌开源系模型第二代免费开放!27B媲美Llama3 70B,单H100可跑

网友实测

目前,用户还可在Hugging Chat上与Gemma 27B聊天。

有网友上手测试了一番:

谷歌开源系模型第二代免费开放!27B媲美Llama3 70B,单H100可跑

不过似乎是出Bug了,让Gemma 27B讲个故事,它愣是没刹住车,回复巨长:

我们也上手体验了一下,可能是有什么Bug……

这边还有网友使用苹果的MLX框架也在本地部署上了:

谷歌表示,从下个月开始,Google Cloud用户也可在Vertex AI上部署和管理Gemma 2。

One More Thing

谷歌刚刚官宣Gemma 2开放,国产大模型就来踢馆了。

智谱AI放出1个月前发布的开源模型GLM-4-9B的得分,和Gemma 2的对比是这样婶儿的:

谷歌开源系模型第二代免费开放!27B媲美Llama3 70B,单H100可跑

HuggingFace:https://huggingface.co/chat/models/google/gemma-2-27b-it

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-07-01 12:45:25

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

高通甩两大芯片王炸!AI大模型联手腾讯智谱,小米15抢首发,荣耀剧透新机
...发布了新一代年度旗舰手机SoC骁龙8 Elite和用在AI PC里的第二代高通Oryon CPU。没错,高通的旗舰手机芯片又双叒改名了
2024-10-22 09:51:00
Intel为中国带来Gaudi2 AI加速器:超高性价比!
...lAI产品战略暨Gaudi2新品发布会,正式面向中国市场推出第二代深度学习加速器——HabanaGaudi2。IntelGaudi2加速器不但拥有极高的深度学习性能
2023-07-12 16:29:00
英特尔发布中国特供版7nm AI芯片Gaudi2,减少RDMA接口以符合出口管制规定|硅基世界
...公司(Intel)发布面向中国市场、采用台积电7nm工艺的第二代Gaudi深度学习加速器Habana Gaudi2
2023-07-12 16:00:00
苹果开源7B模型,训练过程数据集一口气全给了,网友:很不像苹果
苹果最新杀入开源大模型战场,而且比其他公司更开放。推出7B模型,不仅效果与Llama 3 8B相当,而且一次性开源了全部训练过程和资源
2024-07-23 09:33:00
英特尔发布第二代AI增强SDV SoC:车企自由度更高 AI性能提升10倍
...4月23日消息,上海车展今日开幕,英特尔在车展上发布第二代英特尔AI增强软件定义汽车(SDV)SoC。该SoC率先在汽车行业推出基于芯粒架构的设计,进一步扩展了英特尔在智能座
2025-04-23 20:31:00
英特尔以全新软硬件助力千行百业释放AI潜能
...封装技术实现高带宽和低延迟。能效方面,SierraForest与第二代英特尔至强处理器相比,每瓦性能提高了2.4倍,机架密度提高了2.7倍,这样的能效提升不仅大幅减少了设备占
2024-04-26 22:38:00
开源大模型的ChatGPT时刻?备受期待的Llama 3 405B即将发布
...顶配,405B版本拥有4050亿个参数,是迄今为止最大的开源模型之一。昨夜凌晨,META突发Llama 3.1-405B评测数据的泄漏事件
2024-07-23 17:11:00
阿里云通义千问 Qwen2-VL 第二代视觉语言模型开源
IT之家 9 月 2 日消息,阿里云通义千问今日宣布开源第二代视觉语言模型 Qwen2-VL,并推出 2B、7B 两个尺寸及其量化版本模型
2024-09-03 09:45:00
英特尔发布全新软硬件平台,全速助力企业推进AI创新
...能效核的英特尔至强6处理器(代号为SierraForest):与第二代英特尔至强处理器相比,每瓦性能提高2.4倍,机架密度提高2
2024-04-10 17:08:00
更多关于科技的资讯:
发展新质生产力 推进新型工业化11月18日至25日,全球半导体行业盛会——德国慕尼黑半导体展览会隆重举行。总部位于太原的山西天成半导体材料有限公司受邀参展
2025-11-20 06:54:00
第二届雷克沙杯高校电竞挑战赛总决赛落幕
2025年11月16日,2025雷克沙杯高校电竞挑战赛全国总决赛于“电竞重镇”成都圆满收官。本届赛事由国际高端消费类存储品牌雷克沙主办
2025-11-19 08:26:00
厦门网讯(厦门日报记者 谢瑞真)新闻工作者普遍面临用眼过度、睡眠不足等问题,长时间用眼导致眼部健康问题频发。昨日,国内首份聚焦媒体从业者的眼健康报告——《厦门市新闻工作者眼健康白皮书》(以下简称“白皮书”)正式发布
2025-11-19 08:46:00
邮储银行临沂市蒙阴县支行成功举办“智享理财 共筑财富”主题沙龙活动
鲁网11月18日讯为积极践行“金融为民”服务理念,精准满足广大客户多元化财富管理需求,搭建专业高效的金融交流平台,近日
2025-11-19 09:27:00
“具身智能”开辟青年创业新赛道
原标题:政策东风助力产业发展 年轻团队研发“灵巧手” 产品销量一年增长五倍“具身智能”开辟青年创业新赛道11月17日,中国共产党北京市第十三届委员会第七次全体会议召开
2025-11-19 10:57:00
大皖新闻讯 11月19日,记者从合肥市召开的新闻发布会获悉,“十四五”以来,合肥市以科技创新引领产业创新,获批2个国家级制造业创新中心
2025-11-19 14:05:00
“双十一”最后一公里日均单量远超去年峰值,顺丰同城联动无人车、公交车末端提效
第17个“双十一”落幕,星图数据显示,本届大促综合电商平台销售额为1.619万亿元,同比增长12.3%;即时零售成为今年最大黑马
2025-11-19 14:28:00
阿里千问App支持119种语言,上线全新实时翻译能力
11月19日,阿里千问App在公测三天后,迅速推出多项翻译能力升级。基于Qwen模型的多语言能力,千问App推出全新实时翻译功能
2025-11-19 14:55:00
再绽国际舞台!柏星龙创意包装斩获2025年度五项Pentawards大奖
摘要:2025年Pentawards全球获奖名单揭晓,深圳市柏星龙创意包装股份有限公司报送的五件作品从全球数千件参赛作品中突围
2025-11-19 16:37:00
中新经纬11月19日电 11月19日,工业和信息化部举行新闻发布会,介绍GB 6675《玩具安全》系列强制性国家标准修订情况
2025-11-19 16:58:00
你开店,我出钱!郑州用“青春计划”留住年轻人
大河网讯(记者 赵檬)11月18日,由共青团郑州市委联合市委金融办、市人社局等六部门推出的“商都新活力·青春小店成长计划”正式启动
2025-11-19 17:01:00
鲁网11月19日讯2025年11月1日至2025年11月30日,中国银行泰安分行开展“臻享新户礼遇,尽享美好生活”主题活动
2025-11-19 17:14:00
为啥爆款短剧都爱用它?
大河网讯(记者 赵檬)打开手机刷几分钟短剧,早已成为不少人碎片时间的标配。从手机拍摄到专业设备加持,从流量博弈到内容为王
2025-11-19 17:32:00
2025年11月8日窪田制药控股株式会社为应对全球日益严重的“近视”问题,作为眼科医疗解决方案公司,窪田制药控股株式会社(总部
2025-11-19 20:39:00
三大核心价值赋能,浪潮海岳智能服务平台为企业运维保驾护航
在数智化转型加速推进的今天,企业运维正面临前所未有的挑战。传统运维模式响应慢、协作难、效率低,难以支撑业务的快速发展;运维环节中的流程堵点与系统孤岛
2025-11-19 22:02:00