• 我的订阅
  • 科技

谷歌开源系模型第二代免费开放!27B媲美Llama3 70B,单H100可跑

类别:科技 发布时间:2024-07-01 09:21:00 来源:量子位

西风 发自 凹非寺量子位 | 公众号 QbitAI

谷歌开源模型Gemma 2开放了!

虽然前段时间Google I/O大会上,Gemma 2开源的消息就已经被放出,但谷歌还留了个小惊喜——

除27B模型外,还有一个更轻的9B版本。

DeepMind创始人哈萨比斯表示,27B参数规模下,Gemma 2提供了同类模型最强性能,甚至还能与其两倍大的模型竞争。

谷歌开源系模型第二代免费开放!27B媲美Llama3 70B,单H100可跑

目前Gemma 2已入驻大模型竞技场(LMSYS Chatbot Arena),Gemma 2 27B排名与Llama3 70B相当:

谷歌开源系模型第二代免费开放!27B媲美Llama3 70B,单H100可跑

而Gemma 2 9B的排名甚至比肩Qwen 2 72B:

谷歌开源系模型第二代免费开放!27B媲美Llama3 70B,单H100可跑

该结果也让网友纷纷表示难以置信。

谷歌开源系模型第二代免费开放!27B媲美Llama3 70B,单H100可跑

此外,VentureBeat表示,两种Gemma 2版本还不够,谷歌很快还将发布2.6B参数模型。

能打两倍大的模型

Gemma是谷歌的开源模型系列,采用Gemini同款技术架构,主打开源、轻量级、免费可商用。

今年二月份,Gemma系列正式上线第一代,共有2B和7B两个版本,笔记本可跑,性能全面超越当时的开源标杆Llama 2。

和羊驼家族一样,基于Gemma也有了很多变种,如CodeGemma、RecurrentGemma、PaliGemma等。

对于第二代Gemma 2,谷歌表示相比于Gemma,性能更高、推理效率更高,单个NVIDIA H100或TPU主机上可跑。

上下文长度方面,Gemma 2为8192 Tokens。

性能方面,Gemma 2与Llama 3、Grok-1基准测试结果对比如下:

谷歌开源系模型第二代免费开放!27B媲美Llama3 70B,单H100可跑

Gemma 2 9B得分全面超越Llama 3 8B,Gemma 2 27B模型表现接近Llama 3 70B,且超越Grok-1和Qwen 1.5 32B:

谷歌开源系模型第二代免费开放!27B媲美Llama3 70B,单H100可跑

与Mistral和Gemma 1的比较结果如下:

谷歌开源系模型第二代免费开放!27B媲美Llama3 70B,单H100可跑

除此外,Gemma 2安全性相比前代也有显著提升:

谷歌开源系模型第二代免费开放!27B媲美Llama3 70B,单H100可跑

技术报告中也有Gemma 2的更多信息。

基于Transformer解码器架构,与Gemma 1不同之处在于,Gemma 2每隔一层交替使用局部滑动窗口注意力和全局注意力机制,引入了分组查询注意力(GQA)以提高推理速度,相比Gemma 1也使用了更深的网络结构。

Gemma 2关键模型参数如下:

谷歌开源系模型第二代免费开放!27B媲美Llama3 70B,单H100可跑

网友实测

目前,用户还可在Hugging Chat上与Gemma 27B聊天。

有网友上手测试了一番:

谷歌开源系模型第二代免费开放!27B媲美Llama3 70B,单H100可跑

不过似乎是出Bug了,让Gemma 27B讲个故事,它愣是没刹住车,回复巨长:

我们也上手体验了一下,可能是有什么Bug……

这边还有网友使用苹果的MLX框架也在本地部署上了:

谷歌表示,从下个月开始,Google Cloud用户也可在Vertex AI上部署和管理Gemma 2。

One More Thing

谷歌刚刚官宣Gemma 2开放,国产大模型就来踢馆了。

智谱AI放出1个月前发布的开源模型GLM-4-9B的得分,和Gemma 2的对比是这样婶儿的:

谷歌开源系模型第二代免费开放!27B媲美Llama3 70B,单H100可跑

HuggingFace:https://huggingface.co/chat/models/google/gemma-2-27b-it

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-07-01 12:45:25

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

高通甩两大芯片王炸!AI大模型联手腾讯智谱,小米15抢首发,荣耀剧透新机
...发布了新一代年度旗舰手机SoC骁龙8 Elite和用在AI PC里的第二代高通Oryon CPU。没错,高通的旗舰手机芯片又双叒改名了
2024-10-22 09:51:00
Intel为中国带来Gaudi2 AI加速器:超高性价比!
...lAI产品战略暨Gaudi2新品发布会,正式面向中国市场推出第二代深度学习加速器——HabanaGaudi2。IntelGaudi2加速器不但拥有极高的深度学习性能
2023-07-12 16:29:00
英特尔发布中国特供版7nm AI芯片Gaudi2,减少RDMA接口以符合出口管制规定|硅基世界
...公司(Intel)发布面向中国市场、采用台积电7nm工艺的第二代Gaudi深度学习加速器Habana Gaudi2
2023-07-12 16:00:00
苹果开源7B模型,训练过程数据集一口气全给了,网友:很不像苹果
苹果最新杀入开源大模型战场,而且比其他公司更开放。推出7B模型,不仅效果与Llama 3 8B相当,而且一次性开源了全部训练过程和资源
2024-07-23 09:33:00
英特尔以全新软硬件助力千行百业释放AI潜能
...封装技术实现高带宽和低延迟。能效方面,SierraForest与第二代英特尔至强处理器相比,每瓦性能提高了2.4倍,机架密度提高了2.7倍,这样的能效提升不仅大幅减少了设备占
2024-04-26 22:38:00
开源大模型的ChatGPT时刻?备受期待的Llama 3 405B即将发布
...顶配,405B版本拥有4050亿个参数,是迄今为止最大的开源模型之一。昨夜凌晨,META突发Llama 3.1-405B评测数据的泄漏事件
2024-07-23 17:11:00
英特尔发布全新软硬件平台,全速助力企业推进AI创新
...能效核的英特尔至强6处理器(代号为SierraForest):与第二代英特尔至强处理器相比,每瓦性能提高2.4倍,机架密度提高2
2024-04-10 17:08:00
阿里云通义千问 Qwen2-VL 第二代视觉语言模型开源
IT之家 9 月 2 日消息,阿里云通义千问今日宣布开源第二代视觉语言模型 Qwen2-VL,并推出 2B、7B 两个尺寸及其量化版本模型
2024-09-03 09:45:00
英特尔酷睿ultra200v生态大会在京举行
...品和AI功能及应用,推动基于英特尔酷睿Ultra处理器(第二代)的30款台式机和笔记本百花齐放。英特尔客户端计算事业部副总裁兼客户端细分市场部总经理冯大为表示:“什么才是优秀
2024-10-26 18:13:00
更多关于科技的资讯: