我的订阅
科技

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

反击OpenAI，谷歌放出最强悍大模型Gemini

类别：科技发布时间：2023-12-07 10:31:00 来源：界面新闻

图：匡达

OpenAI空前崛起之际，谷歌毅然打响了绝地反击战。

北京时间12月7日凌晨，谷歌CEO桑达尔・皮查伊和Deepmind CEO戴密斯·哈萨比斯在谷歌官网联名发文，官宣了最新多模态大模型Gemini 1.0（双子星）版本正式上线。这个上线时间早于外界猜测的明年1月，保密程度很高，仅有少数媒体提前猜出。

Gemini 1.0是谷歌筹备了一年之久的GPT4真正竞品，也是目前谷歌能拿出手的功能最为强悍、适配最为灵活的大模型，包括三种不同套件，分别是Gemini Ultra, Gemini Pro和Gemini Nano。其中Ultra的能力最强，复杂度最高，能够处理最为困难的多模态任务；Pro能力稍弱，是一个可扩展至多任务的模型；Nano则是一款可以在手机端侧运行的模型。这说明，Gemini的触达范围很广，可以下探至数据中心，也可以上行至移动设备端侧。

谷歌的Bard聊天机器人，此番也已经升级到了Gemini，可以说Gemini的初始版本已于今日开始在Bard中提供。从5月的I/O大会之后，谷歌就将自己此前最强的人工智能模型PaLm 2融入了Gemini的能力之中。

在一段公布的演示视频中，桑达尔・皮查伊展示了Gemini对视频、图像的非同凡响的识别能力。在视频中，Gemini极为自如地在图像、音频、视频各模态之间的转换，展现了惊人的解锁应用场景与产品形态的潜力。

图源：谷歌演示视频

仅从谷歌释出的演示视频结果看，市面上现有的全部多模态大模型与Gemini的性能表现都有代际差，包括Meta 5月开源的跨6个模态的AI模型ImageBind以及GPT-4。

图源：谷歌

今年4月开始，随着多模态技术不断升级，以及叠加模型调用成本等性能的优化，GPT4及国内外一众模型持续迭代，实现了跨模态性能的不断增强。一时间，多模态大模型呈百花齐放之势。但有国内头部大模型初创开发工程师对界面新闻记者表示，现今绝大部分多模态大模型都是在大语言模型LLM之上生长出多模态的应用，而并非从头开始训练的多模态的大模型，这是多模态大模型目前“不能言说的秘密”。

图源：中信建投证券

谷歌自己也提到，到目前为止，创建多模态模型的标准方法基本是针对不同模态训练单独的组件，然后将它们拼接以粗略模仿其中一些功能。这会导致这些模型有时擅长执行某些任务，例如描述图像，但难以处理更概念性和复杂的推理。

其通过60页的相关技术报告证明，Gemini是一个真正原生的多模态大模型，因为从最初的预训练数据开始，Gemini就在针对不同模态的模型进行训练，因此其功能在每个重大领域都达到了SOTA（State of the art，特指领先水平的大模型）。

图源：谷歌技术报告

在权威MMMU基准测试中，Gemini Ultra获得了59.4%的SOTA分数。这项基准测试是经典的多模态测试，由跨不同领域的多模式任务组成，能够体现大模型的深度推理能力，而推理过程本身，需要花费的成本要远远高于模型训练。谷歌技术报告同时显示，谷歌是使用TPUv5e和TPUv4来训练Gemini，尤其是训练Gemini Ultra时，使用了跨多个数据中心的大量TPUv4。

多模态能力之外，Gemini在专业知识储备和高级编码等领域都处在最前列。比如，Gemini Ultra在MMLU（大规模多任务语言理解数据集）中的得分率高达90.0%，这款MMLU数据集包含数学、物理、历史、法律、医学和伦理等57个科目，专门用于测试大模型的知识储备和解决问题能力。Gemini Ultra是第一个在MMLU上超越人类专家的大模型。

值得一提的是，谷歌此番并没有透露Ultra和Pro版本的具体参数规模，但根据量子位的分析，Gemini与谷歌此前的主力大模型PaLM-2相比，参数规模上要增大许多。此前，PaLM-2被曝参数规模为3400亿。

谷歌方面表示，Gemini将通过谷歌产品推向数十亿用户。从12月13日开始，开发者和企业客户可以通过Google AI Studio或Google Cloud Vertex AI中的Gemini API访问Gemini Pro。

今天凌晨，谷歌还同步发布了最新版本的计算芯片TPU v5p，相较上一代TPU v4性价比提升2.3倍，但这则消息完全被Gemini的光芒所掩盖。

以上内容为资讯信息快照，由td.fyun.cc爬虫进行采集并收录，本站未对信息做任何修改，信息内容不代表本站立场。

快照生成时间：2023-12-07 12:45:02

本站信息快照查询为非营利公共服务，如有侵权请联系我们进行删除。

信息原文地址：

更多关于强悍,模型,模态,模型,训练,能力的资讯：

科学家打造多模态模型，7B和1.3B小模型均开源，可部署手机

...模型。研究人员表示：“DeepSeek-VL 1.3B 小模型的性能同样强悍，在部分指标上超越了 7B 模型。” 这些小模型可以满足算力缺乏型开发者使用

2024-04-10 10:25:00

vivo发布自研大模型，为用户和开发者带来诸多惊喜

...件协同，充分挖掘芯片潜力，确保大模型在端侧运行时的强悍性能。未来，vivo计划开放成熟算法能力与端侧加速能力，与行业开发者合作，共同打造创新、便利、智能的业务场景，为用户提供

2024-10-14 01:53:00

背水一战狙击GPT-4，谷歌最强大模型Gemini终发布，听

...其进行微调，以进一步提升其能力。在性能上，Gemini相当强悍。Google放出了一系列测试结果，从自然图像、音频和视频理解到数学推理

2023-12-07 08:18:00

商汤发布开源社区最大最强多模态多任务通用大模型“书生2.5”

商汤发布开源社区最大最强多模态多任务通用大模型“书生2.5” 3月14日，商汤科技发布多模态多任务通用大模型“书生（INTERN）2.5”，在多模态多任务处理能力方面实现多项全新

2023-03-15 13:30:00

全模态对齐框架align-anything来啦：实现跨模态指

...、张钊为、汪明志、钟伊凡等。团队就强化学习方法及大模型的后训练对齐技术开展了一系列重要工作，包括 Aligner（NeurIPS 2024 Oral）

2024-10-18 09:47:00

聚焦产业级多模态大模型研发，清华团队「生数科技」完成近亿元天

...金。资金主要将用于核心研发团队的建设，加速多模态大模型和应用产品的研发。成立于2023年3月，生数科技由安全可控人工智能方案提供商瑞莱智慧RealAI、蚂蚁集团和BV百度风投

2023-06-19 09:03:00

紫东.太初再进化，揭秘全模态大模型的想象力

...内部分享中，奇绩创坛创始人陆奇直言：他已经跟不上大模型时代的“狂飙”速度了。在ChatGPT引发的现象级讨论下，千亿级大模型的军备竞赛愈演愈烈，不少企业赶趟儿式的交出了自家的

2023-05-12 06:00:00

首个多模态连续学习综述，港中文、清华、UIC联合发布

...态连续学习的最新进展连续学习（CL）旨在增强机器学习模型的能力，使其能够不断从新数据中学习，而无需进行所有旧数据的重新训练。连续学习的主要挑战是灾难性遗忘：当任务按顺序训练时

2024-11-14 09:46:00

英伟达开源NVLM 1.0屠榜多模态！纯文本性能不降反升

【新智元导读】NVLM 1.0系列多模态大型语言模型在视觉语言任务上达到了与GPT-4o和其他开源模型相媲美的水平，其在纯文本性能甚至超过了LLM骨干模型，特别是在文本数学和编码

2024-09-24 13:36:00

更多关于科技的资讯：

稳” “进” “新” ——3个关键词读懂南京经济前三季度“成

□南京日报/紫金山新闻记者张甜甜通讯员夏俊林娜10月31日，南京市统计局、国家统计局南京调查队发布南京经济“三季报”

2025-11-01 09:44:00

上海虹桥医院癫痫专病诊疗新高度：个性化方案，全程化守护

癫痫发作的不可预测性及其对记忆、情绪、社交、学业与工作等方面的深远影响，构成了广大患者面临的核心挑战。诊断的复杂、治疗方案的普适性困境以及持续管理的缺失

2025-11-01 10:05:00

第十季炒股大赛冠军诞生：光伏逆变器行业龙头涨幅登顶

在《大众证券报》读者俱乐部第十季炒股比赛中，选手“馨小憩”以159.84元/股推荐的阳光电源(300274)，荐股涨幅19

2025-11-01 11:00:00

秦皇岛经开区：国内首款真空高压铸造人形机器人骨骼零部件下线

近日，国内首款真空高压铸造人形机器人腿部骨骼零部件在中信戴卡股份有限公司研制成功并生产下线，首批20件量产产品已发往国内客户

2025-11-01 11:10:00

爆款AI笔记本是如何“炼成”的？双十一，记者带你探厂

视频制作：陈希河北新闻网讯（记者李春炜）随着AI技术飞速发展，在今年的双十一期间，AI笔记本也成为爆款产品。近日，记者走进安徽合肥的联想PC设备研发和制造基地

2025-11-01 15:39:00

版权赋能创新发展 “版权强企燕赵行”活动走进高阳

10月30日，“版权强企燕赵行”活动走进保定市高阳县。活动通过进企问需、校企对接、版权法律法规科普、版权服务平台及版权区块链平台推介等方式

2025-11-01 15:47:00

荣膺金辑奖双料大奖东软赋能全球汽车产业智能化变革

10月30日，在由盖世汽车主办的2025第七届“金辑奖”颁奖盛典上，东软集团凭借在智能汽车互联领域持续的产品创新与卓越的全球化实践

2025-11-01 16:16:00

钻戒定制怎么选？2025五大宝藏品牌全解析，一篇避坑

准备结婚选钻戒，却被天然钻的高价劝退？想入手培育钻戒，又怕遇到“参数虚标”“售后无保障”的问题？2025年培育钻石市场规模突破300亿元

2025-11-01 16:17:00

第三十七届中国仿真大会在合肥市庐阳区召开

大皖新闻讯 11月1日，第三十七届中国仿真大会在合肥市庐阳区召开，大会以“数智仿真、新质发展”为主题，吸引全国约千名学者与业界代表

2025-11-02 00:04:00

“科大讯飞1024科博展”亮点抢先看！现场黑科技拉满，免费开

大皖新闻讯想让AI陪你对弈吗？想穿越时空与孙悟空来场“智慧交锋”吗？第八届世界声博会暨2025科大讯飞全球1024开发者节科博展将于11月2日至6日在合肥体育中心启幕

2025-11-02 00:04:00

出海再提速！锦江酒店（中国区）宣布旗下7天酒店出海，同日签约

锦江酒店（中国区）规模化出海再次迎来关键节点。10月31日，其于深圳正式宣布，国民品牌7天酒店将进军东南亚市场。这是继今年8月底

2025-11-01 10:02:00

拓宽合作渠道深化技术创新山西电机亮相亚洲国际展会

10月28日，亚洲国际动力传动与控制技术展览会(PTC ASIA 2025)在上海新国际博览中心启幕。近1800家海内外知名展商齐聚

2025-11-01 07:03:00

正式发布！视源股份牵头制定《娱乐用车载显示系统图像质量技术规

2025年10月23日，在全国音频、视频及多媒体系统与设备标准化技术委员会（SAC/TC 242）商用显示标准研究组第六次全会暨标准研讨会上

2025-10-31 08:20:00

中感集团煤仓安全综合解决方案亮相中国国际煤炭采矿展，以系统性

在北京举行的第21届中国国际煤炭采矿技术交流与设备展览会上，中感集团创新展示的“煤仓安全综合解决方案”引发行业高度关注

2025-10-31 08:51:00

人工智能产业决胜与 Data&AI 数据基础设施建设——科杰

2025中国国际数字经济博览会在石家庄国际会展中心开幕。科杰科技董事长于洋受邀出席2025首席数据官峰会论坛,并作主题为《人工智能产业决胜与 Data&

2025-10-31 08:51:00

头条订阅服务

反击OpenAI，谷歌放出最强悍大模型Gemini