• 我的订阅
  • 国际

谷歌推出其最先进AI模型Gemini,希望击败GPT-4

类别:国际 发布时间:2023-12-07 10:21:00 来源:​ 澎湃新闻

当地时间12月6日,谷歌公司宣布推出其规模最大、功能最强大的新大型语言模型Gemini,其最强大的TPU(张量处理单元)系统“Cloud TPU v5p”以及来自谷歌云的人工智能超级计算机。v5p是今年早些时候全面推出的Cloud TPU v5e的更新版本,谷歌承诺其速度明显快于v4 TPU。

一年前,在人工智能开发机构OpenAI发布聊天机器人ChatGPT后,创造了当前人工智能热潮背后大部分基础技术的谷歌措手不及,一度发布了内部“红色警报”(red code)。一年零一周后,谷歌似乎准备好了反击。

谷歌DeepMind首席执行官、Gemini团队代表德米斯·哈萨比斯(Demis Hassabis)在发布会上正面谈及GPT-4与Gemini的对比,“我们对系统进行了非常彻底的分析,并进行了基准测试。谷歌运行了32个完善的基准测试来比较这两个模型,从广泛的整体测试(如多任务语言理解基准测试)到比较两个模型生成Python代码的能力。”哈萨比斯略带微笑地表示,“我认为我们在32项基准中的30项中大幅领先。”

从发布日起,Gemini可开始应用于Bard和Pixel 8 Pro智能手机,并将很快与谷歌服务中的其他产品集成,包括Chrome、搜索和广告等。

大型语言模型Gemini包括一套三种不同规模的模型:Gemini Ultra是最大、功能最强大的类别,被定位为GPT-4的竞争对手;Gemini Pro是一款中端型号,能够击败GPT-3.5,可扩展多种任务;Gemini Nano用于特定任务和移动设备。

谷歌推出其最先进AI模型Gemini,希望击败GPT-4

目前,谷歌计划通过谷歌云将Gemini授权给客户,供他们在自己的应用程序中使用。12月13日开始,开发者和企业客户可以通过谷歌AI Studio或谷歌Cloud Vertex AI中的Gemini API(应用程序编程接口)访问Gemini Pro,安卓开发人员可以使用Gemini Nano完成构建。

从发布会当天开始,谷歌聊天机器人Bard将使用Gemini Pro来实现高级推理、规划、理解和其他功能。明年初,谷歌将推出Bard Advanced,其将使用Gemini Ultra,这代表了Bard发布以来的最大更新。

从发布会当天开始,Pixel 8 Pro手机的两项功能将由Gemini Nano提供支持:录音机应用中的自动摘要功能以及Gboard键盘的智能回复部分。由于模型在手机中运行,因此两者都可以离线工作,因此应该能拥有快速且原生的体验。谷歌表示,Nano的目标是创建一个尽可能强大的Gemini版本,但同时不会占用手机的存储空间或使处理器过热。

据介绍,Gemini Ultra是第一个在MMLU(大规模多任务语言理解)方面超越人类专家的模型,该模型综合使用数学、物理、历史、法律、医学和伦理学等57个科目来测试世界知识和解决问题的能力,谷歌在一篇博客文章中表示,它可以理解复杂主题中的细微差别和推理。

据哈萨比斯介绍,在对比Gemini和GPT-4的基准测试中,Gemini最明显的优势来自于它理解视频和音频并与之交互的能力。这很大程度上是设计使然:多模态在最开始就是Gemini计划的一部分。谷歌没有像OpenAI构建DALL·E(文生图模型)和Whisper(语音识别模型)那样单独训练图像和语音模型,而是从一开始就建立为一个多感官模型。

而据CNBC报道,谷歌高管们在新闻发布会上表示Gemini Pro的表现优于GPT-3.5,但回避了与GPT-4相比如何的问题。对于谷歌是否计划对Bard Advanced的访问收费,Bard总经理萧茜茜(Sissie Hsiao)表示,谷歌专注于创造良好的体验,目前还没有任何相关盈利的细节。

“我们一直对非常通用的系统感兴趣。”哈萨比斯说,他对如何混合所有这些模态特别感兴趣,“从任意数量的输入和感知中收集尽可能多的数据,然后给出尽可能多的响应。”

Gemini最基本的模型是文本输入和文本输出,但更强大的模型(如Gemini Ultra)可以处理图像、视频和音频。哈萨比斯说,它甚至会变得更加通用,有像动作和触摸之类更像机器人类型的东西。他认为,随着时间的推移,Gemini将获得更多的感知,变得更有意识,并在这个过程中变得更加准确和稳定。“这些模型只是更好地了解周围的世界。当然,这些模型仍然存在幻觉,并且仍然存在偏见和其他问题。”但哈萨比斯表示,它们知道的越多,就会做得越好。

谷歌似乎特别将编程视为Gemini的杀手级应用程序,它使用了一种名为AlphaCode 2的新代码生成系统,据称该系统的性能优于85%的编程竞赛参与者,而原始AlphaCode的这一比例为50%。

谷歌首席执行官桑达尔·皮查伊(Sundar Pichai)表示,用户会注意到模型涉及的几乎所有方面都有所改进。

值得注意的是,今年5月,包括哈萨比斯在内的500多名著名学者和行业领袖签署的一份声明称,“与流行病和核战争等其他社会规模风险一样,减轻人工智能带来的灭绝风险应该成为全球优先事项。”

在这次发布会中,哈萨比斯和皮查伊对于谷歌似乎步调缓慢的说法回应道,他们不愿意为了跟上步伐而走得太快,“尤其是当我们越来越接近人工智能的终极梦想‘通用人工智能’时”。“当我们接近通用人工智能时,事情将会有所不同。”哈萨比斯说,“这是某种具有主动性的技术,所以我认为我们必须谨慎对待,谨慎但乐观。”

谷歌表示,通过内部和外部测试以及警示团队(red-teaming),它一直在努力确保Gemini的安全和责任。皮查伊指出,确保数据的安全性和可靠性对于企业优先的产品尤为重要,这也是大多数生成式人工智能利润的来源。与此同时,哈萨比斯也承认,推出最先进的人工智能系统的风险之一就是,它会出现没人能预测到的问题和攻击向量(attack vector)。“这就是为什么你必须释放一些东西,去观察和学习。”他说。

谷歌发布Gemini Ultra的速度较慢,哈萨比斯把它比作一个可控的测试版,为这个谷歌最强大、最不受约束的模型提供了一个“更安全的试验区”。“基本上,如果Gemini有一个破坏婚姻的另类人格,谷歌会在你之前找到它。”这番话影射了此前微软必应聊天机器人向《纽约时报》专栏作家凯文·卢斯(Kevin Roose)求婚,并试图拆散他的婚姻。

上周,The Information报道称,因为人工智能“无法可靠地处理一些非英语查询”,所以谷歌原定于本周举行的Gemini现场演示被无限期推迟。在回答有关外语问题的问题时,谷歌DeepMind产品副总裁艾力·柯林斯(Eli Collins)表示:“事实上,Gemini在多语言能力方面表现相当出色。”

与新模型一起亮相的,还有新版本的TPU芯片TPU v5p,旨在减少训练大语言模型相关的时间投入。TPU是谷歌为神经网络设计的专用芯片,经过优化可加快机器学习模型的训练和推断速度,谷歌于2016年起开始推出第一代TPU。

谷歌推出其最先进AI模型Gemini,希望击败GPT-4

据谷歌介绍,与TPU v4相比,TPU v5p的浮点运算性能提升了两倍,在高带宽内存方面提高了3倍。使用谷歌的600 GB/s芯片间互连,可以将8960个v5p加速器耦合在一个Pod(通常指一个包含多个芯片的集群或模块)中,从而更快或更高精度地训练模型。作为参考,该值比TPU v5e大35倍,是TPU v4的两倍多。

谷歌称,TPU v5p是其迄今为止最强大的,能够提供459 teraFLOPS(每秒可执行459万亿次浮点运算)的bfloat16(16位浮点数格式)性能或918 teraOPS(每秒可执行918万亿次整数运算)的Int8(执行8位整数)性能,支持95GB的高带宽内存,能够以2.76 TB/s的速度传输数据。

谷歌表示,所有这些意味着TPU v5p可以比TPU v4更快地训练大型语言模型,如训练GPT-3(1750亿参数)这样的大语言模型速度比TPU v4快2.8倍。

不过,这种更高的性能和可扩展性也是有代价的。每个TPU v5p加速器的运行费用为每小时4.2美元,而TPU v4加速器为每小时3.22美元,TPU v5e加速器每小时1.2美元。

谷歌推出其最先进AI模型Gemini,希望击败GPT-4

“在我们的早期使用阶段,谷歌DeepMind和谷歌Research观察到,与我们的TPU v4芯片相比,使用TPU v5p芯片的大语言模型(LLM)训练工作负载的速度提高了两倍。”谷歌DeepMind首席科学家杰夫·迪恩(Jeff Dean)写道,“对机器学习框架(JAX、PyTorch、TensorFlow)和编排工具的强大支持使我们能够在v5p上更高效地扩展。通过第二代SparseCores,我们还看到嵌入密集型工作负载的性能有了显着提高。TPU对于我们在Gemini等尖端模型上进行最大规模的研究和工程工作至关重要。”

除了新硬件之外,谷歌还引入了“人工智能超级计算机”的概念。谷歌云将其描述为一种超级计算架构,包括一个集成系统,具有开放软件、性能优化硬件、机器学习框架和灵活的消费模型。

谷歌计算和机器学习基础设施部门副总裁马克·洛迈尔(Mark Lohmeyer)在博客文章中解释道,“传统方法通常通过零碎的组件级增强来解决要求苛刻的人工智能工作负载,这可能会导致效率低下和瓶颈。”“相比之下,人工智能超级计算机采用系统级协同设计来提高人工智能训练、调整和服务的效率和生产力。”这可以理解为,与单独看待每个部分相比,这种合并将提高生产力和效率。换句话说,超级计算机是一个系统,其中任何可能导致性能低下的变量(硬件或软件)都受到控制和优化。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-12-07 14:45:01

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

DeepMind:我们的下一个算法将超越ChatGPT
...·德罗曼(SAMUEL DE ROMAN)/GETTY IMAGES2016 年,谷歌的 DeepMind 人工智能实验室的一个名为 AlphaGo 的人工智能程序
2023-07-14 20:00:00
谷歌DeepMind CEO评价Deepseek为中国最好的作品:但外界炒作有点夸大
...实这背后并没有真正的新的科学进步……它(DeepSeek)在人工智能中使用的是已知的技术。”他补充说,围绕DeepSeek的炒作“有点夸张”
2025-02-10 12:47:00
...谷歌公司6日宣布推出该公司“规模最大、功能最强”的人工智能模型“双子座(Gemini)”。谷歌旗下人工智能公司“深层思维”的首席执行官兼联合创始人德米斯·哈萨比斯代表“双子座
2023-12-08 07:31:00
阿尔法狗咬向ChatGPT七寸
...法。在他们二人眼中,DeepMind是最有可能率先开发出通用人工智能(AGI)的公司。于是,在2015年的夏天,距离谷歌收购DeepMind过去一年多
2023-06-29 18:08:00
谷歌全面整合AI力量背后:DeepMind浮沉史
...斯和莱格结识于伦敦大学学院,两人分别拥有神经科学和人工智能的博士学位。苏莱曼则专注于产品开发和政策方面。或许和哈萨比斯与苏莱曼分别拥有剑桥和牛津的学习经历有关,几年之内,许多
2024-04-22 11:23:00
...作一样。他说到:“其中有一些(炒作和欺诈)已经波及人工智能领域,我认为这有点不幸,(因为这)掩盖了这项非常了不起的科学研究。在某种程度上,人工智能的宣传还不够,但在某些方面又
2024-04-01 16:15:00
...新种类的蛋白质。德米斯·哈萨比斯和约翰·江珀开发出人工智能模型来解决预测蛋白质复杂结构的问题。这些发现蕴藏着巨大潜力。”通报称,2003年,戴维·贝克成功设计出一种新的蛋白质
2024-10-09 20:54:00
google发布imagen3图像生成技术
...大会上,Google发布了Imagen3,这是该科技巨头Imagen生成式人工智能模型家族的最新产品。Google人工智能研究部门DeepMind负责人德米斯-哈萨比斯(DemisHassabis)说
2024-05-16 11:05:00
3位科学家获得诺贝尔化学奖:AI破解了几乎所有蛋白质密码
...蛋白质。该委员会补充说,哈萨比斯和江珀则创建了一个人工智能(AI)模型,该模型能够预测研究人员已经确定的几乎所有2亿种蛋白质的结构
2024-10-09 19:41:00
更多关于国际的资讯:
历史性大阅兵,中国给世界的10个强烈信号
长安街上,铁流滚滚,展示的是一个民族从苦难走向辉煌的伟大复兴之路。抗战胜利80周年大阅兵,也是迄今抗战胜利最大规模的一次阅兵
2025-09-04 00:07:00
德百集团组织员工集体观看纪念中国人民抗日战争暨世界反法西斯战争胜利80周年大会电视直播
鲁网9月3日讯(记者 吴美琳 实习记者 李安琦 通讯员 张宪军 班晓晨 孙芳霞)9月3日,德百集团组织员工集体观看纪念中国人民抗日战争暨世界反法西斯战争胜利80周年大会电视直播并
2025-09-03 15:57:00
九三阅兵超全观看指南,请收好!
来源 人民日报客户端编辑 刘思博二审 李劼三审 刘丹
2025-09-03 12:36:00
特别海报丨纪念中国人民抗日战争暨世界反法西斯战争胜利80周年
吉刻新闻 设计 宁静 吴美慧文字来源 新华社
2025-09-03 09:22:00
中国网9月2日讯(记者 李智)“中方愿同各国一道,推动构建更加公正合理的全球治理体系,携手迈向人类命运共同体。”9月1日
2025-09-02 14:14:00
中新经纬9月2日电 据日经中文网9月2日报道,日本三得利控股公司9月2日正式发布消息,该公司会长新浪刚史已于9月1日辞职
2025-09-02 17:05:00
特朗普憋了一肚子火,他拿普京泽连斯基毫无办法,只能自己生闷气
特朗普现在憋了一肚子火,事实已经证明,他拿普京和泽连斯基毫无办法。美媒《大西洋月刊》日前援引一位白宫高级官员的话称,特朗普最近私下里对自己高调的外交努力毫无成果感到“十分愤怒”
2025-09-02 15:22:00
中新经纬9月2日电 中国“免签朋友圈”再+1。9月2日,中国外交部发言人郭嘉昆在例行记者会上表示,为进一步便利中外人员往来
2025-09-02 19:54:00
沙特携足球巨星C罗推出全球旅游宣传活动 活动日历解锁精彩纷呈
沙特利雅得,2025 年9月2日——沙特旅游局(STA)旗下面向消费者的品牌 “沙特,寻秘启程” 今日重磅推出最新全球宣传活动
2025-09-02 12:58:00
电影《血色牢笼》定档9月5日,取材真实事件揭露法西斯罪行
中国青年报客户端讯(中青报·中青网记者 沈杰群)由马克西姆·布里乌斯执导的俄罗斯电影《血色牢笼》定档9月5日全国上映。海报
2025-09-01 18:09:00
陈柏阳/刘毅晋级羽毛球世锦赛男双决赛
当地时间30日晚,2025年世界羽毛球锦标赛第六个比赛日迎来压轴大战——男双半决赛。中国组合陈柏阳、刘毅迎战印度组合兰基雷迪
2025-08-31 15:19:00
哥伦比亚政府宣布禁止向以色列出口煤炭
当地时间8月30日,哥伦比亚贸易、工业和旅游部发布公告称,鉴于针对巴勒斯坦民众的战争行为持续不断,哥伦比亚贸易、工业和旅游部宣布2025年8月28日第0949号法令生效
2025-08-31 14:48:00
博览东北亚!在东北亚博览会寻找炫酷机器人!
吉刻新闻 记者 陈振昂 设计 王丽华
2025-08-31 14:50:00
抗战胜利80周年纪念活动新闻中心将于9月1日下午举办第二场记者见面会
中国网8月31日讯 9月1日(星期一)下午3时,中国人民抗日战争暨世界反法西斯战争胜利80周年纪念活动新闻中心将在梅地亚新闻中心二层新闻发布厅举办第二场记者见面会
2025-08-31 11:23:00