• 我的订阅
  • 国际

谷歌推出其最先进AI模型Gemini,希望击败GPT-4

类别:国际 发布时间:2023-12-07 10:21:00 来源:​ 澎湃新闻

当地时间12月6日,谷歌公司宣布推出其规模最大、功能最强大的新大型语言模型Gemini,其最强大的TPU(张量处理单元)系统“Cloud TPU v5p”以及来自谷歌云的人工智能超级计算机。v5p是今年早些时候全面推出的Cloud TPU v5e的更新版本,谷歌承诺其速度明显快于v4 TPU。

一年前,在人工智能开发机构OpenAI发布聊天机器人ChatGPT后,创造了当前人工智能热潮背后大部分基础技术的谷歌措手不及,一度发布了内部“红色警报”(red code)。一年零一周后,谷歌似乎准备好了反击。

谷歌DeepMind首席执行官、Gemini团队代表德米斯·哈萨比斯(Demis Hassabis)在发布会上正面谈及GPT-4与Gemini的对比,“我们对系统进行了非常彻底的分析,并进行了基准测试。谷歌运行了32个完善的基准测试来比较这两个模型,从广泛的整体测试(如多任务语言理解基准测试)到比较两个模型生成Python代码的能力。”哈萨比斯略带微笑地表示,“我认为我们在32项基准中的30项中大幅领先。”

从发布日起,Gemini可开始应用于Bard和Pixel 8 Pro智能手机,并将很快与谷歌服务中的其他产品集成,包括Chrome、搜索和广告等。

大型语言模型Gemini包括一套三种不同规模的模型:Gemini Ultra是最大、功能最强大的类别,被定位为GPT-4的竞争对手;Gemini Pro是一款中端型号,能够击败GPT-3.5,可扩展多种任务;Gemini Nano用于特定任务和移动设备。

谷歌推出其最先进AI模型Gemini,希望击败GPT-4

目前,谷歌计划通过谷歌云将Gemini授权给客户,供他们在自己的应用程序中使用。12月13日开始,开发者和企业客户可以通过谷歌AI Studio或谷歌Cloud Vertex AI中的Gemini API(应用程序编程接口)访问Gemini Pro,安卓开发人员可以使用Gemini Nano完成构建。

从发布会当天开始,谷歌聊天机器人Bard将使用Gemini Pro来实现高级推理、规划、理解和其他功能。明年初,谷歌将推出Bard Advanced,其将使用Gemini Ultra,这代表了Bard发布以来的最大更新。

从发布会当天开始,Pixel 8 Pro手机的两项功能将由Gemini Nano提供支持:录音机应用中的自动摘要功能以及Gboard键盘的智能回复部分。由于模型在手机中运行,因此两者都可以离线工作,因此应该能拥有快速且原生的体验。谷歌表示,Nano的目标是创建一个尽可能强大的Gemini版本,但同时不会占用手机的存储空间或使处理器过热。

据介绍,Gemini Ultra是第一个在MMLU(大规模多任务语言理解)方面超越人类专家的模型,该模型综合使用数学、物理、历史、法律、医学和伦理学等57个科目来测试世界知识和解决问题的能力,谷歌在一篇博客文章中表示,它可以理解复杂主题中的细微差别和推理。

据哈萨比斯介绍,在对比Gemini和GPT-4的基准测试中,Gemini最明显的优势来自于它理解视频和音频并与之交互的能力。这很大程度上是设计使然:多模态在最开始就是Gemini计划的一部分。谷歌没有像OpenAI构建DALL·E(文生图模型)和Whisper(语音识别模型)那样单独训练图像和语音模型,而是从一开始就建立为一个多感官模型。

而据CNBC报道,谷歌高管们在新闻发布会上表示Gemini Pro的表现优于GPT-3.5,但回避了与GPT-4相比如何的问题。对于谷歌是否计划对Bard Advanced的访问收费,Bard总经理萧茜茜(Sissie Hsiao)表示,谷歌专注于创造良好的体验,目前还没有任何相关盈利的细节。

“我们一直对非常通用的系统感兴趣。”哈萨比斯说,他对如何混合所有这些模态特别感兴趣,“从任意数量的输入和感知中收集尽可能多的数据,然后给出尽可能多的响应。”

Gemini最基本的模型是文本输入和文本输出,但更强大的模型(如Gemini Ultra)可以处理图像、视频和音频。哈萨比斯说,它甚至会变得更加通用,有像动作和触摸之类更像机器人类型的东西。他认为,随着时间的推移,Gemini将获得更多的感知,变得更有意识,并在这个过程中变得更加准确和稳定。“这些模型只是更好地了解周围的世界。当然,这些模型仍然存在幻觉,并且仍然存在偏见和其他问题。”但哈萨比斯表示,它们知道的越多,就会做得越好。

谷歌似乎特别将编程视为Gemini的杀手级应用程序,它使用了一种名为AlphaCode 2的新代码生成系统,据称该系统的性能优于85%的编程竞赛参与者,而原始AlphaCode的这一比例为50%。

谷歌首席执行官桑达尔·皮查伊(Sundar Pichai)表示,用户会注意到模型涉及的几乎所有方面都有所改进。

值得注意的是,今年5月,包括哈萨比斯在内的500多名著名学者和行业领袖签署的一份声明称,“与流行病和核战争等其他社会规模风险一样,减轻人工智能带来的灭绝风险应该成为全球优先事项。”

在这次发布会中,哈萨比斯和皮查伊对于谷歌似乎步调缓慢的说法回应道,他们不愿意为了跟上步伐而走得太快,“尤其是当我们越来越接近人工智能的终极梦想‘通用人工智能’时”。“当我们接近通用人工智能时,事情将会有所不同。”哈萨比斯说,“这是某种具有主动性的技术,所以我认为我们必须谨慎对待,谨慎但乐观。”

谷歌表示,通过内部和外部测试以及警示团队(red-teaming),它一直在努力确保Gemini的安全和责任。皮查伊指出,确保数据的安全性和可靠性对于企业优先的产品尤为重要,这也是大多数生成式人工智能利润的来源。与此同时,哈萨比斯也承认,推出最先进的人工智能系统的风险之一就是,它会出现没人能预测到的问题和攻击向量(attack vector)。“这就是为什么你必须释放一些东西,去观察和学习。”他说。

谷歌发布Gemini Ultra的速度较慢,哈萨比斯把它比作一个可控的测试版,为这个谷歌最强大、最不受约束的模型提供了一个“更安全的试验区”。“基本上,如果Gemini有一个破坏婚姻的另类人格,谷歌会在你之前找到它。”这番话影射了此前微软必应聊天机器人向《纽约时报》专栏作家凯文·卢斯(Kevin Roose)求婚,并试图拆散他的婚姻。

上周,The Information报道称,因为人工智能“无法可靠地处理一些非英语查询”,所以谷歌原定于本周举行的Gemini现场演示被无限期推迟。在回答有关外语问题的问题时,谷歌DeepMind产品副总裁艾力·柯林斯(Eli Collins)表示:“事实上,Gemini在多语言能力方面表现相当出色。”

与新模型一起亮相的,还有新版本的TPU芯片TPU v5p,旨在减少训练大语言模型相关的时间投入。TPU是谷歌为神经网络设计的专用芯片,经过优化可加快机器学习模型的训练和推断速度,谷歌于2016年起开始推出第一代TPU。

谷歌推出其最先进AI模型Gemini,希望击败GPT-4

据谷歌介绍,与TPU v4相比,TPU v5p的浮点运算性能提升了两倍,在高带宽内存方面提高了3倍。使用谷歌的600 GB/s芯片间互连,可以将8960个v5p加速器耦合在一个Pod(通常指一个包含多个芯片的集群或模块)中,从而更快或更高精度地训练模型。作为参考,该值比TPU v5e大35倍,是TPU v4的两倍多。

谷歌称,TPU v5p是其迄今为止最强大的,能够提供459 teraFLOPS(每秒可执行459万亿次浮点运算)的bfloat16(16位浮点数格式)性能或918 teraOPS(每秒可执行918万亿次整数运算)的Int8(执行8位整数)性能,支持95GB的高带宽内存,能够以2.76 TB/s的速度传输数据。

谷歌表示,所有这些意味着TPU v5p可以比TPU v4更快地训练大型语言模型,如训练GPT-3(1750亿参数)这样的大语言模型速度比TPU v4快2.8倍。

不过,这种更高的性能和可扩展性也是有代价的。每个TPU v5p加速器的运行费用为每小时4.2美元,而TPU v4加速器为每小时3.22美元,TPU v5e加速器每小时1.2美元。

谷歌推出其最先进AI模型Gemini,希望击败GPT-4

“在我们的早期使用阶段,谷歌DeepMind和谷歌Research观察到,与我们的TPU v4芯片相比,使用TPU v5p芯片的大语言模型(LLM)训练工作负载的速度提高了两倍。”谷歌DeepMind首席科学家杰夫·迪恩(Jeff Dean)写道,“对机器学习框架(JAX、PyTorch、TensorFlow)和编排工具的强大支持使我们能够在v5p上更高效地扩展。通过第二代SparseCores,我们还看到嵌入密集型工作负载的性能有了显着提高。TPU对于我们在Gemini等尖端模型上进行最大规模的研究和工程工作至关重要。”

除了新硬件之外,谷歌还引入了“人工智能超级计算机”的概念。谷歌云将其描述为一种超级计算架构,包括一个集成系统,具有开放软件、性能优化硬件、机器学习框架和灵活的消费模型。

谷歌计算和机器学习基础设施部门副总裁马克·洛迈尔(Mark Lohmeyer)在博客文章中解释道,“传统方法通常通过零碎的组件级增强来解决要求苛刻的人工智能工作负载,这可能会导致效率低下和瓶颈。”“相比之下,人工智能超级计算机采用系统级协同设计来提高人工智能训练、调整和服务的效率和生产力。”这可以理解为,与单独看待每个部分相比,这种合并将提高生产力和效率。换句话说,超级计算机是一个系统,其中任何可能导致性能低下的变量(硬件或软件)都受到控制和优化。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-12-07 14:45:01

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

DeepMind:我们的下一个算法将超越ChatGPT
...·德罗曼(SAMUEL DE ROMAN)/GETTY IMAGES2016 年,谷歌的 DeepMind 人工智能实验室的一个名为 AlphaGo 的人工智能程序
2023-07-14 20:00:00
谷歌DeepMind CEO评价Deepseek为中国最好的作品:但外界炒作有点夸大
...实这背后并没有真正的新的科学进步……它(DeepSeek)在人工智能中使用的是已知的技术。”他补充说,围绕DeepSeek的炒作“有点夸张”
2025-02-10 12:47:00
...谷歌公司6日宣布推出该公司“规模最大、功能最强”的人工智能模型“双子座(Gemini)”。谷歌旗下人工智能公司“深层思维”的首席执行官兼联合创始人德米斯·哈萨比斯代表“双子座
2023-12-08 07:31:00
阿尔法狗咬向ChatGPT七寸
...法。在他们二人眼中,DeepMind是最有可能率先开发出通用人工智能(AGI)的公司。于是,在2015年的夏天,距离谷歌收购DeepMind过去一年多
2023-06-29 18:08:00
谷歌全面整合AI力量背后:DeepMind浮沉史
...斯和莱格结识于伦敦大学学院,两人分别拥有神经科学和人工智能的博士学位。苏莱曼则专注于产品开发和政策方面。或许和哈萨比斯与苏莱曼分别拥有剑桥和牛津的学习经历有关,几年之内,许多
2024-04-22 11:23:00
...作一样。他说到:“其中有一些(炒作和欺诈)已经波及人工智能领域,我认为这有点不幸,(因为这)掩盖了这项非常了不起的科学研究。在某种程度上,人工智能的宣传还不够,但在某些方面又
2024-04-01 16:15:00
...新种类的蛋白质。德米斯·哈萨比斯和约翰·江珀开发出人工智能模型来解决预测蛋白质复杂结构的问题。这些发现蕴藏着巨大潜力。”通报称,2003年,戴维·贝克成功设计出一种新的蛋白质
2024-10-09 20:54:00
google发布imagen3图像生成技术
...大会上,Google发布了Imagen3,这是该科技巨头Imagen生成式人工智能模型家族的最新产品。Google人工智能研究部门DeepMind负责人德米斯-哈萨比斯(DemisHassabis)说
2024-05-16 11:05:00
3位科学家获得诺贝尔化学奖:AI破解了几乎所有蛋白质密码
...蛋白质。该委员会补充说,哈萨比斯和江珀则创建了一个人工智能(AI)模型,该模型能够预测研究人员已经确定的几乎所有2亿种蛋白质的结构
2024-10-09 19:41:00
更多关于国际的资讯:
中国网12月1日讯 据中国驻伊朗大使馆消息,近期,驻伊朗大使馆接报多起来伊旅游、参展的中国公民遭遇盗抢案件,包括被迷晕后遭抢
2025-12-01 07:55:00
法国卢浮宫将对大多数非欧盟国家游客提高门票价格
法国卢浮宫28日确认,将于明年开始对大多数非欧盟国家的游客提高门票价格。据法新社、法国BFM电视台报道,卢浮宫博物馆管理层透露
2025-11-30 03:05:00
11月29日下午,一批重达240千克的印尼冷冻榴莲抵榕。这是全国首票进口的印尼冷冻榴莲,也是中印尼两国深化经贸合作取得的又一重要成果。
2025-11-29 22:30:00
11月29日,一名中国公民在泰柬边境地区不幸触雷受伤。事发后,中国驻泰国大使馆第一时间与泰方有关部门紧急联络,协调泰方全力开展伤员救治
2025-11-29 20:20:00
央视记者当地时间11月28日获悉,美国联邦航空局表示,由于发现炸弹威胁,飞往美国费城国际机场的航班全部停飞。来源 央视新闻客户端编辑 陈美伊二审 杨韬三审 田旻佳
2025-11-29 14:37:00
11月27日,中国驻刚果民主共和国大使馆发布《刚果(金)安全形势通报(2025年11月26日)》,提醒中国公民尽快撤离
2025-11-28 14:08:00
中国网11月28日讯 据中国驻塔吉克斯坦大使馆消息,塔使馆发布关于在塔中国公民遇袭的情况通报和安全提示。11月26日晚
2025-11-28 14:36:00
中新经纬11月27日电 据商务部网站27日消息,商务部新闻发言人就中马关于“马美对等贸易协议”开展双边沟通情况答记者问
2025-11-27 21:20:00
当地时间11月25日,联合国大会主席贝尔伯克和安全理事会轮值主席国塞拉利昂联合发布信函,正式启动下一任联合国秘书长的遴选和任命程序
2025-11-26 14:40:00
海外网11月26日电 据《印度斯坦时报》26日报道,印度马哈拉施特拉邦孟买25日发生氯气泄漏事故,已造成1人死亡,至少13人受影响后被送医。(海外网 张霓)海外网版权作品,未经授
2025-11-26 10:22:00
中国网11月25日讯 据中国驻福冈总领事馆消息,日本气象厅发布,日本时间11月25日18时01分左右,熊本县阿苏地区发生里氏5
2025-11-25 18:53:00
长白时评评论员 四岳11月25日,是联合国设立的“国际消除对妇女暴力日”,也被广泛称为“国际反家庭暴力日”。这一天,不只是一个纪念日
2025-11-25 14:21:00
外交部发言人毛宁11月24日在例行记者会上表示,近期日本领导人在涉台问题上公然发表错误言论,损害了中日韩合作的基础和氛围,导致当前不具备举行中日韩领导人会议的条件。来源 新华社编
2025-11-24 21:31:00
记者今天从航旅纵横了解到,截至目前,11月24日到12月31日国内到日本的计划航班量取消量较上月同期增长约56%。11月15日
2025-11-24 22:34:00
日本国土交通省24日表示,海上保安厅的大型无人机“海上卫士”(Sea Guardian)于当地时间23日在北九州机场着陆时
2025-11-25 01:10:00