• 我的订阅
  • 财经

全面叫板OpenAI!谷歌发布多模态大模型全家桶:从AI助手到文生视频模型

类别:财经 发布时间:2024-05-15 09:54:00 来源:澎湃新闻

被OpenAI抢先一天后,科技巨头谷歌不甘示弱,推出了自己的最新多模态AI(人工智能)产品。

当地时间5月14日,在谷歌I/O开发者大会上的主题演讲中,谷歌展示了由升级后Gemini模型驱动的AI助手项目Project Astra、对标Sora的文生视频模型Veo,以及在硬件方面发布的第六代Tensor处理器单元(TPU)Trillium芯片。根据发布会最后的官方统计,完全聚焦于AI的这场主题演讲总共提到了121次AI。

全面叫板OpenAI!谷歌发布多模态大模型全家桶:从AI助手到文生视频模型

完全聚焦于AI的这场主题演讲总共提到了121次AI。 来源:谷歌I/O主题演讲

谷歌CEO桑达尔·皮查伊(Sundar Pichai)表示,谷歌的所有工作都在围绕生成式AI模型Gemini展开,“我们希望每个人都能从Gemini所做的事情中受益”。

14日当天,谷歌(Nasdaq:GOOGL)股价收于每股171.93美元,涨0.6%,总市值2.12万亿美元。

AI搜索支持视频输入,Gemini、Gemma上新

作为搜索引擎巨头,AI搜索正是谷歌所做工作中的一部分。

据介绍,在最新Gemini的加持下,谷歌搜索将具备多步骤推理能力,可以一次性处理带有多个限制条件的长问题、帮助用户进行头脑风暴,并支持视频搜索,让用户通过拍摄视频来搜索解决方案。这些功能将先在美国推出,谷歌预计会在今年年底前将其带给超过10亿人。

谷歌AI搜索将具备多步骤推理能力。来源:谷歌

谷歌的Gemini以超长的上下文窗口而出名。在大会上,谷歌重点强调了大模型Gemini 1.5 Pro的多模态和长文本能力,为其推出一系列更新。谷歌将向全球150多个国家地区的Gemini Advanced订阅者提供最新模型、拥有100万个token的Gemini 1.5 Pro,支持超过35种语言,定价为每100万token 3.5美元。

据皮查伊介绍,Gemini 1.5会提供“迄今为止所有基础模型中最长的上下文窗口”。Gemini 1.5 Pro将在今年晚些时候将会把窗口进一步扩大至200万token,拓展同步处理多模态信息的边界。

从今年夏天开始,Gemini将支持语音实时交互,并在今年晚些时候上线实时视频交互。未来几个月内,谷歌也将推出类似于GPTs的自定义AI助手功能,名为Gems,可以与整套“谷歌全家桶”联动。

另外,对于一些需要快速响应的场景,谷歌推出了Gemini 1.5 Flash模型。Flash将是API中速度最快的Gemini模型,针对大规模、大批量的高配任务进行了优化,也具有100万token的长上下文窗口。

谷歌也在发布会上带来了旗下开源大模型Gemma的最新版本Gemma 2。据介绍,Gemma 2采用全新架构,参数上达到27B,拥有突破性的性能和效率。

AI助手Project Astra叫板GPT-4o

在OpenAI推出能够实现人类级别响应的智能助手GPT-4o后,谷歌的AI智能体项目Project Astra也重磅登场。

在演示视频中,Astra能够通过手机摄像头或智能眼镜看到的内容来分析响应语音命令。它成功地识别出代码序列、为电路图提出改进建议、能够通过镜头“看到”伦敦国王十字区,并提醒用户智能眼镜的放置位置。

全面叫板OpenAI!谷歌发布多模态大模型全家桶:从AI助手到文生视频模型

Project Astra是谷歌对于未来AI助手的展望。来源:谷歌

全面叫板OpenAI!谷歌发布多模态大模型全家桶:从AI助手到文生视频模型

谷歌AI助手将能够通过智能眼镜和用户一起观察世界。来源:谷歌

据介绍,谷歌在Gemini的基础上开发了Astra的原型,可以通过连续编码视频帧、将视频和语音输入组合到事件时间线中以实现更快地处理信息。通过语音模型,谷歌也强化了智能助手的说话能力,让其能够给出更快速的回应。

不过,在演示视频中,谷歌AI助手的回应速度似乎还是会比GPT-4o稍慢一些,语音所表现出的感情色彩也平淡一些。

皮查伊表示,谷歌计划从今年开始将Astra的功能添加到其Gemini应用程序及其产品中。不过,他也强调,虽然最终目标是“让Astra在公司的软件中实现无缝连接”,但该产品将被谨慎推出,并且“商业化之路将由质量驱动”。

除了在AI助手领域的竞争外,谷歌还通过文生视频模型Veo来反击OpenAI的Sora。Veo能够根据文字、图片和视频的提示来生成高质量的1080p视频,创作“一致且连贯”的镜头,用户可以对光照、镜头语言、视频颜色风格等进行自定义设置。不过,谷歌没有宣布Veo的具体推出时间。

全面叫板OpenAI!谷歌发布多模态大模型全家桶:从AI助手到文生视频模型

来源:谷歌I/O主题演讲

此外,谷歌还宣布了一系列与图像、音乐有关的生成式AI工具,包括能够表现更高细节水平的文生图工具Imagen 3,还有与Youtube以及音乐家合作的AI音乐工具“AI音乐沙盒”。

在硬件方面,谷歌将于今年晚些时候推出交付第六代数据中心AI芯片TPU Trillium。皮查伊表示,每块芯片的计算性能将比第五代提升4.7倍,谷歌通过扩大芯片的矩阵乘法单元(MXU)和提高整体时钟速度来实现这一目标。此外,第六代将比第五代芯片节能67%,谷歌还将Trillium芯片的内存带宽提高了一倍。

发布会后,著名AI学者吴恩达(Andrew Ng)对谷歌表示祝贺,称个人很期待“拥有200万个token的上下文窗口以及对设备上AI进行更好支持的Gemini”,认为其会为应用程序构建者带来新的机会。

英伟达高级研究科学家范麟熙(Jim Fan)表示:“谷歌正在做的一件事是正确的:他们终于在认真将AI整合到搜索中......谷歌最强大的护城河是分销。Gemini不一定要成为最好的模型,而是可以成为世界上最常用的模型。”

此前,在5月9日播出的一档节目中,谷歌CEO桑达尔·皮查伊接受采访时谈及公司与微软和OpenAI的竞争。他表示,尽管谷歌在聊天机器人领域的起步较晚,但他对公司的长期竞争力并不担忧,AI浪潮尚处早期。

4月25日,谷歌母公司Alphabet发布了截至3月31日的2024年第一季度财报。财报显示,Alphabet第一季度实现营收805.39亿美元,同比增长15%,是自2022年初以来公司营收增长最快的一个季度。非美国通用会计准则下(Non-GAAP)净利润为236.62亿美元,同比增长57%;摊薄后每股收益为1.89美元,高于市场预期的1.51美元。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-05-15 11:45:07

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

“360智脑大模型4.0”正式发布,图片、文字、视频互相生成,已接入360全家桶 | 最前线
...图像处理能力、语音处理能力以及视频处理能力,可实现文生文、文生图、文生表、图生图、图生文、视频理解等功能。图片、文字、视频互相生成,接入360“全家桶” 时隔两个月,如今的“
2023-06-14 14:31:00
360智脑大模型重新定义AI数字人
...图像处理能力、语音处理能力以及视频处理能力,可实现文生文、文生图、文生表、图生图、图生文、视频理解等功能。会上,360智脑“文生视频”多模态功能国内首发,任何文字脚本都可生成
2023-06-14 12:18:00
Sora再度颠覆AI视频行业,A股哪些公司有相关布局?
人工智能(AI)巨头OpenAI又出王炸,其最新推出的文生视频大模型Sora因其“逼真”和“富有想象力”被广泛赞誉,其生成视频可达60秒也颠覆了传统视频生成领域平均只有4秒的视频生成长度
2024-02-19 08:10:00
周鸿祎 落子
...多模态能力各种「兜底」。多模态听着艰涩,说人话就是文生文、文生图、文生表、图生图、图生文、视频理解等涵括文字、图像、语音及视频的处理能力。周鸿祎认为,中国自研大模型弯道超车的
2023-06-15 13:34:00
腾讯开源最大MoE大语言模型!3D大模型同时支持文/图生成,晒混元模型及应用全家桶
...恢复出3D资产的几何形状和纹理细节,泛化能力出色。其文生3D能力支持在45秒内基于文本生成3D资产,图生3D能力支持在30秒内基于文本生成3D资产。文生/图生3D内网接口已上
2024-11-06 09:41:00
不要小看「实而不华」的腾讯 AI
...答卷。上周,腾讯一连开了两场发布会,第一场宣布混元文生图升级采用 DiT 架构并开源,第二场,腾讯重申了以「产业实用」作为发展大模型的核心战略,并从模型侧、工具侧、应用侧三大
2024-05-21 21:25:00
本周硅谷发生了什么?|OpenAI推出5项更新;微软组建新的AI团队;Googe发布文生视频模型Lumiere
...一款电动汽车Apple CarPika联手北大斯坦福发表论文,开源文生图框架大模型第一线微软组建新团队来造更轻且便宜的AI模型1月23日
2024-01-29 09:34:00
更快、更强、更可控:智谱“起舞弄清影”,视频生成卷出新高度!
...大模型团队自研打造的视频生成大模型CogVideoX,现已支持文生视频、图生视频多个能力,让用户“自助式”地完成艺术视频创作,首发测试期间,所有用户均可免费使用。同时,付费5
2024-07-27 10:00:00
商汤如何玩转大模型+大算力?详解“日日新SenseNova”大模型体系的关键招
...型的超市。”他现场演示了这个超市中的语言大模型、AI文生图创作、2D/3D数字人生成、大场景/小物体生成等生成式AI模型及应用。整体表现收获不少好评,有网友称之为“AI实干家
2023-04-14 14:00:00
更多关于财经的资讯:
织就金融“芯”网:中国银行山东省分行创新服务芯片产业链
在山东“强省会”战略引领下,济南正奋力打造国内重要的集成电路(芯片)产业高地,当前已形成“上游材料/设备—中游设计/制造/封测—下游应用”的完整架构
2025-11-14 12:06:00
友邦人寿推出“传世充裕”年金产品,重磅升级“致相伴”养老·传承综合解决方案
近日,友邦人寿保险有限公司(以下简称“友邦人寿”)正式推出《友邦传世充裕年金保险(分红型)》(以下简称“传世充裕”)。该产品以“享充裕
2025-11-14 11:54:00
工行贵阳分行深化GBC联动 织密农民工民生保障金融网
多彩贵州网讯(通讯员 安海力)民生无小事,枝叶总关情。工行贵阳分行始终坚守“金融为民”初心使命,以深化GBC联动机制为重要抓手
2025-11-14 09:49:00
苏文电能、江苏有线等成立新能源产业发展公司
近日,江苏视界新能源产业发展有限公司成立,注册资本9000万元,经营范围包含:人工智能行业应用系统集成服务;智能无人飞行器销售
2025-11-14 10:00:00
中国铁建、国通信托在内蒙古新设置业公司
近日,内蒙古铁信兴合置业有限公司成立,注册资本1000万元,经营范围包含:以自有资金从事投资活动;物业管理;房地产开发经营等
2025-11-14 10:00:00
铜仁:金融“活水”润油茶 赋能乡村振兴新图景
多彩贵州网讯(通讯员 陈雨怡)深秋时节,黔东大地层林尽染。在“中国油茶之乡”玉屏侗族自治县,23.45万亩油茶林迎来了丰收季
2025-11-14 10:20:00
工行六盘水分行“惠商贷”赋能小微星火 深耕凉都百业热土
多彩贵州网讯(通讯员 龙腾宇)截至2025年9月末,工行六盘水分行依托创新普惠信贷产品“惠商贷”,成功为辖区内近百户小微商户提供贷款支持
2025-11-14 10:20:00
工行毕节分行:“电商e贷”打通电商小微资金“经脉”
多彩贵州网讯(通讯员 王毫)近日,工行毕节分行精准把脉当地电商企业痛点,创新运用“电商e贷”产品,为贵州某某食品有限公司注入200万元金融活水
2025-11-14 10:20:00
阳光财险:防灾减灾织密民生保障网
近年来,极端天气频发,暴雨洪涝、地质灾害等严重威胁群众生命财产安全。保险作为防灾防损、风险管理的重要工具,在提升防灾减灾能力建设中起关键作用
2025-11-14 10:20:00
工行兴义分行助力企业办理首笔跨境人民币业务 推动企业扬帆“出海”
多彩贵州网讯(通讯员 罗红)近日,工行兴义分行成功为黔西南州某化工企业办理了首笔跨境人民币结算业务,涉及金额60余万元
2025-11-14 10:21:00
工行贵阳白云艳山红支行“爱心早餐”传递立冬首缕暖意
多彩贵州网讯(通讯员 张栩铭)晨光熹微,薄雾轻笼,2025年立冬的脚步伴随着渐起的寒意悄然降临。作为区域内具有鲜明特色的“巾帼文明示范岗”网点
2025-11-14 10:21:00
工行贵阳清镇支行送暖入家门:一对一反诈宣传筑牢银发族反诈“防火墙”
多彩贵州网讯(通讯员 喻昭鑫)在信息化浪潮奔涌向前的今天,老年群体如何跨越“数字鸿沟”,有效识别层出不穷的电信网络诈骗陷阱
2025-11-14 10:21:00
工行遵义仁怀支行:金融活水润酒都 匠心服务暖万家
多彩贵州网讯(通讯员 郭开旺)工行遵义仁怀支行始终秉持“金融为民”初心,深耕辖区二手房信贷市场,以专业之力助安居、以务实之举促发展
2025-11-14 10:21:00
工行铜仁北关支行成功落地辖内首个“银发产业云”智慧养老平台
多彩贵州网讯(通讯员 苏春)当前,社会老龄化进程加速,养老服务需求日益多元化、精细化,对高效管理、便捷服务和安全保障的要求尤为突出
2025-11-14 10:21:00
华夏人寿、平安人寿两代理人违规 黑龙江监管局予以警告
11月14日,国家金融监督管理总局黑龙江监管局行政处罚信息公开表显示,王某波(华夏人寿保险股份有限公司黑龙江分公司个人代理人)因给予投保人保险合同约定以外的利益被警告
2025-11-14 10:28:00