我的订阅
财经

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

全面叫板OpenAI！谷歌发布多模态大模型全家桶：从AI助手到文生视频模型

类别：财经发布时间：2024-05-15 09:54:00 来源：澎湃新闻

被OpenAI抢先一天后，科技巨头谷歌不甘示弱，推出了自己的最新多模态AI（人工智能）产品。

当地时间5月14日，在谷歌I/O开发者大会上的主题演讲中，谷歌展示了由升级后Gemini模型驱动的AI助手项目Project Astra、对标Sora的文生视频模型Veo，以及在硬件方面发布的第六代Tensor处理器单元（TPU）Trillium芯片。根据发布会最后的官方统计，完全聚焦于AI的这场主题演讲总共提到了121次AI。

完全聚焦于AI的这场主题演讲总共提到了121次AI。来源：谷歌I/O主题演讲

谷歌CEO桑达尔·皮查伊（Sundar Pichai）表示，谷歌的所有工作都在围绕生成式AI模型Gemini展开，“我们希望每个人都能从Gemini所做的事情中受益”。

14日当天，谷歌（Nasdaq：GOOGL）股价收于每股171.93美元，涨0.6%，总市值2.12万亿美元。

AI搜索支持视频输入，Gemini、Gemma上新

作为搜索引擎巨头，AI搜索正是谷歌所做工作中的一部分。

据介绍，在最新Gemini的加持下，谷歌搜索将具备多步骤推理能力，可以一次性处理带有多个限制条件的长问题、帮助用户进行头脑风暴，并支持视频搜索，让用户通过拍摄视频来搜索解决方案。这些功能将先在美国推出，谷歌预计会在今年年底前将其带给超过10亿人。

谷歌AI搜索将具备多步骤推理能力。来源：谷歌

谷歌的Gemini以超长的上下文窗口而出名。在大会上，谷歌重点强调了大模型Gemini 1.5 Pro的多模态和长文本能力，为其推出一系列更新。谷歌将向全球150多个国家地区的Gemini Advanced订阅者提供最新模型、拥有100万个token的Gemini 1.5 Pro，支持超过35种语言，定价为每100万token 3.5美元。

据皮查伊介绍，Gemini 1.5会提供“迄今为止所有基础模型中最长的上下文窗口”。Gemini 1.5 Pro将在今年晚些时候将会把窗口进一步扩大至200万token，拓展同步处理多模态信息的边界。

从今年夏天开始，Gemini将支持语音实时交互，并在今年晚些时候上线实时视频交互。未来几个月内，谷歌也将推出类似于GPTs的自定义AI助手功能，名为Gems，可以与整套“谷歌全家桶”联动。

另外，对于一些需要快速响应的场景，谷歌推出了Gemini 1.5 Flash模型。Flash将是API中速度最快的Gemini模型，针对大规模、大批量的高配任务进行了优化，也具有100万token的长上下文窗口。

谷歌也在发布会上带来了旗下开源大模型Gemma的最新版本Gemma 2。据介绍，Gemma 2采用全新架构，参数上达到27B，拥有突破性的性能和效率。

AI助手Project Astra叫板GPT-4o

在OpenAI推出能够实现人类级别响应的智能助手GPT-4o后，谷歌的AI智能体项目Project Astra也重磅登场。

在演示视频中，Astra能够通过手机摄像头或智能眼镜看到的内容来分析响应语音命令。它成功地识别出代码序列、为电路图提出改进建议、能够通过镜头“看到”伦敦国王十字区，并提醒用户智能眼镜的放置位置。

Project Astra是谷歌对于未来AI助手的展望。来源：谷歌

谷歌AI助手将能够通过智能眼镜和用户一起观察世界。来源：谷歌

据介绍，谷歌在Gemini的基础上开发了Astra的原型，可以通过连续编码视频帧、将视频和语音输入组合到事件时间线中以实现更快地处理信息。通过语音模型，谷歌也强化了智能助手的说话能力，让其能够给出更快速的回应。

不过，在演示视频中，谷歌AI助手的回应速度似乎还是会比GPT-4o稍慢一些，语音所表现出的感情色彩也平淡一些。

皮查伊表示，谷歌计划从今年开始将Astra的功能添加到其Gemini应用程序及其产品中。不过，他也强调，虽然最终目标是“让Astra在公司的软件中实现无缝连接”，但该产品将被谨慎推出，并且“商业化之路将由质量驱动”。

除了在AI助手领域的竞争外，谷歌还通过文生视频模型Veo来反击OpenAI的Sora。Veo能够根据文字、图片和视频的提示来生成高质量的1080p视频，创作“一致且连贯”的镜头，用户可以对光照、镜头语言、视频颜色风格等进行自定义设置。不过，谷歌没有宣布Veo的具体推出时间。

来源：谷歌I/O主题演讲

此外，谷歌还宣布了一系列与图像、音乐有关的生成式AI工具，包括能够表现更高细节水平的文生图工具Imagen 3，还有与Youtube以及音乐家合作的AI音乐工具“AI音乐沙盒”。

在硬件方面，谷歌将于今年晚些时候推出交付第六代数据中心AI芯片TPU Trillium。皮查伊表示，每块芯片的计算性能将比第五代提升4.7倍，谷歌通过扩大芯片的矩阵乘法单元（MXU）和提高整体时钟速度来实现这一目标。此外，第六代将比第五代芯片节能67%，谷歌还将Trillium芯片的内存带宽提高了一倍。

发布会后，著名AI学者吴恩达（Andrew Ng）对谷歌表示祝贺，称个人很期待“拥有200万个token的上下文窗口以及对设备上AI进行更好支持的Gemini”，认为其会为应用程序构建者带来新的机会。

英伟达高级研究科学家范麟熙（Jim Fan）表示：“谷歌正在做的一件事是正确的：他们终于在认真将AI整合到搜索中......谷歌最强大的护城河是分销。Gemini不一定要成为最好的模型，而是可以成为世界上最常用的模型。”

此前，在5月9日播出的一档节目中，谷歌CEO桑达尔·皮查伊接受采访时谈及公司与微软和OpenAI的竞争。他表示，尽管谷歌在聊天机器人领域的起步较晚，但他对公司的长期竞争力并不担忧，AI浪潮尚处早期。

4月25日，谷歌母公司Alphabet发布了截至3月31日的2024年第一季度财报。财报显示，Alphabet第一季度实现营收805.39亿美元，同比增长15%，是自2022年初以来公司营收增长最快的一个季度。非美国通用会计准则下（Non-GAAP）净利润为236.62亿美元，同比增长57%；摊薄后每股收益为1.89美元，高于市场预期的1.51美元。

以上内容为资讯信息快照，由td.fyun.cc爬虫进行采集并收录，本站未对信息做任何修改，信息内容不代表本站立场。

快照生成时间：2024-05-15 11:45:07

本站信息快照查询为非营利公共服务，如有侵权请联系我们进行删除。

信息原文地址：

更多关于文生,模型,模态,全家,助手,视频的资讯：

“360智脑大模型4.0”正式发布，图片、文字、视频互相生成

...图像处理能力、语音处理能力以及视频处理能力，可实现文生文、文生图、文生表、图生图、图生文、视频理解等功能。图片、文字、视频互相生成，接入360“全家桶” 时隔两个月，如今的“

2023-06-14 14:31:00

360智脑大模型重新定义AI数字人

...图像处理能力、语音处理能力以及视频处理能力，可实现文生文、文生图、文生表、图生图、图生文、视频理解等功能。会上，360智脑“文生视频”多模态功能国内首发，任何文字脚本都可生成

2023-06-14 12:18:00

Sora再度颠覆AI视频行业，A股哪些公司有相关布局？

人工智能（AI）巨头OpenAI又出王炸，其最新推出的文生视频大模型Sora因其“逼真”和“富有想象力”被广泛赞誉，其生成视频可达60秒也颠覆了传统视频生成领域平均只有4秒的视频生成长度

2024-02-19 08:10:00

周鸿祎落子

...多模态能力各种「兜底」。多模态听着艰涩，说人话就是文生文、文生图、文生表、图生图、图生文、视频理解等涵括文字、图像、语音及视频的处理能力。周鸿祎认为，中国自研大模型弯道超车的

2023-06-15 13:34:00

腾讯开源最大MoE大语言模型！3D大模型同时支持文/图生成，

...恢复出3D资产的几何形状和纹理细节，泛化能力出色。其文生3D能力支持在45秒内基于文本生成3D资产，图生3D能力支持在30秒内基于文本生成3D资产。文生/图生3D内网接口已上

2024-11-06 09:41:00

不要小看「实而不华」的腾讯 AI

...答卷。上周，腾讯一连开了两场发布会，第一场宣布混元文生图升级采用 DiT 架构并开源，第二场，腾讯重申了以「产业实用」作为发展大模型的核心战略，并从模型侧、工具侧、应用侧三大

2024-05-21 21:25:00

本周硅谷发生了什么？｜OpenAI推出5项更新；微软组建新的

...一款电动汽车Apple CarPika联手北大斯坦福发表论文，开源文生图框架大模型第一线微软组建新团队来造更轻且便宜的AI模型1月23日

2024-01-29 09:34:00

更快、更强、更可控：智谱“起舞弄清影”，视频生成卷出新高度！

...大模型团队自研打造的视频生成大模型CogVideoX，现已支持文生视频、图生视频多个能力，让用户“自助式”地完成艺术视频创作，首发测试期间，所有用户均可免费使用。同时，付费5

2024-07-27 10:00:00

商汤如何玩转大模型+大算力？详解“日日新SenseNova”

...型的超市。”他现场演示了这个超市中的语言大模型、AI文生图创作、2D/3D数字人生成、大场景/小物体生成等生成式AI模型及应用。整体表现收获不少好评，有网友称之为“AI实干家

2023-04-14 14:00:00

更多关于财经的资讯：

农业银行苏州分行：“育新”又“出海”，耕耘综合金融服务“试验

江南时报讯新春伊始，面对“十五五”规划开局起步的关键节点，面对苏州高位求进、转型提质的重要阶段，农业银行苏州分行深入学习贯彻党的二十届四中全会精神

2026-03-15 20:54:00

企查查显示：易烊千玺曾起诉315曝光成人增高公司

15晚会曝光成人增高骗局，增高机构用玄学疯狂敛财，温州德脊瑞健康管理有限公司被点名。温州德脊瑞健康管理有限公司成立于2018年6月

2026-03-15 21:36:00

《个人贷款业务明示综合融资成本规定》来了！8月1日起施行

中新经纬3月15日电国家金融监督管理总局网站15日消息，为维护个人贷款市场秩序，保护金融消费者合法权益，提升金融服务质效

2026-03-15 22:50:00

3·15曝光荐股分成骗局涉事鑫犇科公司成立仅半年

中新经纬3月15日电 2026年央视“3·15晚会”曝光荐股分成骗局。据央视财经报道，2026年伊始，315晚会收到不少消费者提供的线索

2026-03-15 22:50:00

阳光财险亮相3·15金融消保公益市集以多元实践守护安心消费

2026年“3·15”国际消费者权益日来临之际，由东方网主办、中关村东升科技园协办的“3·15金融消保公益市集”第三站走进北京中关村东升科技园

2026-03-15 20:46:00

镇江农商银行成功落地存单“债券篮子”交易

江南时报讯近日，镇江农商银行成功参与中信银行存单债券篮子交易，成为本地区率先通过债券篮子工具开展同业存单配置的农商银行之一

2026-03-15 20:52:00

工行徐州分行2.75亿贷款助高端制造业提质增效

江南时报讯近日，工行徐州分行向国内某光伏龙头企业发放2.75亿元流动资金贷款，用于支持企业生产经营与技术升级，助力其巩固在多晶硅材料领域的全球领先地位

2026-03-15 20:17:00

平安人寿推出“安百智享”两全险打造多维保障

随着居民风险意识持续提升，客户不仅希望保险能提供风险保障，还希望在保险期满未发生保险事故时，可获得相当于所交保费的满期生存金

2026-03-15 17:57:00

中国邮政储蓄银行枣庄市分行信用卡销售专员(派遣制)招聘公告

责任编辑：杜方奇

2026-03-15 18:11:00

兴业银行石家庄分行进口押汇自动放款业务落地

近日，兴业银行石家庄分行进口押汇自动放款业务落地。企业通过该行网上单证处理系统发起申请，仅两小时便完成全流程审批与放款

2026-03-15 18:54:00

3·15消费新主张｜中国太保寿险河北分公司：守护每一份奔跑的

3·15消费新主张｜中国太保寿险河北分公司：守护每一份奔跑的信任

2026-03-15 19:38:00

聚焦“两司两员” 筑牢金融防线——中信银行济南分行3·15金

为切实提升金融消费者风险防范意识和自我保护能力，在2026年“3·15国际消费者权益日”来临之际，中信银行济南分行紧扣“清朗金融网络守护安心消费”主题

2026-03-15 14:38:00

消保知识进校园恒丰银行济南分行携手多方举办“警银校”反诈宣

今年“3·15国际消费者权益日”来临之际，在济南一场聚焦青年金融安全的主题宣传活动走进大学校园，以创新形式为学子们上了一堂生动的“金融安全必修课”

2026-03-15 14:40:00

才艺大赛绽放银龄风采暖心服务绘就幸福晚年——中信银行济南分

春回大地，万物复苏之际，“越晒越年轻”第六届“幸福家·爸妈才艺大赛”颁奖典礼在中信银行济南分行圆满举行。本次大赛由中信银行济南分行与山东老年大学携手组织

2026-03-15 14:40:00

良辰作灯敬颂芳华——平安产险聊城中心支公司女神节手工灯制作

为庆祝女神节的到来，体现平安产险聊城中心支公司对员工的深切关怀，中心支公司于3月6日特别策划并开展了主题为“良辰作灯敬颂芳华”手工灯制作专项活动

2026-03-15 14:41:00

头条订阅服务

全面叫板OpenAI！谷歌发布多模态大模型全家桶：从AI助手到文生视频模型