• 我的订阅
  • 科技

谷歌大幅更新生成式AI,推出视频模型VEO 2和最新版Imagen3

类别:科技 发布时间:2024-12-17 09:12:00 来源:华尔街见闻官方

来源:硬AI

谷歌的旗舰AI研究实验室Google DeepMind周一大幅升级其人工智能驱动的内容生成工具,推出了Veo 2视频生成模型和增强版Imagen 3图像模型,挑战OpenAI在AI图像和视频生成的领先地位。谷歌表示,这些更新有望彻底改变创意工作流程,为视频和图像创作者提供更高的真实感和定制化体验。

谷歌介绍,Veo 2是谷歌的视频生成工具,能够生成多样化主题和风格的高质量视频。谷歌在博客中表示,这款模型在真实感方面表现卓越,能够捕捉到人类表情和电影效果等细节。其增强的物理和电影学理解能力使用户能够生成令人惊叹的内容,包括跟踪镜头和广角构图等。

例如,Veo 2熟悉电影拍摄语言,用户可以要求某种类型的风格,指定镜头,建议电影效果,Veo 2都会以高达4K分辨率并延长到数分钟的视频长度来呈现。比如,要求“低角度跟踪镜头穿越场景中央”或“特写科学家通过显微镜观察”的镜头,Veo 2都能实现。提示“18mm镜头”,Veo 2知道生成广角镜头;要求“浅景深”,它会模糊背景,突出主体。

值得注意的是,这一分辨率是OpenAI Sora模型的4倍,视频时长更是其6倍以上。

不过,目前这些优势仍是理论上的。在谷歌的实验性视频创作工具VideoFX中,Veo 2生成的视频被限制为720p分辨率、8秒的长度。(相比之下,Sora的最大输出为1080p、20秒的短片。)

谷歌表示,虽然视频生成模型往往会“幻象化”出不需要的细节,例如多余的手指或意外的物体,但Veo 2在这一方面的表现更为真实,生成错误的频率较低。

此外,Veo 2生成的视频包括不可见的SynthID水印,用于标记它们为AI生成的内容,从而减少误用或错误归属的风险。

DeepMind产品副总裁Eli Collins对媒体表示,随着模型逐渐具备规模化使用的准备,谷歌将通过其Vertex AI开发者平台提供Veo 2。

“未来几个月,我们将根据用户反馈持续迭代,并寻求将Veo 2的更新能力整合到谷歌生态系统中的相关应用中……我们预计明年会分享更多的更新内容。”

开发者和创作者目前可以通过谷歌实验室(Google Labs)访问该工具,预计到2025年,它将广泛集成至诸如YouTube Shorts等平台。

同时,Imagen 3模型在图像构图和细节准确性方面得到了增强,支持从写实到抽象的各种风格,能够生成更丰富的纹理,并更加忠实地回应用户提示。

谷歌大幅更新生成式AI,推出视频模型VEO 2和最新版Imagen3

目前,Imagen 3已经通过谷歌实验室的ImageFX工具在100多个国家上线,全球用户可以试验其尖端功能。

此外,谷歌还推出了Whisk,这是一款结合了Imagen 3和Gemini视觉分析能力的创意工具。用户可以输入图像,生成详细的文字描述、重新混合风格,或设计个性化作品,如数字玩偶或搪瓷徽章。

谷歌介绍,Whisk结合了Imagen 3模型和Gemini的视觉理解与描述能力。Gemini模型会自动为用户的图像生成详细的文字描述,并将这些描述传递给Imagen 3。这一过程让用户能够以有趣的新方式重新混合主题、场景和风格。

谷歌大幅更新生成式AI,推出视频模型VEO 2和最新版Imagen3

本文来自微信公众号“硬AI”,关注更多AI前沿资讯请移步这里

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-12-17 12:45:04

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

“苹果智能”仅面向付费开发者,三大新模块炸裂出圈
...。此次推出的苹果智能仅有部分功能上线,主要围绕文本生成、Siri和相册等模块。不过,此次更新尚未集成ChatGPT功能
2024-07-31 23:28:00
苹果将在ios18中推出一系列新功能
...能回应框架及在苹果设备上运行的LLM技术,以此提升响应生成能力。未来,Siri生成回复和摘要时,能综合考虑人名、公司信息
2024-06-04 09:02:00
...GPT-4.5的得分成绩;在HTML等代码前端任务上,新版V3模型生成的代码可用性更高,视觉效果也更加美观、富有设计感
2025-03-26 11:46:00
亚马逊连甩6款大模型!推出3nm AI训练芯片,最强AI服务器算力爆表
...括Micro、Lite、Pro、Premier四个版本的语言模型,还有图像生成模型Canvas、视频生成模型Reel
2024-12-05 09:47:00
迎着应用爆发的曙光,百度将推出新版文心大模型
...、可被信赖。此前,完全基于大语言模型的文生图系统,生成的图片往往“一眼假”,甚至逻辑不合常理。李彦宏曾在百度世界大会展示了一张用开源大模型生成的北京天坛的图片,看上去确实有点
2024-11-22 09:58:00
斯坦福AI虚拟小镇开源;英伟达再推超级芯片;OpenAI发布爬虫机器人 | 本周硅谷发生了什么?
...又放出大招:推出新版超级芯片GH200,主要面向大模型和生成式AI。OpenAI则发布了一款新的爬虫机器人,但用户可以选择自己的数据是否被用于模型训练
2023-08-14 15:59:00
一块GPU都没用,苹果自研大模型干翻GPT-4?
...的相关问题。2、写作工具升级。新版iOS提供苹果的文本生成服务;同时支持AI生成邮件、信息,语音转录摘要等功能。3、视图工具升级。该版本提供更智能的图片搜索及电影回忆制作功能
2024-07-31 09:37:00
英伟达DLSS 3.5即将推出,《赛博朋克2077》对比视频
...LSS3.5,并发布了一个对比视频。视频中还显示DLSS3.5FG(帧生成),在最新的版本上,在未启用帧生成的情况下也能运行得很好
2023-08-28 18:38:00
...模型。其次,唐家渝表示,图像生成已超过Stable Diffusion最新版基础模型水平,预计将于年内赶超Midjourney最新版本
2023-06-19 09:03:00
更多关于科技的资讯:
节日我在岗丨十堰高周波:抓创新赶订单 全力冲刺年度目标
十堰广电讯(全媒体记者 陈林)在国庆中秋假期,位于十堰经济开发区的十堰高周波科工贸有限公司抓创新赶订单,全力冲刺年度目标
2025-10-05 20:21:00
节日我在岗丨艾斯卓智能科技:节日不休 赶制订单
十堰广电讯(全媒体记者 耿吉国)放假不放松,生产不停工。国庆中秋长假,我市各生产企业铆足干劲抓生产、赶订单,奋力冲刺年度目标任务
2025-10-05 20:21:00
普阳钢铁工程机械用高强高韧宽厚板全国市场占有率名列前茅一块宽厚板的靶向发力——“铁疙瘩”怎样变成“金娃娃”(十)从矿山到港口
2025-10-05 07:47:00
人气旺 厦门多个商场假日客流爆棚、销售额亮眼
集美大悦城商圈内,小朋友和机器人亲密互动。(本组图/厦门日报记者 黄晓珍 摄)国庆中秋假期, 厦门SM购物中心潮玩店内人气火爆
2025-10-04 09:20:00
省数据和政务服务局发布公告公开征集一批河北省高质量数据集河北日报讯(记者解楚楚)9月26日,河北省数据和政务服务局发布公告
2025-10-04 08:03:00
央媒看太原9月30日,央视财经频道《经济信息联播》栏目以《双节市场备货足美食特产受青睐》为题,报道了假期到来,太原市各大综合市场提前备货
2025-10-04 07:17:00
厦门网讯(厦门日报记者 朱道衡)近日,2025鼓浪屿世遗文创作品征集活动启动。此次活动面向全国(含港澳台地区)高校、企业
2025-10-03 08:37:00
厦门网讯(厦门日报记者 楚燕 通讯员 石青青)长假期间,许多人从忙碌的工作中解脱出来,趁机好好休息。可是,如果休息方式不得当
2025-10-03 08:37:00
渤海之潮涌动着澎湃的脉搏,海河之畔镌刻着科技的印记。10年前,一颗带有“清华”基因的种子在天津这片沃土扎根;10年后,它长成一棵枝繁叶茂的参天大树
2025-10-03 09:25:00
太燃了!无人机空中展旗!高新区国庆“氛围组”已上线!
2025-10-03 23:48:00
抖音生活服务联合北京卫视发起“老板驾到”直播活动,吸引用户下单超100万元团购券
9月29日,抖音生活服务联合北京卫视发起“老板驾到”直播活动,助力北京国庆中秋消费。抖音用户在@北京卫视 直播间下单超1万次
2025-10-03 18:36:00
“FutureBOT未来引力”2025北京机器人文化节首日盛况 打造国庆科技打卡新地标
国庆首日,“FutureBOT未来引力”2025北京机器人文化节在北京昌平超极合生汇正式拉开帷幕,成为国庆假期极具科技温度的打卡地
2025-10-03 19:06:00
走到白石山巅的尽头,这家建在悬崖边的“云端咖啡厅”绝对让你惊呼。
2025-10-03 11:37:00
泰康人寿发布新品“泰康百万药无忧(庆典版)医疗保险”(以下‬简称“百万药无忧”),以广覆盖、易投保、强保障、低费率为优势
2025-10-03 09:17:00
厦门网讯(厦门日报记者 翁华鸿 通讯员 林雨新)在近日举行的2025全球数据管理峰会“数据要素分论坛暨大数据统计与人工智能技术创新管理研讨会”上
2025-10-03 08:38:00