• 我的订阅
  • 科技

谷歌大模型Gemini视频被质疑造假、夸大宣传,官方回应:演示内容有剪辑|钛媒体焦点

类别:科技 发布时间:2023-12-08 22:02:00 来源:钛媒体APP
谷歌大模型Gemini视频被质疑造假、夸大宣传,官方回应:演示内容有剪辑|钛媒体焦点

谷歌Logo(图片来源:钛媒体App编辑拍摄)

刚发布不到48小时的谷歌史上最强的人工智能(AI)大模型Gemini,如今却引发了一些争议。

钛媒体App 12月8日消息,谷歌公司(Google)近日公布了一段6分钟互动视频引发关注。该视频中以“一镜到底”形式展现Gemini能实时地感知人类的动作、直接做出语音回应等多模态技术能力。

然而,有多个消息称,这段制作的演示视频夸大了Gemini技术能力,被质疑造假、夸大宣传等,实际上手时发现Gemini并不能达到视频中的效果。同时,这类营销方法甚至遭到了谷歌内部员工的批评。

截至发稿前,钛媒体App在谷歌官方社交账号上已经承认该视频经过编辑。“出于本演示的目的,为了简洁起见,延迟已减少,Gemini输出也已缩短。”谷歌表示。

谷歌大模型Gemini视频被质疑造假、夸大宣传,官方回应:演示内容有剪辑|钛媒体焦点

据悉,当地时间12月6日,谷歌发布迄今为止功能最强大、最通用的多模态 AI 大模型Gemini 1.0系列(中文译为“双子座”),共包括Ultra、Pro和Nano三个版本。其中,Gemini Ultra已超越了GPT-4,甚至在MMLU测试得分高达90.0%,成为第一个超越人类专家水平的 AI 模型。

谷歌CEO桑达尔·皮查伊 (Sundar Pichai) 表示,Gemini是 AI 模型领域的巨大飞跃,最终将影响几乎所有的谷歌产品。同时,人类也正式迎来了Gemini新时代。(详见钛媒体App前文:《疯狂一夜!美国AMD、谷歌纷纷亮出大杀器,人类迎来巨变前夜?》)

然而,随着基于Gemini Pro微调版本的谷歌聊天机器人Brad已对外使用,越来越多的用户对其早期版本的印象并不良好,仍存在事实性错误内容、信息过于陈旧等问题。尽管Gemini确实改进了Bard技术能力,但与ChatGPT-4相比,用户体验提升不大,因此其实际表现受到质疑。

宾夕法尼亚大学沃顿商学院教授伊桑·莫里克(Ethan Mollick)在社交媒体上表示,输入同样的指令后,GPT-4给出的回复与Gemini类似;TechCrunch作者希望提供乌克兰冲突最新情况的摘要时,Gemini提供的信息已经过时一个多月;彭博社专栏作家帕米·奥尔森(Parmy Olson)也撰文表示,Gemini视频演示的所展示的多个功能并不是独一无二的,也可以通过ChatGPT Plus所复制。

而此次被认为造假的谷歌官方演示视频,主要展示了如何通过双手、图画或其他物体的照片与Gemini互动,如人向Gemini发出文本提示,可识别反馈人展示的静态图像,以及Gemini可以与人进行流畅的语音对话等,主要还是展现Gemini大模型的多模态技术能力。

截至钛媒体App发稿前,这段6分钟谷歌官方的YouTube视频播放量已超过160万次,在社交媒体上的查看量也超过80万次。

谷歌大模型Gemini视频被质疑造假、夸大宣传,官方回应:演示内容有剪辑|钛媒体焦点

而在引发争议之后,目前,谷歌已表明该视频经过编辑,“出于本演示目的,为了简洁起见,延迟已经减少,Gemini输出(时间)也已缩短。”

那么这意味着,模型每个响应所花费的时间实际上比视频中展示的时间长。

谷歌DeepMind产品副总裁伊莱·柯林斯(Eli Collins)表示,视频中的画鸭子演示仍然是研究级别的功能,至少目前还没有出现在谷歌的实际产品中。

谷歌DeepMind研究和深度学习负责人副总裁奥里奥尔·维尼亚尔斯(Oriol Vinyals)则表示,“视频中的所有用户提示和输出都是真实的,只是为了简洁而缩短了。”他强调,演示视频不是实时的,而是使用了原始镜头中的静止图像帧,然后编写了文本提示,并要求它通过预测来做出回应。这只是Gemini多模式能力的一个例子,以提供日常创作灵感。

而这种营销方法已遭到谷歌内部员工的批评。据彭博社报道,多位谷歌员工表示,他们认为这段Gemini介绍视频描绘了一幅不切实际的画面,另有员工称对演示并不太感到惊讶,因为他们已经习惯了公司公开定位其产品的某种程度的营销炒作。“我认为大多数使用过大语言模型技术的员工都知道要对这一切持保留态度。”该员工称。

科技网站The Verge评论指出,企业经常编辑演示视频,特别是因为许多公司希望避免现场演示带来的任何技术问题,稍微调整一下是很常见的。但谷歌有制作可疑演示视频的历史,因此这一次的视频事件会让人们更加怀疑Gemini的可用性。“至少在公众看来,谷歌已经被OpenAI今年的巨大成功打了个措手不及。如果它想激励开发人员,就不能通过精心编辑的、可能歪曲人工智能能力的精彩视频。”

目前,谷歌官方层面仍在有条不紊地推进Gemini大模型产品落地,展现其技术优异性。

12月8日,谷歌DeepMind首席执行官德米斯·哈萨比斯(Demis Hassabis)对外强调,Gemini是 AI 领域的新品种——“原生多模态”,区别于现有的“拼凑多模态”模型,即从一开始就使用多种模态(例如音频、视频和图像)训练而成。因此,Gemini开辟了一条 AI 领域前所未见的道路,可能会带来重大的新突破。

谷歌大模型Gemini视频被质疑造假、夸大宣传,官方回应:演示内容有剪辑|钛媒体焦点

作为其最强的技术竞品,12月8日下午,OpenAI研发的聊天机器人ChatGPT在社交媒体上意味深长的回应称,目前ChatGPT模型没有更新过,而模型行为可能是不可预测的,团队正在研究修复它。

根据谷歌的规划,自12月13日起,开发者和企业客户可以通过谷歌AI Studio或谷歌云Vertex AI访问Gemini Pro的API。同时,对标GPT-4的高级版本Gemini Ultra预计将在2024年对外发布。

(本文首发钛媒体App,作者|林志佳)返回搜狐,查看更多

责任编辑:

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-12-08 23:45:20

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

Gemini终究难敌GPT-4?谷歌陷“虚假宣传”风波 承认演示视频系剪辑合成
...质疑,该视频并非实时录制,而是多轮尝试并精心挑选和剪辑而成。质疑声之一来自彭博专栏作家帕米·奥尔森(Parmy Olson),他认为,在谷歌发布的这段视频中,Gemini似乎
2023-12-11 11:02:00
谷歌大模型爆红后被质疑造假!承认演示视频剪辑过:为了简洁缩短了
...频中展示的是精心挑选的好结果,不是实时录制,而经过剪辑的。随后,谷歌在一篇博客文章中解释了多模态交互过程,基本上也间接承认了只有使用静态图片和多段提示词拼凑,才能达成演示视频
2023-12-08 15:15:00
比赛开始了!Sora对手直呼奥特曼是魔术师,创意行业最先受冲击?
...相比之下,Sora的宣传视频包括变换摄像机角度、电影式剪辑和场景变换,而这一切,都是通过单一提示词生成的。Sora生成的视频能够达到更加逼真的效果。来源:Sora针对Sora
2024-02-18 18:30:00
“造假”的谷歌,暴露了AI大模型行业的致命问题
...,其中用静态图像和提示词一步步“调教”AI的过程都被剪辑掉了。比如演示视频中的画面是人手在玩石头剪刀布,Gemini直接回答:“我知道你在干嘛了,你在玩石头剪刀布”。光看这段
2023-12-19 19:02:00
华为、小米抢滩登陆,AI大模型掀起手机江湖「新战事」 | 钛媒体焦点
...上,展示了在终端侧运行生成式AI模型Stable Diffusion的技术演示,和终端侧语言-视觉模型(LVM)ControlNet的运行演示
2023-08-14 10:00:00
单卡算力对标英伟达A100,科大讯飞联手华为发布星火一体机
...密码是否符合规则并给出不符合的理由,以及用Python语言剪辑一段视频并生成gif表情包,智能编程助手iFlyCode1.0均可以在几秒钟之内完成。对于代码能力能够产生的影响
2023-08-16 22:01:00
Gemini 超越 GPT-4 靠作弊?谷歌承认:是的,演示视频经过了剪辑
...因在于那个 6 分半的 Gemini 演示视频:它是假的,是经过剪辑的,甚至在被质疑后,谷歌还承认了!Gemini 的视频演示效果
2023-12-08 22:02:00
背水一战狙击GPT-4,谷歌最强大模型Gemini终发布,听说读写全能选手 | 焦点分析
...不会在“转录”过程中丢失。正因如此,Gemini的应用实例演示显得尤为丝滑:△图源:谷歌演示者一边画画,Gemini一边辨认
2023-12-07 08:18:00
三位电影制作人用Sora生成短片,涵盖“气球头”男人
...容都是Sora的原始输出。在将该工具制作的许多不同片段剪辑在一起后,ShyKids进行了一系列后期处理,使电影看起来更好。例如,他们使用视觉效果工具修复了主角气球脸的某些镜头
2024-04-04 22:39:00
更多关于科技的资讯: