• 我的订阅
  • 财经

谷歌大模型爆红后被质疑造假!承认演示视频剪辑过:为了简洁缩短了

类别:财经 发布时间:2023-12-08 15:15:00 来源:澎湃新闻

谷歌大模型爆红后被质疑造假!承认演示视频剪辑过:为了简洁缩短了

科技巨头谷歌的新大模型Gemini一夜爆红,受到市场看好,但有分析指出,谷歌在Gemini的宣传资料中存在夸大宣传的嫌疑。

当地时间12月6日,谷歌宣布推出“最大、最强、最通用”的新大型语言模型Gemini。Gemini将是首个直接在手机上运行的大模型,被应用于谷歌Pixel 8 Pro智能手机和聊天机器人Bard。Gemini被视为对于AI(人工智能)新锐巨头OpenAI旗下最新大模型GPT-4的直接回应,也象征着一度因聊天机器人ChatGPT而处于被动状态的谷歌终于正式冲回赛道。

据谷歌介绍,Gemini在MMLU(大规模多任务语言理解)的得分率达到90.0%,是第一个在MMLU测试中超过人类专家的模型。Gemini将包括一套三种不同规模的模型,其中,Gemini Ultra被定位为GPT-4的竞争对手,Gemini Pro的性能优于GPT-3.5,Gemini Nano则用于特定任务和移动设备。

凭借强大的性能,Gemini一夜爆红,引来了华尔街的关注。12月7日,谷歌母公司Alphabet(Nasdaq:GOOG)的股价涨5.31%,收于136.93美元,迎来自今年8月29日以来表现最好的一天,总市值达到1.72万亿美元。

美国银行的分析师在6日指出,由于人们对于谷歌的AI能力感到担忧,Alphabet今年承受了一定的压力,而一款“具有良好品牌形象的、竞争力较强的模型”可能会吸引更多消费者使用谷歌搜索,并对云服务的销售产生积极影响:“数据显示谷歌拥有一流的、不可复制的AI能力,这可能对公司在2024年上半年的股票走势产生积极影响。”

摩根大通的分析师在6日的一份报告中写道,尽管市场在当天没有对Gemini给出明显的反应,能够看到谷歌在“这一主要技术转变”中的进展还是十分“鼓舞人心”。然而,摩根大通也指出,大模型在“搜索领域的货币化路径存在不确定性”,可能会在未来带来一些阻力。

在7日的报告中,摩根大通的分析师写道:“虽然现在还处于其发展早期,但Gemini的推出象征着在生成式AI获得广泛商业化并得到广泛传播的第二年中,谷歌做出了重大创新。”

目前看来,谷歌如何在整体业务、尤其是最重要的搜索业务中将Gemini进行商业化是备受华尔街关注的一点。目前,谷歌计划在本月晚些时间通过谷歌云将Gemini授权给客户,并将在未来几个月与谷歌服务中的其他产品集成,但还没有公布后续的商业化策略。

富国银行(Wells Fargo)的分析师表示,Gemini的推出应该足以平息关于“谷歌在AI领域究竟应该何去何从”的争论,不过,关键问题在于谷歌如何利用Gemini获得营利:“简而言之,我认为谷歌证明了他们仍然具有一些竞争力。”

而KeyBanc的分析师也表示,Gemini是谷歌今年众多AI公告的“顶峰”,但要让AI对谷歌的业绩增长和盈利能力产生积极影响需要时间:“Gemini仍在努力进入搜索等核心产品,因此我们建议耐心观察其影响。”

不同于华尔街的整体看好,在科技领域中有声音指出,Gemini或许存在“夸大宣传”的质疑。

在Gemini于6日推出后不久,就有网友指出了宣传资料中的一些不妥之处。例如,当谷歌称Gemini的MMLU的得分率高于GPT-4时,显示GPT-4的得分率是86.4%,但根据谷歌发布的60页技术报告,Gemini Ultra的MMLU测试结果下有“CoT@32”的小字注释,表示其使用了思维链提示技巧,尝试了32次并从中选择最好结果。而作为对比的GPT-4却是无提示词技巧给5个示例,在这个标准下,Gemini Ultra的测试结果其实是83.7%,低于GPT-4的86.4%。

如果是同样使用CoT@32的方法,虽然成绩仍低于Gemini Ultra,GPT-4的得分率达到了87.29%。

谷歌大模型爆红后被质疑造假!承认演示视频剪辑过:为了简洁缩短了

Gemini和GPT在各种条件下的MMLU测试分数比较。来源:谷歌

如果像谷歌DeepMind首席科学家杰夫·迪恩(Jeff Dean)回应的那样,这种写法只是为了显示两种不同方法间的比较,对于Gemini测试视频的质疑则显得更加难以反驳。

在推出Gemini后,谷歌发布了一个时长六分钟的演示视频,展现了测试员和Gemini的一些有趣互动,其中包括让Gemini识别图片并用多种语言描述、让Gemini利用一张地图设计智力问答、和Gemini玩杯子游戏和推理小游戏等等。在整个过程中,Gemini的反应速度都非常快,还会生成音频和图片来辅助回答,并用上一些口语化乃至幽默化的表达,可谓是让人大开眼界。

然而,很快就有网友从视频开篇的文字免责声明中发现了问题,认为其可能暗示了视频中展示的是精心挑选的好结果,不是实时录制,而经过剪辑的。随后,谷歌在一篇博客文章中解释了多模态交互过程,基本上也间接承认了只有使用静态图片和多段提示词拼凑,才能达成演示视频中的效果。

谷歌大模型爆红后被质疑造假!承认演示视频剪辑过:为了简洁缩短了

例如,在文章中,谷歌承认,不同于视频中对于猜拳手势的快速反应,只有在向Gemini同时展示这三个手势并提示其这是游戏时,Gemini才会得出猜拳游戏的结论。官网截图

有分析指出,这和谷歌在视频中所暗示的可以说是完全不同,因为从视频看来,Gemini可以实时观察周围的世界并做出反应,用户可以与Gemini进行流畅的语音对话。沃顿商学院教授伊桑·莫利克(Ethan Mollick)也在X平台上进行了演示,如果是使用静态图片和多段提示词,完全可以通过ChatGPT Plus来复制Gemini的表现。

谷歌大模型爆红后被质疑造假!承认演示视频剪辑过:为了简洁缩短了

伊桑·莫利克给ChatGPT Plus同时展示谷歌演示视频中的多张截图,ChatGPT Plus也能给出类似的答案。

在质疑发酵后,谷歌DeepMind产品副总裁伊莱·柯林斯(Eli Collins)对外媒回应称,视频中的画鸭子演示(画一个鸭子的简笔画,Gemini可以对每一步骤做出正确的解释)确实是研究级别的功能,至少目前还没有出现在谷歌的实际产品中。

谷歌DeepMind研究和深度学习负责人副总裁奥里奥尔·维尼亚尔斯(Oriol Vinyals)也在X(原推特)平台上发布长文,解释了团队是如何制作该视频的:“视频中的所有用户提示和输出都是真实的,只是为了简洁而进行了缩短。”维尼亚尔斯还表示:“该视频展示了使用Gemini构建的多模态用户体验是什么样子。我们这样做是为了激励开发人员。”

然而,维尼亚尔斯的回应引发了更多的争议。有网友评论道:“如果你想激励开发者,为什么不发布真实的内容呢?被缩短的用户提示就不算‘真实’。这样做既不真诚,又具有误导性。”

谷歌大模型爆红后被质疑造假!承认演示视频剪辑过:为了简洁缩短了

有谷歌员工对外媒透露,他们认为这段视频描绘了一幅“不切实际的画面”。有员工表示,对这种夸张的演示并不感到惊讶,因为员工们已经习惯了公司会对产品在某种程度上进行夸大营销:“我认为大多数使用过大语言模型技术的员工都知道,要对(演示中的)这一切持保留态度。”

有外媒认为,谷歌“庞大的官僚体系和各级产品经理使其直到现在都无法像OpenAI那样敏捷地推出产品”。对于正在应对AI转型影响的社会而言,这并不是坏事。但对于谷歌最近这种迅速推进的表现,应该保持一定的保留态度。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-12-08 18:45:04

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

谷歌大模型Gemini视频被质疑造假、夸大宣传,官方回应:演示内容有剪辑|钛媒体焦点
谷歌Logo(图片来源:钛媒体App编辑拍摄)刚发布不到48小时的谷歌史上最强的人工智能(AI)大模型Gemini,如今却引发了一些争议
2023-12-08 22:02:00
Gemini终究难敌GPT-4?谷歌陷“虚假宣传”风波 承认演示视频系剪辑合成
...质疑,该视频并非实时录制,而是多轮尝试并精心挑选和剪辑而成。质疑声之一来自彭博专栏作家帕米·奥尔森(Parmy Olson),他认为,在谷歌发布的这段视频中,Gemini似乎
2023-12-11 11:02:00
Gemini 超越 GPT-4 靠作弊?谷歌承认:是的,演示视频经过了剪辑
...因在于那个 6 分半的 Gemini 演示视频:它是假的,是经过剪辑的,甚至在被质疑后,谷歌还承认了!Gemini 的视频演示效果
2023-12-08 22:02:00
“造假”的谷歌,暴露了AI大模型行业的致命问题
...,其中用静态图像和提示词一步步“调教”AI的过程都被剪辑掉了。比如演示视频中的画面是人手在玩石头剪刀布,Gemini直接回答:“我知道你在干嘛了,你在玩石头剪刀布”。光看这段
2023-12-19 19:02:00
机器人装上OpenAI大模型:合作仅13天,能思考会识别,动作流畅
...流畅,不少网友对视频的真实度产生了质疑,认为其经过剪辑处理。然而,阿德科克坚称,该视频属于真实拍摄:“正如你从视频中看到的,机器人的速度已经得到显著提升,开始接近人类的速度…
2024-03-14 21:31:00
三位电影制作人用Sora生成短片,涵盖“气球头”男人
...容都是Sora的原始输出。在将该工具制作的许多不同片段剪辑在一起后,ShyKids进行了一系列后期处理,使电影看起来更好。例如,他们使用视觉效果工具修复了主角气球脸的某些镜头
2024-04-04 22:39:00
奥特曼发布“王炸”模型Sora,周鸿祎:中美AI差距再度拉大
...,目前最容易受到影响的或许是影视行业的从业者。例如视频剪辑师、后期制作这类岗位,视频模型Sora能够自动或半自动地生成视频,这可能会导致传统的视频制作和编辑职位的需求下降。后
2024-02-17 19:43:00
服务“2030愿景”:中国AI营销平台王牌狮助推中沙数字经济务实合作
...模板,快速产出高转化文案,提升内容吸引力。2、智能视频剪辑:可视化剪辑器+AI去重技术,批量高效生成优质视频,满足规模化需求。3、多平台分发:视频同步发至抖音、视频号等平台,
2025-12-16 15:22:00
比赛开始了!Sora对手直呼奥特曼是魔术师,创意行业最先受冲击?
...相比之下,Sora的宣传视频包括变换摄像机角度、电影式剪辑和场景变换,而这一切,都是通过单一提示词生成的。Sora生成的视频能够达到更加逼真的效果。来源:Sora针对Sora
2024-02-18 18:30:00
更多关于财经的资讯:
2026年春节档总票房(含预售)超15亿
根据猫眼专业版数据,截至2月17日晚20点37分,2026年春节档总票房(含预售)超15亿,《飞驰人生3》以超7.17亿的成绩暂时领跑今年春节档大盘
2026-02-18 07:34:00
烟台农商银行开发区支行助力住建领域民生保障获赠锦旗
胶东在线2月13日讯(通讯员 兰琳)近日,烟台黄渤海新区住建局专程为烟台农商银行开发区支行送来一面写有“住建领域民生保障 农商助力薪暖民工”的锦旗
2026-02-18 05:00:00
冬奥会“带热”滑雪游!山东青岛滑雪场人气爆棚
第25届冬季奥林匹克运动会正在举行,冬奥会的观赛热情带动了滑雪游。在山东青岛,滑雪场内举办特色的气排球比赛,吸引越来越多的人参与到滑雪运动中
2026-02-17 07:48:00
用心护佑健康 以行奔赴美好——鲁南制药集团2026年新春贺词辞乙巳旧岁,迎丙午新春。当腊月的烟火漫过街巷,万家团圆的期盼日渐浓烈
2026-02-16 11:16:00
2月13日,德州银行向陵城区某企业成功发放8000万元的控制型并购贷款。该笔贷款是《商业银行并购贷款管理办法》自去年12月31日印发实施以来
2026-02-16 11:17:00
2026年米兰-科尔蒂纳冬奥会带动全球冰雪运动持续升温。我国冰雪装备外贸企业抓住机遇,也迎来海外订单高峰期。一件件国产冰雪装备
2026-02-16 08:31:00
记者从中国石油获悉,全球规模最大的200万吨/年柴油吸附分离装置目前在中国石油广西石化稳定运行。该技术已在多家炼化企业实现规模化应用
2026-02-16 09:01:00
除夕将至、新春在即,为向坚守基层一线、守护群众健康的卫生健康工作者致以崇高敬意与新春关怀,贵州银行丹寨支行组织金融服务小分队前往兴仁镇卫生院开展春节走访慰问暨金融便民服务活动
2026-02-15 21:02:00
新春走基层丨贵州铂汇选煤设备公司:春节赶出千万订单
年关已近,六盘水高新区先进装备制造产业园内,贵州铂汇选煤设备有限公司的激光切割机喷吐着蓝色光焰,一批洗选设备的部件初具雏形
2026-02-15 23:29:00
盘南低热值煤发电项目1号机组冲刺试运行 上半年双机组将商业运营
2月11日,中电建盘南2×660MW低热值煤发电项目集控室里,中电建盘州低热值煤发电有限公司副总经理、总工程师段云龙手拿1号机组最新试验清单
2026-02-15 23:29:00
2月14日,记者从尖草坪区获悉,为助推科技服务业高质量发展,该区科技局联合区统计局、汇丰街道及乾泽园社区,深入容海川城乡规划设计有限公司
2026-02-15 18:05:00
笔墨传情迎新春 金融暖心送万福—贵州银行从江支行开展“万福迎春·送春联进万家”公益活动
“这春联写得真有年味,字好、寓意也好,谢谢贵州银行惦记着我们老百姓!”活动现场,领到春联的市民脸上洋溢着笑容,连声称赞
2026-02-15 19:27:00
反诈宣传进社区 守袋护航迎新春—贵州银行岑巩支行联合开展岁末年初反诈防非集中宣传活动
为切实筑牢岁末年初金融安全防线,有效防范电信网络诈骗与非法金融活动,守护人民群众财产安全,2026年2月11日,贵州银行岑巩支行联合岑巩县防范和打击非法金融活动联席会议办公室及全县各金融机构
2026-02-15 19:27:00
黔南州瓮安县一处老旧居民楼里,空荡的楼道内传来阵阵笑声,这是102岁唐奶奶的家。这天,唐奶奶的家里迎来两位特别的客人——贵州银行瓮安支行的吴俊丹和何林璋
2026-02-15 19:27:00
春运返乡暖归途 金融宣教护民生—贵州银行榕江支行开展春运征信暨反诈反非集中宣传活动
2026年2月10日,正值春运返乡客流高峰,贵州银行榕江支行紧扣关键时间节点,走进县客车站开展征信知识暨反诈、反非法金融活动集中宣传
2026-02-15 19:27:00