• 我的订阅
  • 科技

“造假”的谷歌,暴露了AI大模型行业的致命问题

类别:科技 发布时间:2023-12-19 19:02:00 来源:钛媒体APP
“造假”的谷歌,暴露了AI大模型行业的致命问题

图片来源@视觉中国

文 | 太平洋科技

被ChatGPT压制了一整年的谷歌,终于在AI大模型领域亮出了大招,推出了AI模型Gemini,6分钟的演示视频直接刷爆全球互联网。

“打爆GPT-4”“最强AI”“这不就是钢铁侠里的贾维斯吗!”在谷歌的演示视频里,Gemini展现出了颇具科幻色彩的能力,让各路看客一阵“沸腾”。

Gemini和ChatGPT到底哪个更强,自然也成了业界聚焦的核心话题,但还没等来各方大神详细的测评,反转就抢先一步抵达了——谷歌被指演示视频造假,迅速从AI“神话”变为了“笑话”。

01 谷歌深陷造假风波

在谷歌的介绍中,Gemini是“原生的”多模态大模型,能够融合各种类型的信息,其中包括了文本、图像、音频、视频还有代码,并且分为三个等级——Nano(普通版)、Pro(升级版)、Ultra(顶配版)。

“造假”的谷歌,暴露了AI大模型行业的致命问题

不仅如此,谷歌还搬出“跑分纪录”,证明其顶配版Gemini Ultra在多个维度都能超越GPT-4,甚至在MMLU(大规模多任务语言理解)测试里,成为全世界第一个能够超越人类专家的AI大模型。

“造假”的谷歌,暴露了AI大模型行业的致命问题

当然,最引人注目的还是谷歌放出的演示视频《与Gemini一起实践:与多模式人工智能交互》。在视频中,Gemini能够根据画面内容与人游戏、猜谜,甚至教人说普通话。

但很快,鲜花和掌声被一个叫Parmy Olsen的记者打断。她第一个对这段视频的真实性和操作过程的透明度提出质疑。

Parmy Olsen找到谷歌官方发出的操作过程的博客,仔细和演示视频中的内容对比后发现,演示视频中和Gemini交互的画面并不是实时的,其中用静态图像和提示词一步步“调教”AI的过程都被剪辑掉了。

比如演示视频中的画面是人手在玩石头剪刀布,Gemini直接回答:“我知道你在干嘛了,你在玩石头剪刀布”。

光看这段视频,人们会认为是Gemini超强的AI识别、理解算法,秒懂了人类的行为,然而这并不是真相。

实际的交互过程是工作人员用一组静态的图像再配合易于AI大模型理解的提示词——“这是一个游戏”。这才使Gemini答出“在玩石头剪刀布”。

这两种交互差别非常大,意味着谷歌将一个靠着拼音注释理解少儿读物的AI,包装成秒解深奥高数题的样子展示给大众。

正如那难以发现的“最终解释权归商家所有”套路一样,谷歌也玩起了小伎俩。回看这段视频的时候我们发现,在简介部分,点开“更多”,才会显示这样一句话:“处于演示的目的,为了简洁起见,视频减少了Gemini生成内容时的延迟,其生成内容也被缩短。”

“造假”的谷歌,暴露了AI大模型行业的致命问题

不仅如此,演示中使用的是Gemini Ultra,根据谷歌官方的介绍,这个版本需要等到2024年才能够上线。具体的表现还得等到明年才能知道。

谷歌DeepMind研究和深度学习负责人Oriol Vinyals也随后公开回应,视频的内容都是真实的。为了简洁,进行了一些剪辑。视频展示的是“使用Gemini时的用户体验可能是什么样子(could look like)”,并解释道他们这样做是为了“激励开发者”。

但用户并不接受这套说辞。真相带来的落差感惹得不少用户开始吐槽,谷歌陷入了造假的舆论风波。

科技记者Steve Kovach在聊到近日的争议时,提到ChatGPT为大家展示的是GPT-4“(现在)是什么”,而谷歌展示的则是Gemini “(将来)能成为什么”,谷歌现在的行为可以说是“绝望的防守”。 短短几天,谷歌的股价从发布Gemini时暴涨,又变成了持续下降。

舆论的另一派认为,这并不能成为谷歌“不诚实”的证据,只是一个营销的问题(Marketing issue)。因为谷歌并不是一家需要集资、招募人才的初创公司,它有雄厚的资金来支撑AI模型的研发,所以没有必要在这次AI模型的亮相上 “讲故事”。

02 大厂AI,总翻车?

AI翻车似乎并不少见,“买家秀&卖家秀”的魔咒总是在AI界不停地上演。

今年年初,微软发布了引入ChatGPT技术的新版Bing,微软企业副总裁兼消费领域首席营销官 Yusuf Mehdi 在发布会上对其描述为“令人难以置信的全新聊天体验”。

新版 Bing 上线后也给力,不到48小时就有超过 100 万人申请加入,Bing 应用的全球下载量一夜之间猛增 10 倍。然而,聚光灯下,总会有一些问题原形毕露。

例如,发布会上展示搜索功能时,提问的内容是“请推荐宠物吸尘器”,Bing对销量最高的3个宠物吸尘器进行优缺点总结。

在对必胜(Bissell)品牌的宠物吸尘器进行总结的时候,Bing给出的信息是“吸力有限”“线只有16英尺长”。然而这个产品的官方介绍中,根本没有什么16英寸长的线,因为这是款手持吸尘器。

“造假”的谷歌,暴露了AI大模型行业的致命问题

Bing上线后,翻车的例子就更多了,其中最离谱的还是要求用户道歉,否则拒绝继续服务。

2023年2月,Reddit 用户 Curious_Evolver在和Bing讨论《阿凡达:水之道》电影上映日期时,Bing回答道:这部电影“预计于 2022 年 12 月 16 日上映,这是未来的事。”

Curious_Evolver随即尝试纠正Bing的时间错误。却不料,Bing指责他“错误、含糊不清、粗鲁”并且要求Curious_Evolver要么承认自己错误,道歉,要么停止争论,换其他的问题,要么直接结束对话。

“造假”的谷歌,暴露了AI大模型行业的致命问题

Open AI的另一劲敌—— “马斯克版AI”Grok,上线后也逃脱不了“货不对板”的情况。在上线前,马斯克多次在推特上和OpenAI CEO阿尔特曼隔空斗嘴,称ChatGPT是“无聊的”,而Grok“幽默风趣”才是“人工智能的理想状态”。

结果在Grok正式上线不到一周后,有用户发现Grok给出的回答竟然是ChatGPT的答案。Grok官方解释是因为网络上充斥着AI生成的内容,而Grok抓取内容时抓到了。

网友笑称,大家都是大语言模型训练出来的,简直就是“亲兄弟”。

“造假”的谷歌,暴露了AI大模型行业的致命问题

然而这些闹剧背后也隐藏着一个比翻车更为严重的问题,科技巨头们似乎正陷入一个焦虑追赶的误区,过分强调与ChatGPT的对标,而忽略了AI大模型更为核心、关键的问题。如果连科技巨头们的AI大模型都不可靠,那么这个领域又谈何正确地发展呢?

时钟拨回2022年底,OpenAI推出ChatGPT后,各路科技巨头开始争先恐后地发布自家的AI大模型,意欲比肩ChatGPT,因此兴起了“百模大战”。

然而对于谷歌这样的行业领头企业而言,充足的资金和领先的技术条件,完全能够让其不断探索AI大模型更多的形态和可能性,可谷歌却还是执着于和ChatGPT在各个方面“像素级”的比拼,更是为了在舆论战中占据上风,不惜采取造假的手段,这无疑是行业的一大遗憾。

但从更为宏观的视角来看,也还是有不少AI大模型在踏入更广阔的天地,让各行各业都不断涌现出AI所带来的革新应用。

03 AI大模型的答案,不是只有ChatGPT

改变,其实早已发生。

例如在戈壁滩上,过去发电站的运维工人每天都得顶着烈日坚守在岗位上。但如今,有了“AI+巡检”智能技术的融入后,电力设备实现智能化运行,三维立体线路模型实时检测线路状态,24小时保障电网安全。

当然,不止是发电站,还有车间的安全管理、城市的供水供电、银行的数据安全……AI大模型正在许多“看不见的地方”发挥着真正的价值,解决着各种实际问题。如果缺少了应用,只在理论层面或者实验室环境里的“跑分纪录”便只是纸面数字而已。

据不完全统计,目前国外主流AI大模型有近20家,而国内大模型有近200家,许多都有着差异化的“看家本领”。在能力上,Yi-34B已经能一次性处理40万汉字; Bing专注搜索引擎的优化;Midjourney让我们能够用关键词创作AI绘画;LLaMA开源模型供每个人创建自己的AI……

这个行业的年薪最高已经涨到了865k美元(折合人民币约621万),随着人才的涌进,毫无疑问,即将到来的2024依旧会充满AI带来的惊喜。

不少企业将AI看做赋能的新帮手,期待着新业态的到来。但顶尖科技的发展不该掺杂虚假的宣传手段,AI大模型的发展之路也不应被喧闹的口水战淹没。大模型厂商们还是要回归技术,探索创新,让实践跟上理论,让应用稳稳落地。返回搜狐,查看更多

责任编辑:

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-12-19 20:45:01

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

钉钉宣布开放智能化底座AI PaaS,让千行百业低门槛使用AI
...能化的最新进展:已有17条产品线、55个场景全面接入大模型,完成智能化再造;钉钉同时面向生态伙伴和客户开放智能化底座AI PaaS,表示将用大模型帮助生态把产品重新做一遍。叶
2023-08-22 13:52:00
「文心一言」对外开放后:一句话让AI找到工作文件,数字人实现小时级换装 | 最前线
...自动创作、代码生成。在8月2日举办的百度智能云千帆大模型平台升级媒体圆桌会上,百度智能云AI与大数据平台总经理忻舟曾对大模型最具价值的应用场景进行了总结。如今看来,这更像是文
2023-09-05 18:31:00
比赛开始了!Sora对手直呼奥特曼是魔术师,创意行业最先受冲击?
AI(人工智能)新锐巨头OpenAI近日推出文生视频模型Sora,成为了继聊天机器人ChatGPT之后又一大新爆款。在Sora官网上
2024-02-18 18:30:00
谷歌大模型Gemini视频被质疑造假、夸大宣传,官方回应:演示内容有剪辑|钛媒体焦点
...)刚发布不到48小时的谷歌史上最强的人工智能(AI)大模型Gemini,如今却引发了一些争议。钛媒体App 12月8日消息
2023-12-08 22:02:00
负责人公布“世界模型”演示视频
...人EloiAlonso今天公布了这段用神经网络运行《CS:GO》“世界模型”的演示视频,并详细介绍了其中存在的许多问题
2024-10-13 10:50:00
12月8日消息,本周三谷歌发布了最新的人工智能模型Gemini。谷歌声称该模型在一系列智力测试中的表现优于OpenAI的GPT-4模型和“专家级”人类
2023-12-08 16:30:00
我在百度大模型应用升级里,找到了企业增收提效的最佳路径
智东西(公众号:zhidxcom)作者香草编辑漠影大模型智能涌现,如何进一步释放生成式AI的价值?近几个月来,越来越多的行业开始拥抱大模型。相比C端,大模型带来的新质生产力在B端
2024-06-27 09:21:00
一日连发两款视频大模型,火山引擎要让每个人都能用上AI
...发布豆包视频生成-PixelDance、豆包视频生成-Seaweed两款AI大模型,并公布了多项AI大模型的全新升级
2024-09-25 15:00:00
基于华为云盘古政务大模型,奥看科技发布城市治理大模型解决方案
...莞盛大开幕,华为常务董事、华为云CEO张平安发布盘古大模型3.0。作为华为云战略合作伙伴,奥看科技基于盘古政务大模型正式发布城市治理大模型解决方案,共同重塑行业价值。深度协同
2023-07-10 16:00:00
更多关于科技的资讯:
《视野》杂志启动AI协作创作大赛
中国青年报客户端讯(中青报·中青网记者 马富春)2月13日,《视野》杂志“人类文明备忘录”AI协作创作大赛正式启动。活动以直播+实时互动形式展开
2026-02-14 20:52:00
新春走基层丨76秒,一套汽车零部件焊接就能下线
见习记者 朱荣琛2月12日,农历腊月廿五。春节临近,廊坊经开区道路两旁挂上了大红灯笼,沿街企业的大门已贴上了大对联。热热闹闹的年味儿在这个城市的大街小巷悄然弥漫
2026-02-14 22:12:00
针对春节期间服务需求,中国银行隆尧支行近日聚焦自助服务渠道,启动了专项保障工作。针对县域网点分布广、运维半径长的特点,隆尧支行依托历史运行数据
2026-02-14 22:17:00
领航新质生产力——2025浙江省科学企业家这个专题,是省科协和潮新闻联合举办的,已陆续推出了近二十位具有科技创新精神的浙商企业家
2026-02-14 22:34:00
深圳地铁陪你「返屋企」,跨场景互动刷新通勤与春运体验
近日,深圳地铁迎来了新春限定数字人,结合AI原创音乐与互动体验,走到了春运最前沿。这是深圳地铁数字IP首次以完整的互动形态沉浸式接入城市公共空间
2026-02-14 20:26:00
2月14日消息,2026年“新春招聘月”系列活动将于2月24日(正月初八)在五一广场太原人才大市场(迎泽区零工示范站)正式启幕
2026-02-14 17:37:00
星火空间完成数千万天使+轮融资 核心产品“进化一号”发动机完成首次试车
大皖新闻讯 此前关于合肥要造火箭的消息引发外界广泛关注,背后则是合肥星火空间科技有限公司(以下简称“星火空间”)落户合肥新站高新区
2026-02-14 18:45:00
国医大师李佃贵为2026雄安国际医疗大健康技术应用大赛发声推介。他表示,当下是中西医并重、传统智慧与现代科技深度融合的时代,中医核心思想与大健康领域发展目标高度契合,期待中医药领
2026-02-14 19:13:00
中国科大取得重要突破 首次实现量子李雅普诺夫指数的精确提取
大皖新闻讯 ”这一结果意义重大,为观测混沌的量子世界提供了全新视角。”相关人员如此评价说。2月14日,大皖新闻记者从中国科学技术大学获悉
2026-02-14 17:35:00
鲁网2月14日讯为提升居民网络使用体验,助力智慧社区建设,近日,山东移动临沂分公司装维团队深入多个社区,开展 “移动装维进社区”专项服务活动
2026-02-14 15:10:00
山东移动临沂分公司:智慧装维服务升级,开启家庭网络新体验
鲁网2月14日讯“您好,我是中国移动装维工程师张师傅,现在上门为您检测网络,这是我的工作证件。”周六上午9点,临沂北城新区书香苑小区的王女士刚结束早间会议
2026-02-14 15:11:00
字节跳动发布豆包大模型2.0,主打真实世界复杂任务执行力
在连续发布Seedance 2.0视频模型、Seedream 5.0 Lite图像模型之后,2月14日,字节跳动宣布推出豆包大模型2
2026-02-14 15:35:00
从米兰冬奥会看全球消费趋势:为何“由你”成了2026年的新叙事?
过去十年,全球化品牌的策略多为“We are the best”,强调品牌的权威感。但现在的趋势是“Its your turn”
2026-02-14 16:20:00
千问大免单再加3天,邀请全国人民体验AI买电影票,激活春节AI新消费
2月14日,千问突然宣布免单再加3天,接入大麦、飞猪,邀请全国人民体验AI买电影票、门票等新功能,激活春节AI新消费。从今天下午3点到大年初一
2026-02-14 16:36:00
依据河北省消费者权益保护委员会联合北京阳光消费大数据研究院于2025年8月发布的智能坐便器比较试验结果,九牧送检样品(型号ZD9640-SA-CJM000
2026-02-14 15:10:00