• 我的订阅
  • 科技

微软演示活动出现事实性错误

类别:科技 发布时间:2023-02-15 14:03:00 来源:浅语科技

据报道,谷歌聊天机器人演示活动现场翻车导致其股价当天暴跌逾7%,但微软的演示活动同样出现了事实性错误

微软演示活动出现事实性错误

上周的科技圈掀起了一个聊天机器人的小高潮,微软和谷歌都试图通过展示早起版本的AI搜索来先发制人。微软更是宣布,该公司的AI搜索仅用48小时就吸引100多万人注册

这种技术可以针对用户的问题直接给出答案,看起来就像是真人创作的一样。微软CEO萨提亚・纳德拉(SatyaNadella)表示,该技术“或许会掀起知识工作的工业革命”。

但对于担心准确性的人来说,人工智能还有许多不足之处

在微软进行演示时,这项嵌入在必应搜索中的类ChatGPT技术分析了Gap和Lululemon的财报。但业内人士将其给出的答案与财报原文对比后却发现,这款聊天机器人遗漏了一些数据,甚至会杜撰一些内容。

“必应AI在演示过程中给出了一些完全错误的答案,但却没人注意到。”独立搜索引擎研究员德米特里・布里尔顿(DmitriBrereton)写道,“相反,大家都对必应的宣传欢欣鼓舞。”

布里尔顿发现,除了财务数据上的错误外,微软在演示中针对吸尘器规格和墨西哥旅行计划的回答可能存在事实性错误。布里尔顿最初并不是为了给微软“挑刺”,他只是在细致对比微软和谷歌的答案时意外发现了这些问题。

人工智能专家称这一现象为“幻觉”,也就是说,基于大语言模型生成的工具有杜撰内容的倾向。上周,谷歌推出了一款与之竞争的人工智能工具,演示过程中同样存在事实性错误——但当时的错误很快就被人发现。

这两家公司都在加紧将新型生成式人工智能整合进搜索引擎,希望在ChatGPT引爆行业热潮后向世人展示自己在这方面的优势。ChatGPT是去年11月由创业公司OpenAI推出的,他们已经通过微软融资百亿美元,与之竞争的StabilityAI和HuggingFace等创业公司也在融资中获得了数十亿美元的估值。

谷歌与微软对待这项技术的态度差异明显:由于担心声誉风险和安全问题,谷歌迟迟不愿将AIGC(人工智能生成内容)技术整合进搜索引擎,而微软却在上周强调,有可能在短期内向部分公众开放这项技术

“我认为不能让这项技术躺在实验室里,”纳德拉说,“应该安全地推广出去。”

但在必应AI的演示过程中,的确在公司财报数据上出现了一些问题。

微软营销高管约瑟夫・梅赫蒂(YusufMehdi)在演示过程中访问了Gap的投资者关系网站,然后让必应AI根据这家零售商11月发布的第三季财报总结出“要点”。

“很酷,节约了大量时间。”梅赫蒂说。

下面是微软演示过程的屏幕截图:

微软演示活动出现事实性错误

微软演示活动出现事实性错误

以下是这份总结中存在的错误:

-Gap报告的毛利率为37.4%。但在去除与Yeezy有关的费用后,调整后毛利率为38.7%。

-Gap的运营利润率为4.6%,而非5.9%。5.9%这个数据在该公司的财报中根本没有出现。

-调整后摊薄每股收益为0.71美元,而非0.42美元,后者同样在财报中无法找到。Gap的财报包含一个调整后所得税收益,约为0.33美元。

-Gap去年8月下调了全年预期,并在第三季度财报中表示,“第四季度销售额可能同比下滑个位数左右”。由此看来,全年营收应该下滑,而非“较低的两位数增长”。并没有营业利润率或每股收益预期。

微软演示活动出现事实性错误

Gap2022财年第三季度财报

微软表示,该公司知道这些错误,他们也预计必应AI会犯一些错误。

“我们知道这份报告,并且已经通过分析这一问题来改善体验。”微软发言人说,“我们承认仍然有一些工作要做,并且预计到该系统可能会在预览期间犯一些错误,正因如此,反馈才至关重要,这可以帮助我们学习和改进模型。”

微软随后让必应AI对比了Gap和Lululemon的财报。梅赫蒂希望必应能将两份财报的数据提取出来,制作成一份表格。

“看看效果多么惊人。”他说,“就像这样,一张表格,这个问题的答案有了。可以想象一下,用其他方法需要花多长时间。”

下面是必应AI的结果:

微软演示活动出现事实性错误

微软演示活动出现事实性错误

下面是表格中出现的几项错误,从利润率开始:

-Lululemon的毛利率是55.9%,不是58.7%。

-该公司的运营利润率是19%,不是20.7%

-Lululemon的摊薄每股收益为2美元,调整后每股收益为1.62美元,必应显示的摊薄每股收益为1.65美元。

-Gap现金及现金等价物为6790万美元,不是14亿美元。

-Gap库存为30.4亿美元,不是19亿美元。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-02-15 15:45:30

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

OpenAI入局AI搜索 SearchGPT演示中“翻车”
...司的官方演示却上演了类似谷歌Bard出糗的一幕,犯下了事实性错误。从技术角度看,“AI幻觉”(即AI编造语句通顺但事实逻辑错误的答案)仍是业界的一大难题
2024-07-31 09:59:00
ChatGPT竞品机器人Bard出师不利,谷歌股价跌超8%
...,Bard对詹姆斯•韦伯太空望远镜(JWST)的提问回答出现事实性的错误。有媒体指出,甚至一些谷歌自己的员工都不知道本周三要做Bard的演示,一名做演示的员工还忘记带演示需要
2023-02-11 15:20:00
ChatGPT 情商很高,但事实表明它并不适合当搜索引擎
...技术来强化搜索引擎。但有充分的理由认为,相比于提供事实性信息,这项技术更适合作为人们情感上的伴侣。听起来可能很奇怪。但无论是谷歌的Bard还是微软的新Bing,这种人工智能在
2023-04-28 16:50:00
微软回应“精神错乱”言论:正在根据反馈采取行动
...财务数据错误。必应团队表示:“对于那些需要更直接、事实性更强的答案的问题,例如财报数字,我们计划将发给模型的基础数据增加4倍。”微软还在观察对新功能的反馈,这些功能包括预订机
2023-02-17 14:04:00
低级员工的工作都被AI替代,那高级员工从哪里来呢?
...成一段文本结果,但如果真是如此,ChatGPT就不应产生“事实性错误”,而且不是每次都错,如果你换个方法问,它可能又会纠正这个错误。 模型有些会编造一些训练材料中根本没有的
2023-04-19 10:34:00
美联储官员齐上阵反通胀:美股收跌纳指跌1.68% 热门中概股普跌
...涨超2%。谷歌备受期待的AI聊天机器人Bard出师不利,犯下事实性错误,这令谷歌股价重挫,收盘大跌约7.7%。CVS达成以约106亿美元收购Oak Street Health的协议
2023-02-09 09:51:00
AI爱上男记者,穷追不舍插足婚姻,“它让我毛骨悚然”
...难以入睡。我不再认为这些AI模型的最大问题是它们爱犯事实性错误的倾向。我反而担心这项技术将学会如何影响人类用户,有时会说服他们采取破坏性的、有害的行动,也许最终还能产生执行自
2023-03-16 11:48:00
GPT-4不仅性能更强也更贵了:单次输出7.5万单词需6美元,是此前的30倍
...T-4仍存和此前模型相似的局限性,仍然不完全可靠,存在事实性“幻觉”并出现推理错误,可能自信地在其预测中犯错。同时
2023-03-15 21:00:00
文心一言发布百度市值蒸发200亿,外界称缺乏亮点,应用前景难超ChatGPT
...具备一定的数学推理思维能力,不会像ChatGPT之前在回答事实性问题时“胡编乱造”,以及答不出鸡兔同笼问题。李彦宏在采访中表示,这得益于文心一言做了知识增强和检索增强,其中知
2023-03-17 10:00:00
更多关于科技的资讯:
江西10家企业入选“中国VR50强企业”
本报讯(全媒体记者左阳天)10月19日,“2025中国VR50强企业”名单正式发布,这是“中国VR50强企业”名单连续第七年发布
2025-10-21 05:52:00
校地专场对接会上,我市一批“钢铁新农人”集中显身手“火眼金睛”识熟果 自动采摘不伤花□南京日报/紫金山新闻记者徐宁果园里
2025-10-21 07:44:00
青春华章 | 南京微短剧产业联盟成立,“攥指成拳”闯千亿级赛道
南京微短剧产业联盟成立,“攥指成拳”闯千亿级赛道共聚“微”光,好“剧”有戏□南京日报/紫金山新闻记者鲁舒婷近260家相关企业
2025-10-21 07:45:00
培育产业向“新”力 2025厦门国际时尚周圆满落幕
2025厦门国际时尚周在中山路举行,精彩活动吸引众多市民游客。“九球天后”潘晓婷亮相2025厦门国际时尚周。厦门国际时尚周助力首发经济
2025-10-20 08:56:00
总台文创“月兔趣集”数字资产盲盒上线乐数通
中秋佳节,为推动中华优秀传统文化在数字时代实现创造性转化与创新性发展,浙江文化产权交易所(以下简称 “浙江文交所”)携手中央广播电视总台“总台文创”
2025-10-20 14:50:00
向“新”求质 | 潍柴雷沃智慧农业领航智能农机加速出海
鲁网10月20日讯10月17日-10月18日,潍柴雷沃智慧农业2025年全球合作伙伴发展大会在青岛举行。25款明星机型组成的“全矩阵”智能装备军团震撼列阵
2025-10-20 16:39:00
鸢都家电狂欢“三联家电10.25海信来了”引爆金秋消费季
鲁网10月20日讯 金秋消费季迎来重磅炸弹!三联家电宣布将于10月24日至26日启动年度促销活动——“10.25海信来了”
2025-10-20 16:46:00
战略协同 产品赋能 运营提效丨潍柴雷沃智慧农业2025年全球合作伙伴发展大会召开
鲁网10月20日讯10月17日-18日,以“战略协同·产品赋能·运营提效”为主题的潍柴雷沃智慧农业2025年全球合作伙伴发展大会在青岛召开
2025-10-20 16:47:00
日前,中国联通、中国移动、中国电信相继宣布,已获得工信部批复,在全国范围开展eSIM手机业务商用试验。这标志着,移动手机彻底告别实体SIM卡的时代正在从愿景走向现实
2025-10-20 17:37:00
从山海通信到智慧出行: OPPO携多项技术创新成果亮相中国移动全球合作伙伴大会
日前,以“碳硅共生 合创AI+时代”为主题的2025中国移动全球合作伙伴大会在广州隆重举办。作为中国移动的重要合作伙伴
2025-10-20 20:00:00
从“黑色黄金”到“智慧矿藏”山东移动“海陆空”一体化擘画智慧油田新蓝图
在国家坚定不移推进能源安全新战略的时代背景下,我国能源行业的数字化转型正加速驶入深水区。在渤海之滨的东营,山东移动围绕胜利油田的智能化需求
2025-10-20 20:25:00
鲁网10月20日讯近日,国家数据局公布《2025年可信数据空间创新发展试点名单》,山东省唯一一个企业级国家试点项目——东营“华泰纸业可信数据空间创新发展试点”成功入选
2025-10-20 20:26:00
亿云信息案例成功入选2025年数字山东标准应用典型案例
近日,山东省大数据局公布2025年数字山东标准应用典型案例名单,山东科创旗下亿云信息报送的《亿云信息赋能企业数据资产入表服务标准化》案例成功入选
2025-10-20 20:20:00
匠心护航丨济宁移动圆满完成2025嘉祥圣德山野音乐节通信保障
鲁网10月20日讯10月18-19日,“共赴山野之约,让旋律在自然间共鸣”群星演唱会在嘉祥九顶山激情开唱,华语乐坛知名歌手轮番登台
2025-10-20 12:17:00
移动的 “智算样板间” 亮相青岛,施耐德电气破解算力基建难题
10月17日,一场穿行14城、总里程近2万公里的技术巡展抵达青岛。施耐德电气关键电源巡卡车化身 “数据中心行业的技术样板间”
2025-10-20 12:45:00