• 我的订阅
  • 科技

被认为国产AI之光的DeepSeek V3出糗:居然自称是ChatGPT

类别:科技 发布时间:2024-12-30 00:40:00 来源:浅语科技

要说这两天大模型圈的顶流话题,那绝对是非DeepSeek V3莫属了。

不过在网友们纷纷测试之际,有个bug也成了热议的焦点——

只是少了一个问号,DeepSeek V3竟然称自己是ChatGPT。

被认为国产AI之光的DeepSeek V3出糗:居然自称是ChatGPT

甚至让它讲个笑话,生成的结果也是跟ChatGPT一样:

被认为国产AI之光的DeepSeek V3出糗:居然自称是ChatGPT

加之DeepSeek V3这次爆火的一个亮点,就是训练只花了557.6万美元的成本。

于是乎,有人就开始怀疑了:它不会是在ChatGPT的输出基础上训练的吧?

好巧不巧,Altman也发了一个状态,似乎在暗讽着什么……

被认为国产AI之光的DeepSeek V3出糗:居然自称是ChatGPT

不过DeepSeek V3并非是第一个出现“报错家门”的大模型。

例如Gemini就曾说过自己是百度的文心一言……

被认为国产AI之光的DeepSeek V3出糗:居然自称是ChatGPT

那么这到底是怎么一回事?为什么DeepSeek V3报错家门?

首先需要强调的一点是,从目前网友们整体讨论的观点来看,说DeepSeek V3是在ChatGPT输出上训练的可能性不大。

被认为国产AI之光的DeepSeek V3出糗:居然自称是ChatGPT

之所以这么说,正如网友Riley Goodside所总结的那样——因为ChatGPT的影子无处不在。

即便DeepSeek V3故意用ChatGPT的输出做了训练,但这并不重要。

所有在ChatGPT之后出现的大模型,几乎都见过它。

例如ShareGPT,一个并不新鲜的ChatGPT对话数据集,许多人已经尝试在它和其它ChatGPT数据源上进行调整。但即便如此,也没能出现DeepSeek V3级别的大模型。

被认为国产AI之光的DeepSeek V3出糗:居然自称是ChatGPT

紧接着,Riley Goodside又拿出了DeepSeek V3报告中的一些证据:

而且要是用了ChatGPT数据的话,有些关于DeepSeek V3质量的问题是解释不通的。

例如Pile测试(基础模型压缩Pile的效果),DeepSeek V3得分几乎与Llama 3.1 405B相当,这跟它接没接触ChatGPT数据无关。

而且报告称95%的GPU-hours用于预训练基础模型,即便是跟ChatGPT数据有关,那这部分也会在post-training阶段发生(后5%)。

被认为国产AI之光的DeepSeek V3出糗:居然自称是ChatGPT

而比起用没用ChatGPT数据,或许我们应当更加关注的是为什么大模型会频繁出现“报错家门”的问题。

TechCrunch针对这个问题给出了一句犀利的点评:

因为AI公司们获取数据的地方——网络,正在充斥着AI垃圾。

毕竟欧盟的一份报告曾预测,到2026年,90%的在线内容可能是AI生成的。

这种“AI污染”就会让“训练数据彻底过滤AI的输出”变得困难。

被认为国产AI之光的DeepSeek V3出糗:居然自称是ChatGPT

AI Now Institute的首席科学家Heidy Khlaaf则表示:

尽管存在风险,开发者依然被从现有AI模型中“蒸馏”知识所带来的成本节约所吸引。

意外地在ChatGPT或GPT-4输出上进行训练的模型,也不一定会展示出让人想起OpenAI定制消息的输出。

那么现在对于网友们热议的问题,量子位进行了一波实测,DeepSeek V3目前还没有解决这个bug。

依旧是少了个问号,回答结果会不一样:

被认为国产AI之光的DeepSeek V3出糗:居然自称是ChatGPT

DeepSeek V3更多玩法

不过有一说一,绝大部分网友对于DeepSeek V3的能力是给予了大大的肯定。

从各路AI大佬们集体直呼“优雅”中就能印证这一点。

而就在这两天,网友们陆续晒出了更多DeepSeek V3加持的实用玩法。

例如有网友拿DeepSeek V3和Claude Sonnet 3.5一决高下,在Scroll Hub中分别用它俩创建网站。

博主在测试之后,认为DeepSeek V3完全胜出!

还有网友分享了用DeepSeek V3在AI视频编辑器中的体验。

他表示以后不用再在FFMPEG命令上浪费时间了,DeepSeek V3不仅免费,还能改变你的工作流程。

AI编程神器Cursor也能跟DeepSeek V3结合,来看一个做贪吃蛇的案例。

嗯,DeepSeek V3是有点好用在身上的。

One More Thing

对于此前公布的53页论文,也有网友关注到了一个非技术性的细节——

贡献列表中,不仅展示了技术人员,还有数据注释和商务等工作人员:

被认为国产AI之光的DeepSeek V3出糗:居然自称是ChatGPT

网友认为这种做法非常符合DeepSeek的调性:

被认为国产AI之光的DeepSeek V3出糗:居然自称是ChatGPT

参考链接:

[1]https://techcrunch.com/2024/12/27/why-deepseeks-new-ai-model-thinks-its-chatgpt/

[2]https://x.com/victormustar/status/1872647314231398524

[3]https://x.com/breckyunits/status/1872422078592516295

[4]https://x.com/op7418/status/1872689338242482203

[5]https://x.com/goodside/status/1872911457857208596

[6]https://x.com/kevinsxu/status/1873146905846530472

责任编辑:上方文Q

文章内容举报

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-12-30 08:45:05

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

斯坦福AI团队抄袭国产大模型?连识别“清华简”都抄了!清华系团队发文回应
...入MiniCPM-V的代码,然后改名成Llama3-V。最绝的是Llama3-V连国产AI模型的“胎记”都抄走了,跟MiniCPM-V一样能识别清华战国竹简“清华简”
2024-06-04 14:35:00
AI圈开年首炸:139位中国清北名校天才 创立一家震撼硅谷的企业
...体报道,DeepSeek作为开年AI领域的重大突破,以其“国产之光”的新形象震撼了海内外科技界。这家AI创业企业以其独特的团队构成和卓越的技术成就,成为了业界关注的焦点。从公
2025-01-12 14:52:00
真正的国产显卡之光!摩尔线程国产GPU、AI与元宇宙多项进展深入解读
...动新算法模型、计算系统和平台的开发。六、结语:国产之光 未来可期摩尔线程诞生之初,其实很多人并不太看好,毕竟在当前的大环境和行业态势下,在NVIDIA这样的国际巨头几乎垄断的
2023-06-05 03:00:00
互联网十年:构建人与算法的关系,AIGC技术浪潮迎来新突破
...不起来的情况。” 事实上,仅从此次乌镇峰会的互联网之光博览会现场来看,不论是互联网巨头、三大运营商,抑或是数据服务类上市公司、初创企业,都纷纷推出自己的大模型。显然,尽管算
2023-11-12 20:49:00
混沌初开:国产大模型在沸腾中“求索”
...形式出现。AI新机会:通用大模型or应用层垂直模型摆在国产大模型入局者的机会和选择有两个:通用大模型与应用层垂直模型。大厂更具有开发通用大模型的野心和能力。当前模式主要是以通
2023-05-31 16:00:00
重磅!TeleAI 完成首个全国产化万卡万参大模型训练
...国电信人工智能研究院(TeleAI)成功完成国内首个基于全国产化万卡集群训练的万亿参数大模型(万卡万参),并正式对外开源首个基于全国产化万卡集群和国产深度学习框架训练的千亿参
2024-09-30 09:50:00
华为Mate 60Pro 究竟意味着什么?
...多数人的关注点不仅仅在于手机本身,更是中国的“国货之光”面对以外国为首的商业遏制绞杀,能否冲出重围、浴火重生的关注。而这一切的答案,还是在手机里。“直击内心”的不寻常评测我们
2023-09-13 14:27:00
全国已有14个国家超算中心,何为超算互联网建设的关键?
...超级计算长沙中心总工程师唐卓。今年6月,浙江“乌镇之光”超算中心正式纳入国家超算中心序列,成为全国第14个国家超算中心。“我们国家现在正在紧锣密鼓地建设超算互联网。”8月24
2023-08-28 16:47:00
...态□南京日报/紫金山新闻记者 集体采写最近,“国产AI之光”大模型DeepSeek火爆全网,凭借其高性能表现、低成本投入
2025-02-18 08:18:00
更多关于科技的资讯:
河北新闻网讯(任蕊)“以前插接一根四分钢丝绳,费时费力。现在用上自制装置,效率翻番!”1月11日,在开滦股份吕家坨矿负950五采回风石门掘进现场
2026-01-19 20:15:00
一家皖企跻身胡润中国人工智能企业10强榜
大皖新闻讯 1月19日,胡润研究院发布《2025胡润中国人工智能企业50强》排行榜,中国科大校友陈天石创立的寒武纪蝉联榜首
2026-01-19 22:42:00
河北新闻网讯(田坤)近日,在开滦集团钱家营矿业公司(简称“开滦钱矿公司”)机采科检修车间,一台自主研发的“液压钻车负载敏感阀试验台装置”成功完成首次测试
2026-01-19 20:03:00
河北新闻网讯(闫丽颖、罗俊明)近日,开滦股份范各庄矿顺利完成井下排水泵房的智能化改造,传统人工巡检模式被远程集中监控替代
2026-01-19 20:04:00
安克与飞书联合发布“安克AI录音豆” 录音可在飞书中被AI调用
2026年1月19日,安克创新与飞书联合发布了最新AI硬件——安克AI录音豆,飞书提供了该产品的软件AI适配与服务。这款产品以极轻的"磁吸纽扣”形态实现无感随身佩戴
2026-01-19 17:13:00
+14!省级专精特新梯队扩容
江南时报讯 近日,江苏省工信厅公示了2025年度省级专精特新中小企业(第二批)认定和通过复核企业名单,苏州市相城区黄桥街道共有14家企业上榜
2026-01-19 17:25:00
2026年潍坊市家电国补启动,享国补到三联家电
鲁网1月19日讯2026年潍坊市家电及数码产品补贴正式上线,标志着新一轮“国补”政策在潍坊全面落地。1月16日,三联家电41周年店庆活动盛大启幕
2026-01-19 17:28:00
近日青岛大学龙云泽团队研发的自供能眼球追踪系统火了,仅凭眨眼摩擦就能发电,还能99%精准捕捉眼球运动,像普通眼镜一样轻便
2026-01-19 18:06:00
简橙钱米第三届“岁月珍藏,财智生花”线下品牌活动圆满结束
2026年1月11日,广州番禺太平木棉之家,以“岁月珍藏,财智生花”为主题的第三届简橙「理」想人生线下品牌活动温馨落幕
2026-01-19 17:32:00
为夯实业务转型升级根基,切实提升普惠金融服务质效,近日,滦州农商银行举办信贷新模式及信贷产品专题培训会。该行信贷相关条线骨干
2026-01-19 17:02:00
1月18日,由城市头条有限公司主办的融媒体平台“城市头条”宣布其官方移动应用“城市头条APP”已正式在官网及各主要应用商店上线
2026-01-19 16:55:00
肥乡联社始终践行“以客户为中心”的服务理念,聚焦网点服务提质增效,不断创新服务模式、精进服务技能、丰富厅堂服务内涵,将服务触角深度延伸至城乡末梢
2026-01-19 14:55:00
1月18日,2026华杰新品盛典暨AIX大家居智能增长引擎发布会在石家庄举办。本次活动以“格物·开悟”为内核,聚焦面向核心伙伴的 "能力交付",共同探索家居行业的智造升级与增长新
2026-01-19 15:35:00
近日,中国人寿保险股份有限公司(以下简称“中国人寿”,股票代码:601628.SH,2628.HK)凭借在保险主业、社会责任
2026-01-19 15:50:00
当黄仁勋在 CES 展台上宣告物理 AI 的 “ChatGPT 时刻” 已至,屏幕这头的大学生群体瞬间分裂成两派:有人对着能精准缝合的手术机器人畅想未来
2026-01-19 15:59:00