• 我的订阅
  • 科技

被认为国产AI之光的DeepSeek V3出糗:居然自称是ChatGPT

类别:科技 发布时间:2024-12-30 00:40:00 来源:浅语科技

要说这两天大模型圈的顶流话题,那绝对是非DeepSeek V3莫属了。

不过在网友们纷纷测试之际,有个bug也成了热议的焦点——

只是少了一个问号,DeepSeek V3竟然称自己是ChatGPT。

被认为国产AI之光的DeepSeek V3出糗:居然自称是ChatGPT

甚至让它讲个笑话,生成的结果也是跟ChatGPT一样:

被认为国产AI之光的DeepSeek V3出糗:居然自称是ChatGPT

加之DeepSeek V3这次爆火的一个亮点,就是训练只花了557.6万美元的成本。

于是乎,有人就开始怀疑了:它不会是在ChatGPT的输出基础上训练的吧?

好巧不巧,Altman也发了一个状态,似乎在暗讽着什么……

被认为国产AI之光的DeepSeek V3出糗:居然自称是ChatGPT

不过DeepSeek V3并非是第一个出现“报错家门”的大模型。

例如Gemini就曾说过自己是百度的文心一言……

被认为国产AI之光的DeepSeek V3出糗:居然自称是ChatGPT

那么这到底是怎么一回事?为什么DeepSeek V3报错家门?

首先需要强调的一点是,从目前网友们整体讨论的观点来看,说DeepSeek V3是在ChatGPT输出上训练的可能性不大。

被认为国产AI之光的DeepSeek V3出糗:居然自称是ChatGPT

之所以这么说,正如网友Riley Goodside所总结的那样——因为ChatGPT的影子无处不在。

即便DeepSeek V3故意用ChatGPT的输出做了训练,但这并不重要。

所有在ChatGPT之后出现的大模型,几乎都见过它。

例如ShareGPT,一个并不新鲜的ChatGPT对话数据集,许多人已经尝试在它和其它ChatGPT数据源上进行调整。但即便如此,也没能出现DeepSeek V3级别的大模型。

被认为国产AI之光的DeepSeek V3出糗:居然自称是ChatGPT

紧接着,Riley Goodside又拿出了DeepSeek V3报告中的一些证据:

而且要是用了ChatGPT数据的话,有些关于DeepSeek V3质量的问题是解释不通的。

例如Pile测试(基础模型压缩Pile的效果),DeepSeek V3得分几乎与Llama 3.1 405B相当,这跟它接没接触ChatGPT数据无关。

而且报告称95%的GPU-hours用于预训练基础模型,即便是跟ChatGPT数据有关,那这部分也会在post-training阶段发生(后5%)。

被认为国产AI之光的DeepSeek V3出糗:居然自称是ChatGPT

而比起用没用ChatGPT数据,或许我们应当更加关注的是为什么大模型会频繁出现“报错家门”的问题。

TechCrunch针对这个问题给出了一句犀利的点评:

因为AI公司们获取数据的地方——网络,正在充斥着AI垃圾。

毕竟欧盟的一份报告曾预测,到2026年,90%的在线内容可能是AI生成的。

这种“AI污染”就会让“训练数据彻底过滤AI的输出”变得困难。

被认为国产AI之光的DeepSeek V3出糗:居然自称是ChatGPT

AI Now Institute的首席科学家Heidy Khlaaf则表示:

尽管存在风险,开发者依然被从现有AI模型中“蒸馏”知识所带来的成本节约所吸引。

意外地在ChatGPT或GPT-4输出上进行训练的模型,也不一定会展示出让人想起OpenAI定制消息的输出。

那么现在对于网友们热议的问题,量子位进行了一波实测,DeepSeek V3目前还没有解决这个bug。

依旧是少了个问号,回答结果会不一样:

被认为国产AI之光的DeepSeek V3出糗:居然自称是ChatGPT

DeepSeek V3更多玩法

不过有一说一,绝大部分网友对于DeepSeek V3的能力是给予了大大的肯定。

从各路AI大佬们集体直呼“优雅”中就能印证这一点。

而就在这两天,网友们陆续晒出了更多DeepSeek V3加持的实用玩法。

例如有网友拿DeepSeek V3和Claude Sonnet 3.5一决高下,在Scroll Hub中分别用它俩创建网站。

博主在测试之后,认为DeepSeek V3完全胜出!

还有网友分享了用DeepSeek V3在AI视频编辑器中的体验。

他表示以后不用再在FFMPEG命令上浪费时间了,DeepSeek V3不仅免费,还能改变你的工作流程。

AI编程神器Cursor也能跟DeepSeek V3结合,来看一个做贪吃蛇的案例。

嗯,DeepSeek V3是有点好用在身上的。

One More Thing

对于此前公布的53页论文,也有网友关注到了一个非技术性的细节——

贡献列表中,不仅展示了技术人员,还有数据注释和商务等工作人员:

被认为国产AI之光的DeepSeek V3出糗:居然自称是ChatGPT

网友认为这种做法非常符合DeepSeek的调性:

被认为国产AI之光的DeepSeek V3出糗:居然自称是ChatGPT

参考链接:

[1]https://techcrunch.com/2024/12/27/why-deepseeks-new-ai-model-thinks-its-chatgpt/

[2]https://x.com/victormustar/status/1872647314231398524

[3]https://x.com/breckyunits/status/1872422078592516295

[4]https://x.com/op7418/status/1872689338242482203

[5]https://x.com/goodside/status/1872911457857208596

[6]https://x.com/kevinsxu/status/1873146905846530472

责任编辑:上方文Q

文章内容举报

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-12-30 08:45:05

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

斯坦福AI团队抄袭国产大模型?连识别“清华简”都抄了!清华系团队发文回应
...入MiniCPM-V的代码,然后改名成Llama3-V。最绝的是Llama3-V连国产AI模型的“胎记”都抄走了,跟MiniCPM-V一样能识别清华战国竹简“清华简”
2024-06-04 14:35:00
AI圈开年首炸:139位中国清北名校天才 创立一家震撼硅谷的企业
...体报道,DeepSeek作为开年AI领域的重大突破,以其“国产之光”的新形象震撼了海内外科技界。这家AI创业企业以其独特的团队构成和卓越的技术成就,成为了业界关注的焦点。从公
2025-01-12 14:52:00
真正的国产显卡之光!摩尔线程国产GPU、AI与元宇宙多项进展深入解读
...动新算法模型、计算系统和平台的开发。六、结语:国产之光 未来可期摩尔线程诞生之初,其实很多人并不太看好,毕竟在当前的大环境和行业态势下,在NVIDIA这样的国际巨头几乎垄断的
2023-06-05 03:00:00
互联网十年:构建人与算法的关系,AIGC技术浪潮迎来新突破
...不起来的情况。” 事实上,仅从此次乌镇峰会的互联网之光博览会现场来看,不论是互联网巨头、三大运营商,抑或是数据服务类上市公司、初创企业,都纷纷推出自己的大模型。显然,尽管算
2023-11-12 20:49:00
混沌初开:国产大模型在沸腾中“求索”
...形式出现。AI新机会:通用大模型or应用层垂直模型摆在国产大模型入局者的机会和选择有两个:通用大模型与应用层垂直模型。大厂更具有开发通用大模型的野心和能力。当前模式主要是以通
2023-05-31 16:00:00
重磅!TeleAI 完成首个全国产化万卡万参大模型训练
...国电信人工智能研究院(TeleAI)成功完成国内首个基于全国产化万卡集群训练的万亿参数大模型(万卡万参),并正式对外开源首个基于全国产化万卡集群和国产深度学习框架训练的千亿参
2024-09-30 09:50:00
华为Mate 60Pro 究竟意味着什么?
...多数人的关注点不仅仅在于手机本身,更是中国的“国货之光”面对以外国为首的商业遏制绞杀,能否冲出重围、浴火重生的关注。而这一切的答案,还是在手机里。“直击内心”的不寻常评测我们
2023-09-13 14:27:00
全国已有14个国家超算中心,何为超算互联网建设的关键?
...超级计算长沙中心总工程师唐卓。今年6月,浙江“乌镇之光”超算中心正式纳入国家超算中心序列,成为全国第14个国家超算中心。“我们国家现在正在紧锣密鼓地建设超算互联网。”8月24
2023-08-28 16:47:00
提质降价,国产大模型加速奔跑
...日,共302款生成式人工智能服务完成备案——提质降价,国产大模型加速奔跑本报记者 王俊岭《人民日报海外版》(2025年02月05日第 11 版)日前,在福建省福州市鼓楼区安泰
2025-02-05 03:48:00
更多关于科技的资讯:
《视野》杂志启动AI协作创作大赛
中国青年报客户端讯(中青报·中青网记者 马富春)2月13日,《视野》杂志“人类文明备忘录”AI协作创作大赛正式启动。活动以直播+实时互动形式展开
2026-02-14 20:52:00
新春走基层丨76秒,一套汽车零部件焊接就能下线
见习记者 朱荣琛2月12日,农历腊月廿五。春节临近,廊坊经开区道路两旁挂上了大红灯笼,沿街企业的大门已贴上了大对联。热热闹闹的年味儿在这个城市的大街小巷悄然弥漫
2026-02-14 22:12:00
针对春节期间服务需求,中国银行隆尧支行近日聚焦自助服务渠道,启动了专项保障工作。针对县域网点分布广、运维半径长的特点,隆尧支行依托历史运行数据
2026-02-14 22:17:00
领航新质生产力——2025浙江省科学企业家这个专题,是省科协和潮新闻联合举办的,已陆续推出了近二十位具有科技创新精神的浙商企业家
2026-02-14 22:34:00
深圳地铁陪你「返屋企」,跨场景互动刷新通勤与春运体验
近日,深圳地铁迎来了新春限定数字人,结合AI原创音乐与互动体验,走到了春运最前沿。这是深圳地铁数字IP首次以完整的互动形态沉浸式接入城市公共空间
2026-02-14 20:26:00
2月14日消息,2026年“新春招聘月”系列活动将于2月24日(正月初八)在五一广场太原人才大市场(迎泽区零工示范站)正式启幕
2026-02-14 17:37:00
星火空间完成数千万天使+轮融资 核心产品“进化一号”发动机完成首次试车
大皖新闻讯 此前关于合肥要造火箭的消息引发外界广泛关注,背后则是合肥星火空间科技有限公司(以下简称“星火空间”)落户合肥新站高新区
2026-02-14 18:45:00
国医大师李佃贵为2026雄安国际医疗大健康技术应用大赛发声推介。他表示,当下是中西医并重、传统智慧与现代科技深度融合的时代,中医核心思想与大健康领域发展目标高度契合,期待中医药领
2026-02-14 19:13:00
中国科大取得重要突破 首次实现量子李雅普诺夫指数的精确提取
大皖新闻讯 ”这一结果意义重大,为观测混沌的量子世界提供了全新视角。”相关人员如此评价说。2月14日,大皖新闻记者从中国科学技术大学获悉
2026-02-14 17:35:00
鲁网2月14日讯为提升居民网络使用体验,助力智慧社区建设,近日,山东移动临沂分公司装维团队深入多个社区,开展 “移动装维进社区”专项服务活动
2026-02-14 15:10:00
山东移动临沂分公司:智慧装维服务升级,开启家庭网络新体验
鲁网2月14日讯“您好,我是中国移动装维工程师张师傅,现在上门为您检测网络,这是我的工作证件。”周六上午9点,临沂北城新区书香苑小区的王女士刚结束早间会议
2026-02-14 15:11:00
字节跳动发布豆包大模型2.0,主打真实世界复杂任务执行力
在连续发布Seedance 2.0视频模型、Seedream 5.0 Lite图像模型之后,2月14日,字节跳动宣布推出豆包大模型2
2026-02-14 15:35:00
从米兰冬奥会看全球消费趋势:为何“由你”成了2026年的新叙事?
过去十年,全球化品牌的策略多为“We are the best”,强调品牌的权威感。但现在的趋势是“Its your turn”
2026-02-14 16:20:00
千问大免单再加3天,邀请全国人民体验AI买电影票,激活春节AI新消费
2月14日,千问突然宣布免单再加3天,接入大麦、飞猪,邀请全国人民体验AI买电影票、门票等新功能,激活春节AI新消费。从今天下午3点到大年初一
2026-02-14 16:36:00
依据河北省消费者权益保护委员会联合北京阳光消费大数据研究院于2025年8月发布的智能坐便器比较试验结果,九牧送检样品(型号ZD9640-SA-CJM000
2026-02-14 15:10:00