• 我的订阅
  • 科技

被认为国产AI之光的DeepSeek V3出糗:居然自称是ChatGPT

类别:科技 发布时间:2024-12-30 00:40:00 来源:浅语科技

要说这两天大模型圈的顶流话题,那绝对是非DeepSeek V3莫属了。

不过在网友们纷纷测试之际,有个bug也成了热议的焦点——

只是少了一个问号,DeepSeek V3竟然称自己是ChatGPT。

被认为国产AI之光的DeepSeek V3出糗:居然自称是ChatGPT

甚至让它讲个笑话,生成的结果也是跟ChatGPT一样:

被认为国产AI之光的DeepSeek V3出糗:居然自称是ChatGPT

加之DeepSeek V3这次爆火的一个亮点,就是训练只花了557.6万美元的成本。

于是乎,有人就开始怀疑了:它不会是在ChatGPT的输出基础上训练的吧?

好巧不巧,Altman也发了一个状态,似乎在暗讽着什么……

被认为国产AI之光的DeepSeek V3出糗:居然自称是ChatGPT

不过DeepSeek V3并非是第一个出现“报错家门”的大模型。

例如Gemini就曾说过自己是百度的文心一言……

被认为国产AI之光的DeepSeek V3出糗:居然自称是ChatGPT

那么这到底是怎么一回事?为什么DeepSeek V3报错家门?

首先需要强调的一点是,从目前网友们整体讨论的观点来看,说DeepSeek V3是在ChatGPT输出上训练的可能性不大。

被认为国产AI之光的DeepSeek V3出糗:居然自称是ChatGPT

之所以这么说,正如网友Riley Goodside所总结的那样——因为ChatGPT的影子无处不在。

即便DeepSeek V3故意用ChatGPT的输出做了训练,但这并不重要。

所有在ChatGPT之后出现的大模型,几乎都见过它。

例如ShareGPT,一个并不新鲜的ChatGPT对话数据集,许多人已经尝试在它和其它ChatGPT数据源上进行调整。但即便如此,也没能出现DeepSeek V3级别的大模型。

被认为国产AI之光的DeepSeek V3出糗:居然自称是ChatGPT

紧接着,Riley Goodside又拿出了DeepSeek V3报告中的一些证据:

而且要是用了ChatGPT数据的话,有些关于DeepSeek V3质量的问题是解释不通的。

例如Pile测试(基础模型压缩Pile的效果),DeepSeek V3得分几乎与Llama 3.1 405B相当,这跟它接没接触ChatGPT数据无关。

而且报告称95%的GPU-hours用于预训练基础模型,即便是跟ChatGPT数据有关,那这部分也会在post-training阶段发生(后5%)。

被认为国产AI之光的DeepSeek V3出糗:居然自称是ChatGPT

而比起用没用ChatGPT数据,或许我们应当更加关注的是为什么大模型会频繁出现“报错家门”的问题。

TechCrunch针对这个问题给出了一句犀利的点评:

因为AI公司们获取数据的地方——网络,正在充斥着AI垃圾。

毕竟欧盟的一份报告曾预测,到2026年,90%的在线内容可能是AI生成的。

这种“AI污染”就会让“训练数据彻底过滤AI的输出”变得困难。

被认为国产AI之光的DeepSeek V3出糗:居然自称是ChatGPT

AI Now Institute的首席科学家Heidy Khlaaf则表示:

尽管存在风险,开发者依然被从现有AI模型中“蒸馏”知识所带来的成本节约所吸引。

意外地在ChatGPT或GPT-4输出上进行训练的模型,也不一定会展示出让人想起OpenAI定制消息的输出。

那么现在对于网友们热议的问题,量子位进行了一波实测,DeepSeek V3目前还没有解决这个bug。

依旧是少了个问号,回答结果会不一样:

被认为国产AI之光的DeepSeek V3出糗:居然自称是ChatGPT

DeepSeek V3更多玩法

不过有一说一,绝大部分网友对于DeepSeek V3的能力是给予了大大的肯定。

从各路AI大佬们集体直呼“优雅”中就能印证这一点。

而就在这两天,网友们陆续晒出了更多DeepSeek V3加持的实用玩法。

例如有网友拿DeepSeek V3和Claude Sonnet 3.5一决高下,在Scroll Hub中分别用它俩创建网站。

博主在测试之后,认为DeepSeek V3完全胜出!

还有网友分享了用DeepSeek V3在AI视频编辑器中的体验。

他表示以后不用再在FFMPEG命令上浪费时间了,DeepSeek V3不仅免费,还能改变你的工作流程。

AI编程神器Cursor也能跟DeepSeek V3结合,来看一个做贪吃蛇的案例。

嗯,DeepSeek V3是有点好用在身上的。

One More Thing

对于此前公布的53页论文,也有网友关注到了一个非技术性的细节——

贡献列表中,不仅展示了技术人员,还有数据注释和商务等工作人员:

被认为国产AI之光的DeepSeek V3出糗:居然自称是ChatGPT

网友认为这种做法非常符合DeepSeek的调性:

被认为国产AI之光的DeepSeek V3出糗:居然自称是ChatGPT

参考链接:

[1]https://techcrunch.com/2024/12/27/why-deepseeks-new-ai-model-thinks-its-chatgpt/

[2]https://x.com/victormustar/status/1872647314231398524

[3]https://x.com/breckyunits/status/1872422078592516295

[4]https://x.com/op7418/status/1872689338242482203

[5]https://x.com/goodside/status/1872911457857208596

[6]https://x.com/kevinsxu/status/1873146905846530472

责任编辑:上方文Q

文章内容举报

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-12-30 08:45:05

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

真正的国产显卡之光!摩尔线程国产GPU、AI与元宇宙多项进展深入解读
...动新算法模型、计算系统和平台的开发。六、结语:国产之光 未来可期摩尔线程诞生之初,其实很多人并不太看好,毕竟在当前的大环境和行业态势下,在NVIDIA这样的国际巨头几乎垄断的
2023-06-05 03:00:00
斯坦福AI团队抄袭国产大模型?连识别“清华简”都抄了!清华系团队发文回应
...入MiniCPM-V的代码,然后改名成Llama3-V。最绝的是Llama3-V连国产AI模型的“胎记”都抄走了,跟MiniCPM-V一样能识别清华战国竹简“清华简”
2024-06-04 14:35:00
互联网十年:构建人与算法的关系,AIGC技术浪潮迎来新突破
...不起来的情况。” 事实上,仅从此次乌镇峰会的互联网之光博览会现场来看,不论是互联网巨头、三大运营商,抑或是数据服务类上市公司、初创企业,都纷纷推出自己的大模型。显然,尽管算
2023-11-12 20:49:00
混沌初开:国产大模型在沸腾中“求索”
...形式出现。AI新机会:通用大模型or应用层垂直模型摆在国产大模型入局者的机会和选择有两个:通用大模型与应用层垂直模型。大厂更具有开发通用大模型的野心和能力。当前模式主要是以通
2023-05-31 16:00:00
重磅!TeleAI 完成首个全国产化万卡万参大模型训练
...国电信人工智能研究院(TeleAI)成功完成国内首个基于全国产化万卡集群训练的万亿参数大模型(万卡万参),并正式对外开源首个基于全国产化万卡集群和国产深度学习框架训练的千亿参
2024-09-30 09:50:00
全国已有14个国家超算中心,何为超算互联网建设的关键?
...超级计算长沙中心总工程师唐卓。今年6月,浙江“乌镇之光”超算中心正式纳入国家超算中心序列,成为全国第14个国家超算中心。“我们国家现在正在紧锣密鼓地建设超算互联网。”8月24
2023-08-28 16:47:00
华为Mate 60Pro 究竟意味着什么?
...多数人的关注点不仅仅在于手机本身,更是中国的“国货之光”面对以外国为首的商业遏制绞杀,能否冲出重围、浴火重生的关注。而这一切的答案,还是在手机里。“直击内心”的不寻常评测我们
2023-09-13 14:27:00
国产AI大模型“曹植”发布
...布。据了解,达观数据“曹植”大模型,作为垂直专用的国产大语言模型,具有长文本、垂直化和多语言的特点。通过并联多种模型和知识图谱,曹植大模型支持多种语言长文本的自动化写作和多语
2023-07-07 23:27:00
从狂热到理性:大模型训练三堵墙,一场少数人的游戏 | 钛媒体深度
...以满足企业所需训练资源。达观数据将在7月份正式推出国产版GPT“曹植”系统,也是得益于多年文本智能技术积累和垂直领域场景业务经验,算法和数据层面有所储备,而在测试阶段的算力层
2023-06-29 12:00:00
更多关于科技的资讯: