• 我的订阅
  • 科技

DeepSeek的一次小更新 堪比发布新模型

类别:科技 发布时间:2025-03-26 07:33:00 来源:浅语科技

一个好消息,时隔俩月, DeepSeek 终于更新了。

就在昨天晚上, DeepSeek 一声不吭往 Hugging Face 上扔了个 DeepSeek -V3-0324 模型。

模型参数 6850 亿,跟上一个版本的 V3 ( 6710 亿 )相差不大,采用 MoE 架构,还支持了更开放的 MIT 开源协议。

根据官方更新的版本说明, DeepSeek -V3-0324 主要是针对推理能力和前端开发能力进行了加强,写作风格实现了跟 R1 对齐,另外还有一些其他方面的小优化。

DeepSeek的一次小更新 堪比发布新模型

现在打开 DeepSeek 官网,把深度思考模式关掉就能直接用上 V3-0324 。

不过有一说一,虽然 V3-0324 仅仅只是 V3 的小版本升级,并不是大伙儿期待已久的 V4 或者 R2 ,且官方账号也没有发布任何跟模型有关的信息。

但也丝毫不妨碍, V3-0324 一上线,就有人说他的代码能力,直追克劳德。

DeepSeek的一次小更新 堪比发布新模型

新版本的模型刚一上传,就登上了 Hugging Face 的趋势榜单。

在国外大模型竞技场 KCORES 的测评中, V3-0324 的代码能力得分 328.3 ,超过了普通版的 Claude 3.7 Sonnet 的 322.3 分,接近 Claude 3.7 Sonnet 思维链版本的 334.8 分,排名第三。

图源 @karminski 牙医

DeepSeek的一次小更新 堪比发布新模型

重点是,排名在前面的模型压根就没几个开源免费的, V3-0324 可谓是一枝独秀。

所以在 V3-0324 上线不到一天的时间里,就已经有很多老哥迫不及待上手测评了一波。

这么说吧, V3-0324 在这些人手里,已经成了拳打 o3-mini ,脚踢 Claude 3.7 Sonnet 的存在。

经典的小球弹跳测试中,这位老哥把 V3-0324 、 o3-mini 和 R1 拉了个横评。

DeepSeek的一次小更新 堪比发布新模型

o3-mini 刚开始看着还不赖,但估计物理没学好,外面的六边形都转到垂直的位置了,球还不知道往下掉。

R1 的表现,也是有些让人摸不着头脑。。

相对来说, V3-0324 生成的结果是表现最好的,这位老哥丝毫不吝啬对它的夸奖,说它 “ 表现得像唯一排名第一的非推理模型 ” 。

DeepSeek的一次小更新 堪比发布新模型

让 V3-0324 生成一个网页,模型一口气写了 800 多行代码,运行的时候还没有出错,这什么实力不用多说了吧。

DeepSeek的一次小更新 堪比发布新模型

在评论区底下,有人仅仅下达了编写登录页面的简单指令,并没有任何其他的附加提示,同样也生成了一个完整的登录页面。

DeepSeek的一次小更新 堪比发布新模型

还说 V3-0324 在编码上,能跟 Claude 3.7 Sonnet 掰一掰手腕。

更别提其他的模型,性价比各方面相比下来,现在 OpenAI 的 o1-pro 和 GPT-4.5 ,都已经不香了。

DeepSeek的一次小更新 堪比发布新模型

反正看了几个网友的测试案例之后,世超对 V3-0324 的前端代码生成能力,已经有了初步的判断。

但不管咋说,没亲自上过手的东西,咱硬夸也有点心虚。所以这次世超也打算简单试一试,看看 V3-0324 到底有多能打。

一上来,世超就让模型做了一个画板,提示词是 “ 帮我用 HTML 代码构建一个画板,支持鼠标绘制、橡皮擦功能和颜色选择 ” ,这次出战的模型是 V3-0324 和普通版 Claude 3.7 Sonnet 。

只能说,这把 Claude 3.7 Sonnet 赢得很彻底。光是有取色器这一点,就甩了 V3-0324 不知道几个车尾灯。

DeepSeek的一次小更新 堪比发布新模型

更别提 UI 设计了, V3-0324 做出来的画板让世超不是很有创作的欲望。。。

DeepSeek的一次小更新 堪比发布新模型

世超着实是没想到,这盆凉水来得这么快,都让我有点怀疑到底是我的提示词没写好,还是模型有问题了。。。

不过,我后面又继续把小球弹跳的提示词,分别喂给了 DeepSeek-V3-0324 、普通版 Claude 3.7 Sonnet 还有 DeepSeek-V3 。

这下味儿终于对了。V3-0324 生成的结果确实牛叉,能很清楚地看到小球在下落触底的时候,产生了小幅度的弹跳。

DeepSeek的一次小更新 堪比发布新模型

就是吧,老版本的 V3 压根没运行起来。。。只能说两个版本之间的差距高下立判了。

DeepSeek的一次小更新 堪比发布新模型

再来看普通版 Claude 3.7 Sonnet 的结果,优点是底下的转速、重力和摩擦力都是可调节的,弹跳看起来也没什么大问题,但小球有点出画面了。。。

DeepSeek的一次小更新 堪比发布新模型

最后,世超又分别让 V3 和 V3-0324 生成一个 Saas 登录页面,提示词就一句话,没有任何的附加信息。

可以看到, V3 的页面倒是做出来了,但没什么设计可言。

DeepSeek的一次小更新 堪比发布新模型

反观 V3-0324 ,果然就跟官方的版本更新说明一样,生成的网页更美观了。

DeepSeek的一次小更新 堪比发布新模型

综合看下来, V3-0324 的代码能力相比 V3 确实有了比较大的提升,而且在一部分测试案例中,也能够比肩普通版 Claude 3.7 Sonnet 。

但如果要说完全超越 Claude 3.7 Sonnet ,那世超觉着暂时还不太行。

不过大伙儿也别忘了, V3-0324 在开源这个赛道里, V3-0324 已经算得上能打的了。

而且 DeepSeek 的 API 价格业主打的一个便宜。世超对比了 Claude 3.7 Sonnet 和 V3-0324 的 API 价格, V3-0324 百万 tokens 输入的价格是 2 元,百万 tokens 输出的价格是 8 元,而同样的 tokens 数, Claude 3.7 Sonnet 的输入和输出价格分别是 36.6 元和 108.9 元,价差最多有 18 倍。

DeepSeek的一次小更新 堪比发布新模型

所以在某种程度上, V3-0324 这个小更新,的确可以跟 Claude 3.7 Sonnet 媲美。

特别是今天晚上,DeepSeek官方还发文,正式介绍了这波小更新,在数学、代码类的相关评测上,V3-0324比OpenAI目前最厉害的非推理模型GPT-4.5都要更胜一筹。

DeepSeek的一次小更新 堪比发布新模型

去年 12 月底 V3 上线,紧接着 R1 就在过年的时候上桌吃饭了。如果按照 DeepSeek 之前发布模型的节奏,盲猜一波 R2 也快了。

总之,小版本更新的 V3-0324 就已经如此强悍了,就是不知道,在 DeepSeek 猛烈的开源炮弹下, “OpenAI 们 ” 还遭不遭得住了。

责任编辑:随心

文章内容举报

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2025-03-26 08:45:06

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

本周硅谷发生了什么?|OpenAI推出5项更新;微软组建新的AI团队;Googe发布文生视频模型Lumiere
...Qwen-VL,这两个模型在多项图文多模态标准测试中获得了堪比Gemini Ultra和GPT-4V的水准。第四批国产AI大模型备案获批
2024-01-29 09:34:00
4g显存低配畅玩aigc!
...”了!只需要一块4年前的GTX1650(显存4GB),AI出图效果堪比当前最好的开源模型SDXL。△图源:推特@ナビ这是最近在GitHub上连续数日霸榜TOP1的新项目Fooocus
2023-08-26 19:58:00
10倍精度升级!腾讯混元3D模型v2.5版本发布
快科技4月23日消息,据报道,腾讯混元3D模型升级至v2.5版本,建模更精、贴图更真。在3D生成中,几何模型就像物体的“骨骼”——它决定了形状轮廓、结构复杂程度。这次升级,混元3
2025-04-23 15:30:00
Midjourney V6.1再进化!人像逼真细节拉满,摄影级画面秒生成
...展开。人像生成自然也不在话下,五官立体,妆容精致,堪比杂志图。生成人物与街景图自带复古ccd效果,落日余晖打在人脸上清晰真实,没有过度美化的假面感。甚至还能生成定制风格的图片
2024-08-05 09:38:00
90天三次OTA推送,200+功能升级!极越践行“月月开新车”承诺
...来往车辆,以及泊车后自动上锁等,细心程度和安全意识堪比五星级泊车员。V1.4.0版本还升级了一系列行车体验优化,如:新增自动转向灯功能、新增PPA高速高架变道风格设置、转向自
2024-03-26 14:26:00
“乐坛ChatGPT”歌曲生成平台Suno发布v4版本
...oV4带来了名为“Remaster”的新功能,可以提升使用旧版Suno模型创作的曲目质量。此次更新还引入了“ReMi”——一个由AI驱动的歌词助手
2024-11-20 20:44:00
商汤日日新大模型体系更迭升级,金融、医疗等行业场景落地已超20个|WAIC 2023
今年6月拍摄的商汤大模型产品商量SenseChat界面(来源:钛媒体App编辑拍摄)时隔仅3个月,商汤“日日新”AI大模型正式更新
2023-07-11 13:00:00
OpenAI史诗级更新!最强大模型炸场,128K上下文、价格暴降2/3
...ei)自ChatGPT爆火全球以来,我国企业纷纷推出对标GPT的大模型,而OpenAI近一年来也没闲着,智东西听会后总结发现
2023-11-07 17:45:00
英特尔更新arc图形解决方案directml优化
...色的传统优化技术,但大部分的提升要归功于微软的Olive模型优化工具。官方表示,英特尔一直与微软保持合作,针对各种类型的Arc图形解决方案优化DirectML
2023-11-20 11:52:00
更多关于科技的资讯:
新闻纵深·聚焦2025中国国际数字经济博览会|人工智能赋能产业升级“下半场”
阅读提示数字浪潮,奔涌而至。10月17日至19日,2025中国国际数字经济博览会在石家庄举办。这场综合性数字经济大会,不仅搭建起国际数字经济交流合作的高端平台
2025-10-20 07:35:00
聚焦2025中国国际数字经济博览会|数字“加料”,生活可以这么“潮”
10月17日,观众和下棋机器人对弈。河北日报记者 史晟全摄数字让生活更美好。2025中国国际数字经济博览会上,众多数智技术闪亮登场
2025-10-20 07:37:00
河北日报讯(记者宋平)10月19日,2025京津冀AI赋能教育新生态大会在石家庄举办。来自政府、高校、科研机构与企业的与会嘉宾
2025-10-20 07:42:00
青春华章丨制造业“数智化”,“脑力”岗位需求旺
南航双选会上来了237家制造业单位制造业“数智化”,“脑力”岗位需求旺□南京日报/紫金山新闻记者姜静实习生黄佳琪杨久久400多家用人单位中
2025-10-20 07:43:00
2025中国机器人大赛闭幕我省9支队伍获奖河北日报讯(记者苑立立)10月19日,2025中国机器人大赛暨RoboCup机器人世界杯中国赛(中国机器人大赛赛区)在石家庄闭幕
2025-10-20 07:44:00
青春华章丨向“新”而行“模范生”,“智造”南钢获央视关注
转型实践为传统产业转型升级提供优秀范例向“新”而行“模范生”,“智造”南钢获央视关注南报网讯(记者刘安琪通讯员邵启明)“南京钢铁的转型实践为传统产业转型升级提供了优秀范例
2025-10-20 07:44:00
没有冗长的开幕致辞,减少繁琐的办会流程,10月17日至19日举行的2025中国国际数字经济博览会持续改进办会模式,更加务实高效
2025-10-20 07:44:00
聚焦2025中国国际数字经济博览会·记者观察|培育数据生态,构筑数字产业发展新优势
培育数据生态,构筑数字产业发展新优势——二〇二五中国国际数字经济博览会探新之三10月17日,观众在2025中国国际数字经济博览会参观
2025-10-20 07:47:00
聚焦2025中国国际数字经济博览会·现场丨人机协同,赛场上演“机器人总动员”
你见过“机器人总动员”吗?10月18日,记者走进石家庄(正定)国际会展中心6、7号馆,科技感扑面而来。一场场不同类别的机器人赛事激烈角逐
2025-10-19 08:23:00
聚焦2025中国国际数字经济博览会·记者观察|释放数据价值,“乘”出产业转型新动能
释放数据价值,“乘”出产业转型新动能——2025中国国际数字经济博览会探新之二随着新一轮科技革命和产业变革深入发展,数据作为关键生产要素的价值日益凸显
2025-10-19 08:27:00
青春华章丨江苏南京:“宁工品推”,“推”出产业发展新空间
□南京日报/紫金山新闻记者徐宁实习生黄倩通讯员李晓晨陈欣苇俞堃在南京,“政府搭台、企业唱戏、共谋发展”的生动实践持续结出硕果
2025-10-19 09:54:00
二〇二五年广交会设计创新奖出炉在宁企业斩获二金奖一银奖南报网讯(记者黄琳燕)10月18日,2025年广交会设计创新奖(CF奖)颁奖仪式在广交会展馆举行
2025-10-19 09:55:00
产业数字金融发展的创新路径与实践研讨会举办,与会嘉宾建议——找准金融机构数字化转型赋能产业发展路径河北日报讯(记者马彦铭)10月17日
2025-10-19 09:57:00
DCF AI智能商城:智能技术重塑购物新范式
DCF AI智能商城作为一款新兴的电商平台,其核心在于将智能化技术融入购物全程,为用户带来更合规、更真实、更便捷的消费体验
2025-10-19 13:21:00
DCF智能商城商业愿景
DCF智能商城面向农产品场景上线一组功能与体验升级,核心目标很直接:把产地和特点说清楚,把来路和批次摆出来,把配送和售后讲明白
2025-10-19 13:22:00