• 我的订阅
  • 科技

国产大模型 DeepSeek-V3 开源:6710 亿参数自研 MoE

类别:科技 发布时间:2024-12-27 09:20:00 来源:IT之家

IT之家 12 月 27 日消息,“深度求索”官方公众号昨日(12 月 26 日)发布博文,宣布上线并同步开源 DeepSeek-V3 模型,用户可以登录官网 chat.deepseek.com,与最新版 V3 模型对话。

IT之家援引博文介绍,DeepSeek-V3 是一个 6710 亿参数的专家混合(MoE,使用多个专家网络将问题空间划分为同质区域)模型,激活参数 370 亿,在 14.8 万亿 token 上进行了预训练。

多项评测成绩超越 Qwen2.5-72B 和 Llama-3.1-405B 等开源模型,性能比肩 GPT-4o 和 Claude-3.5-Sonnet 等世界顶尖闭源模型。

国产大模型 DeepSeek-V3 开源:6710 亿参数自研 MoE

国产大模型 DeepSeek-V3 开源:6710 亿参数自研 MoE

该模型在知识、长文本、代码、数学和中文等方面均取得显著进步,尤其在算法代码和数学方面表现突出,生成速度提升至 60 TPS,相比 V2.5 提升了 3 倍。

官方开源了原生 FP8 权重,并提供 BF16 转换脚本,方便社区适配和应用。SGLang、LMDeploy、TensorRT-LLM 和 MindIE 已支持 V3 模型推理。

DeepSeek-V3 更新上线的同时,DeepSeek 还调整了 API 服务价格,模型 API 服务定价也将调整为每百万输入 tokens 0.5 元(缓存命中)/ 2 元(缓存未命中),每百万输出 tokens 8 元。

国产大模型 DeepSeek-V3 开源:6710 亿参数自研 MoE

国产大模型 DeepSeek-V3 开源:6710 亿参数自研 MoE

官方还决定为全新模型设置长达 45 天的优惠价格体验期:即日起至 2025 年 2 月 8 日,DeepSeek-V3 的 API 服务价格仍然会是大家熟悉的每百万输入 tokens 0.1 元(缓存命中)/ 1 元(缓存未命中),每百万输出 tokens 2 元,已经注册的老用户和在此期间内注册的新用户均可享受以上优惠价格。

国产大模型 DeepSeek-V3 开源:6710 亿参数自研 MoE

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-12-27 12:45:02

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

手机市场深陷泥沼,厂商如何破冰?
...题,在这一关键节点,厂商们亟需新的解题思路。3、大模型被认为是下一突破点,但仍没合适的落地方式。自2023年初大模型成为互联网发展技术趋势的关键词,手机厂商关于大模型的探讨就
2024-01-09 10:18:00
最高优惠75%!DeepSeek推错峰优惠,下调API夜间空闲时段价格
国产大模型DeepSeek宣布API调用价格大幅下调。2月26日,DeepSeek API开放平台宣布,即日起,北京时间每日00:30至08:30的夜间空闲时段
2025-02-26 22:46:00
oppo首个端侧应用70亿参数大模型findx7系列
...的首个听筒/免提双模卫星通话,首个端侧应用70亿参数大模型,首次亮相的潮汐架构等诸多前沿技术。此次宣布的全新技术组合将全面落地下一代旗舰产品FindX7系列,为2024年旗舰
2023-12-28 10:13:00
缓存内存储存?一文剖析AIGC对配置数据的需求
...脑自然也是有一定的配置需求的。对于在AIGC的世界中,模型训练和运行通常需要依赖大量的计算资源和内存。其中CPU与内存之间的信息交换速率、CPU的缓存大小、内存的容量和带宽等
2023-06-17 00:18:00
浪潮信息推出as13000g7-n系列
...步伐,于近日推出分布式全闪存储AS13000G7-N系列,专为大模型优化而设,为数据存储带来革命性的突破。该系列依托浪潮信息自研分布式文件系统
2024-06-16 10:27:00
骁龙8至尊版混合架构、成本揭秘:更贵是不可避免的!
...NPU的性能和AI的运用,比如NPU可以在后台灵活调度大语言模型的推理。这正是Hexagon NPU架构设计的初衷
2024-10-25 00:57:00
替代NVIDIA,摩尔线程&无问芯穹联手首次实现国产GPU端到端AI大模型实训
...出大招,联合宣布正式完成MT-infini-3B 3B(30亿参数)规模大模型的实训,而使用的平台就是摩尔线程国产全功能GPU MTT S4000组成的千卡集群
2024-05-27 15:11:00
大模型降价背后,国产大模型的竞争逻辑变了
配图来自Canva可画随着人工智能技术的快速发展,大模型以其强大的数字处理能力和深度学习能力,不断与各领域交叉融合,逐步成为产业创新的关键抓手,和驱动新质生产力的关键引擎。据国家
2024-05-29 09:29:00
双模卫星通话、70亿参数大模型......OPPO提前发布了一大波Find X7系列新技术
...统性介绍了相关的新特性。首先登场的当然是AI,当前大模型的相关应用已经是行业最热门的概念,这次的Find X7系列自然也不甘落后
2023-12-28 10:20:00
更多关于科技的资讯:
谢书莹 柳州工学院电力行业作为现代社会的重要支柱,承担着提供稳定电力的关键任务。随着技术的进步和发展,电厂的电气自动化控制设备在提高电力生产效率
2026-03-11 06:58:00
马天宇 河北公安警察职业学院摘要:分布式数据共享面临多方互信与协同治理的核心挑战,传统中心化模式难以满足跨域协作对数据真实性与权责清晰的要求
2026-03-11 06:58:00
3月8日,全国政协委员、中国传媒大学党委书记廖祥忠表示,去年,中国传媒大学一口气砍掉翻译、摄影等16个本科专业和方向。如此大刀阔斧的专业调整
2026-03-11 07:52:00
刘简宁 阜新市特种设备监督检验所电梯是现代建筑必不可少的垂直交通工具之一,电梯的安全与否直接影响人民群众生命财产安全。但也有不少人对电梯年检工作的意义认识不足
2026-03-11 06:58:00
AI时代,“养小龙虾”就能创业成功?
有人研究怎么把企业做大,有人研究怎么把企业做快,这个人却一头扎进历史堆里,研究一件事:为什么有些企业能活很久,有些却中途消失
2026-03-10 20:17:00
当前AI技术正在深入影响内容创作行业,对于AI编曲现象,全国政协委员王黎光表示,AI虽然能代替创作过程但不能代替人工。AI编曲是以大模型的储备量和收集量为基础的
2026-03-10 20:39:00
在银行业竞争日趋激烈、利差收窄的宏观环境下,镇江农商银行坚持以精细化管理为抓手,通过实施“熵减工程”“蜂巢工程”和结构调优三大举措
2026-03-10 22:41:00
中新经纬3月10日电 小红书“薯管家”官方账号发布公告称,近期,平台发现部分用户采用AI托管模式运营账号,通过技术手段自动生成内容
2026-03-10 21:19:00
中国网3月10日讯 据“国家互联网应急中心CNCERT”微信公众号消息,近期,OpenClaw(“小龙虾”,曾用名Clawdbot
2026-03-10 20:05:00
春风送千岗,AI助求职:2026年综合专场招聘会暨春风行动就业援助活动圆满结束
3月7日上午,“AI聘·才汇来”相城区2026年综合类专场招聘会暨春风行动就业援助活动在相城区人力资源市场成功举办。作为“春风行动”系列活动之一
2026-03-10 17:45:00
国科光锐研发生产基地项目落户黄桥
江南时报讯 3月4日,国科光锐研发生产基地项目签约仪式顺利举行,抢抓高端装备制造产业发展机遇,完善先进制造业发展支撑体系
2026-03-10 17:48:00
“养龙虾”,多地砸钱支持
中新经纬3月10日电 “养龙虾”,这是近日的AI热词,即部署和使用名为OpenClaw‌的开源AI智能体框架,因其图标为一只红色龙虾
2026-03-10 19:10:00
鲁网3月10日讯(记者 张佳伟)3月9日,由中国生物发酵产业协会主办、安琪酵母股份有限公司承办的“2026第十一届发酵培养基应用与发展技术论坛”在济南黄河国际会展中心举行
2026-03-10 17:24:00
两会,就这Young!丨万亿存量市场怎么激活?全国人大代表郭兴田用“两天”作答
编者按:今年全国两会,大河网两位00后记者首次踏上两会征程,以“萌新”视角记录两会,为网友带来全新体验:不背稿、不装样
2026-03-10 14:21:00
让家陪伴成长——金隅天坛家居Mall 3月7日启幕,定义“家生活”新方式
在快速更迭的时代,人们对家的期待已超越功能满足,转而追求情感承载与成长陪伴。正是基于这一洞察,金隅天坛家居Mall提出“我家的长期主义”核心主张——让家能够伴随家庭成长
2026-03-10 14:26:00