• 我的订阅
  • 科技

国产大模型 DeepSeek-V3 开源:6710 亿参数自研 MoE

类别:科技 发布时间:2024-12-27 09:20:00 来源:IT之家

IT之家 12 月 27 日消息,“深度求索”官方公众号昨日(12 月 26 日)发布博文,宣布上线并同步开源 DeepSeek-V3 模型,用户可以登录官网 chat.deepseek.com,与最新版 V3 模型对话。

IT之家援引博文介绍,DeepSeek-V3 是一个 6710 亿参数的专家混合(MoE,使用多个专家网络将问题空间划分为同质区域)模型,激活参数 370 亿,在 14.8 万亿 token 上进行了预训练。

多项评测成绩超越 Qwen2.5-72B 和 Llama-3.1-405B 等开源模型,性能比肩 GPT-4o 和 Claude-3.5-Sonnet 等世界顶尖闭源模型。

国产大模型 DeepSeek-V3 开源:6710 亿参数自研 MoE

国产大模型 DeepSeek-V3 开源:6710 亿参数自研 MoE

该模型在知识、长文本、代码、数学和中文等方面均取得显著进步,尤其在算法代码和数学方面表现突出,生成速度提升至 60 TPS,相比 V2.5 提升了 3 倍。

官方开源了原生 FP8 权重,并提供 BF16 转换脚本,方便社区适配和应用。SGLang、LMDeploy、TensorRT-LLM 和 MindIE 已支持 V3 模型推理。

DeepSeek-V3 更新上线的同时,DeepSeek 还调整了 API 服务价格,模型 API 服务定价也将调整为每百万输入 tokens 0.5 元(缓存命中)/ 2 元(缓存未命中),每百万输出 tokens 8 元。

国产大模型 DeepSeek-V3 开源:6710 亿参数自研 MoE

国产大模型 DeepSeek-V3 开源:6710 亿参数自研 MoE

官方还决定为全新模型设置长达 45 天的优惠价格体验期:即日起至 2025 年 2 月 8 日,DeepSeek-V3 的 API 服务价格仍然会是大家熟悉的每百万输入 tokens 0.1 元(缓存命中)/ 1 元(缓存未命中),每百万输出 tokens 2 元,已经注册的老用户和在此期间内注册的新用户均可享受以上优惠价格。

国产大模型 DeepSeek-V3 开源:6710 亿参数自研 MoE

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-12-27 12:45:02

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

手机市场深陷泥沼,厂商如何破冰?
...题,在这一关键节点,厂商们亟需新的解题思路。3、大模型被认为是下一突破点,但仍没合适的落地方式。自2023年初大模型成为互联网发展技术趋势的关键词,手机厂商关于大模型的探讨就
2024-01-09 10:18:00
最高优惠75%!DeepSeek推错峰优惠,下调API夜间空闲时段价格
国产大模型DeepSeek宣布API调用价格大幅下调。2月26日,DeepSeek API开放平台宣布,即日起,北京时间每日00:30至08:30的夜间空闲时段
2025-02-26 22:46:00
oppo首个端侧应用70亿参数大模型findx7系列
...的首个听筒/免提双模卫星通话,首个端侧应用70亿参数大模型,首次亮相的潮汐架构等诸多前沿技术。此次宣布的全新技术组合将全面落地下一代旗舰产品FindX7系列,为2024年旗舰
2023-12-28 10:13:00
缓存内存储存?一文剖析AIGC对配置数据的需求
...脑自然也是有一定的配置需求的。对于在AIGC的世界中,模型训练和运行通常需要依赖大量的计算资源和内存。其中CPU与内存之间的信息交换速率、CPU的缓存大小、内存的容量和带宽等
2023-06-17 00:18:00
浪潮信息推出as13000g7-n系列
...步伐,于近日推出分布式全闪存储AS13000G7-N系列,专为大模型优化而设,为数据存储带来革命性的突破。该系列依托浪潮信息自研分布式文件系统
2024-06-16 10:27:00
替代NVIDIA,摩尔线程&无问芯穹联手首次实现国产GPU端到端AI大模型实训
...出大招,联合宣布正式完成MT-infini-3B 3B(30亿参数)规模大模型的实训,而使用的平台就是摩尔线程国产全功能GPU MTT S4000组成的千卡集群
2024-05-27 15:11:00
骁龙8至尊版混合架构、成本揭秘:更贵是不可避免的!
...NPU的性能和AI的运用,比如NPU可以在后台灵活调度大语言模型的推理。这正是Hexagon NPU架构设计的初衷
2024-10-25 00:57:00
大模型降价背后,国产大模型的竞争逻辑变了
配图来自Canva可画随着人工智能技术的快速发展,大模型以其强大的数字处理能力和深度学习能力,不断与各领域交叉融合,逐步成为产业创新的关键抓手,和驱动新质生产力的关键引擎。据国家
2024-05-29 09:29:00
双模卫星通话、70亿参数大模型......OPPO提前发布了一大波Find X7系列新技术
...统性介绍了相关的新特性。首先登场的当然是AI,当前大模型的相关应用已经是行业最热门的概念,这次的Find X7系列自然也不甘落后
2023-12-28 10:20:00
更多关于科技的资讯:
聚焦2025中国国际数字经济博览会·访谈|沈昌祥:发挥优势,不断筑牢人工智能安全底座
发挥优势,不断筑牢人工智能安全底座——访中国工程院院士沈昌祥中国工程院院士沈昌祥。 河北日报记者 李东宇摄2025中国国际数字经济博览会的主题为“可信数据赋能产业发展”
2025-10-18 08:25:00
10月17日,2025中国国际数字经济博览会,一款AI绘画机器人精准识别人脸神态,快速绘画出人脸素描,被这只机械臂画得心服口服。(摄制:苏畅、白中豪、朱泊宇)
2025-10-18 08:27:00
深化开发利用,让高质量数据“动”起来——2025中国国际数字经济博览会探新之一机器人亮绝活、大模型总动员、虚拟空间沉浸体验……10月17日
2025-10-18 08:37:00
厦门网讯(厦门日报记者 薛尧)苹果iPhone17 Air昨日正式开启预售,这款取消实体卡槽、仅支持eSIM(嵌入式虚拟SIM卡)的新机
2025-10-18 08:59:00
近日,建设银行正式启动“‘享趣’玩·惠游中华”信用卡活动,为客户提供涵盖景区票务、特色餐饮、文创消费等多方面的用卡优惠
2025-10-18 10:41:00
海信贾少谦:AI重塑企业管理模式,打法要快,生意要慢
10月17日,第十五届中国管理·全球论坛暨首届“中国企业管理最佳实践榜”发布盛典在青岛举办。作为C50+2025年度轮值企业家召集人
2025-10-18 10:57:00
竹溪县数字经济产业链招商签约超亿元
十堰广电讯(全媒体记者 白孟尧 通讯员 付延峰)竞逐数字经济新赛道,孕育产业链招商硕果。10月18日,湖北十堰竹溪县竹溪数字经济产业链招商暨2025“国芯一号”生态合作伙伴大会在桃花岛夯土小镇举行
2025-10-18 13:47:00
东南网龙岩10月17日讯(通讯员 陈碧霞)近日,工行龙岩漳平支行组织青年志愿者主动深入当地企业园区,精心开展集“个人金融产品精准营销”与“金融反诈知识普及”于一体的“一站式”综合服务活动
2025-10-18 16:32:00
烟台银行荣登2025上半年度高质量数字化转型十大典型案例榜单
近日,由中国信通院主办的以“洞见十五五”为主题的2025数字生态发展大会暨“铸基计划”年中会议在北京盛大召开。会上,烟台银行联合长亮科技申报的《DataOps赋能烟台银行建设高质量智能数据中枢》案例
2025-10-18 17:45:00
视源股份广交会展示AI全场景创新实力,机器人机器人系列产品亮相成焦点
在第138届中国进出口商品交易会(广交会)上,视源股份以“AI+未来教育、AI+企业服务、AI+机器人、AI+生活”为主线
2025-10-18 18:18:00
本土智造重磅升级,医科达将八度亮相进博
第八届中国国际进口博览会(进博会)进入倒计时,作为八年“全勤生”,全球精准放疗先锋医科达将以“共建本土生态,共筑抗癌未来”为主题
2025-10-18 18:42:00
不用等到20号了!现在来京东11.11 iPhone 17 Pro系列可领300元惊喜券
每年11.11对于广大果粉而言无疑是换新的绝佳时机,无论是追求最新款还是预算有限入手上一代机型都能享受到极具吸引力的价格
2025-10-18 18:43:00
破局重构引领前行,联众优车持续锻造二手车服务新基建
近年来,在国内汽车消费结构持续升级的背景下,二手车市场已成为拉动汽车消费的重要引擎。特别是随着国家一系列利好政策的推出
2025-10-18 18:43:00
从龙虎到鹤年堂 京东七鲜十月品牌日再造下一个老字号联名爆款
随着“养生年轻化”与“即食化养生”成为主流,当代消费者愈发青睐“轻松养生、即时进补”。如何让传统养生智慧通过自有品牌融入日常
2025-10-18 18:43:00
全时段畅飞 全年不限次:长龙航空“365畅飞卡”10月19日在京东旅行限时开售
国内随心飞历史新低,全时段畅飞、全年不限次!在推出海航随心飞,并创下2天超25万用户下单、2亿销售额的纪录之后,京东11
2025-10-18 18:45:00