• 我的订阅
  • 头条热搜
国产大模型 DeepSeek-V3 开源:6710 亿参数自研 MoE
...(12 月 26 日)发布博文,宣布上线并同步开源 DeepSeek-V3 模型,用户可以登录官网 chat.deepseek.com,与最新版 V3 模型对话。IT之家援引博文介绍,DeepSeek-V3 是一个 6710 亿参数的专家混合(MoE,使用多个专家网络将问题空间划分为同...……更多
手机市场深陷泥沼,厂商如何破冰?
...题,在这一关键节点,厂商们亟需新的解题思路。3、大模型被认为是下一突破点,但仍没合适的落地方式。自2023年初大模型成为互联网发展技术趋势的关键词,手机厂商关于大模型的探讨就一直没有停止。从逻辑上讲,手机厂...……更多
最高优惠75%!DeepSeek推错峰优惠,下调API夜间空闲时段价格
国产大模型DeepSeek宣布API调用价格大幅下调。2月26日,DeepSeek API开放平台宣布,即日起,北京时间每日00:30至08:30的夜间空闲时段,DeepSeek开放平台推出错峰优惠活动。在此期间,API调用价格大幅下调:DeepSeek-V3降至原价的50%,Deep...……更多
oppo首个端侧应用70亿参数大模型findx7系列
...的首个听筒/免提双模卫星通话,首个端侧应用70亿参数大模型,首次亮相的潮汐架构等诸多前沿技术。此次宣布的全新技术组合将全面落地下一代旗舰产品FindX7系列,为2024年旗舰手机树立全新的技术标杆,并为消费者带来刷新...……更多
浪潮信息推出as13000g7-n系列
...步伐,于近日推出分布式全闪存储AS13000G7-N系列,专为大模型优化而设,为数据存储带来革命性的突破。该系列依托浪潮信息自研分布式文件系统,搭载新一代数据加速引擎DataTurbo,通过盘控协同、GPU直访存储、全局一致性缓存...……更多
替代NVIDIA,摩尔线程&无问芯穹联手首次实现国产GPU端到端AI大模型实训
...出大招,联合宣布正式完成MT-infini-3B 3B(30亿参数)规模大模型的实训,而使用的平台就是摩尔线程国产全功能GPU MTT S4000组成的千卡集群,以及无问芯穹的AIStudio PaaS平台。这次实训充分验证了夸娥千卡智算集群在大模型训练场景下...……更多
骁龙8至尊版混合架构、成本揭秘:更贵是不可避免的!
...NPU的性能和AI的运用,比如NPU可以在后台灵活调度大语言模型的推理。这正是Hexagon NPU架构设计的初衷,其不仅性能卓越,而且能效显著提升,对比上代每瓦性能提升了多达45%。同时,新的架构可以针对广泛的应用场景,提供相...……更多
大模型降价背后,国产大模型的竞争逻辑变了
配图来自Canva可画随着人工智能技术的快速发展,大模型以其强大的数字处理能力和深度学习能力,不断与各领域交叉融合,逐步成为产业创新的关键抓手,和驱动新质生产力的关键引擎。据国家最新公布的数据显示,截至今年...……更多
双模卫星通话、70亿参数大模型......OPPO提前发布了一大波Find X7系列新技术
...统性介绍了相关的新特性。首先登场的当然是AI,当前大模型的相关应用已经是行业最热门的概念,这次的Find X7系列自然也不甘落后。OPPO宣布,将在 Find X7 系列上实现行业首个端侧应用的70亿参数的模型。为了能够将这套大模型...……更多
AI时代CPU不老!Intel五代至强五大革新:340亿参数小意思
...历史中,ChatGPT绝对是浓墨重彩的一笔。正是它引爆了AI大模型概念,也让以往高高在上的AI飞入了寻常百姓家,开始融入每个人的日常工作、生活,AI PC、AI手机、AI边缘也都在大踏步前进,变革千行百业。有调研数据显示,预计...……更多
深度求索公司研发的DeepSeek大模型最近“出圈”,其实,国内学术界和产业界使用这个系列的大模型已有一段时间。解放日报·上观新闻记者今天采访时了解到,上海交通大学计算机科学与工程系教授赵海去年已弃用GPT-4,改用De...……更多
3天把Llama训成Mamba,性能不降,推理更快!
...尔、普林斯顿等机构的研究人员成功将Llama提炼成了Mamba模型,并且设计了新的推测解码算法,加速了模型的推理。先来看一张其乐融融的图片(一眼AI):右边的小羊驼代表Llama,而左边的蛇(Mamba)也是我们的老熟人了。至于...……更多
腾讯推出 Hunyuan-Large 开源大模型
IT之家11月5日消息,腾讯今日宣布推出Hunyuan-Large大模型,官方表示这是目前业界已经开源的基于Transformer的最大MoE模型,拥有3890亿总参数(389B)和520亿激活参数(52B)。腾讯今日在HuggingFace开源了Hunyuan-A52B-Pretrain、Hun……更多
提质降价,国产大模型加速奔跑
...302款生成式人工智能服务完成备案——提质降价,国产大模型加速奔跑本报记者 王俊岭《人民日报海外版》(2025年02月05日第 11 版)日前,在福建省福州市鼓楼区安泰街道南门兜地铁站里举行的2025年就业援助月专项活动中,工...……更多
大模型新趋势之MoE:现状、挑战及研究方向
2024年,全球主流企业加快推出MoE大模型,1-5月发布千亿以上大模型均采用MoE优化架构,且数量超过近三年总和。MoE大模型架构凭借平衡大模型训推成本和计算效率等优势,更适合处理大规模数据和复杂任务,已成谷歌、OpenAI、...……更多
北大林宙辰团队全新混合序列建模架构MixCon:性能远超Mamba
...领域中,序列建模是一项至关重要的任务。然而,现有的模型在捕捉长程依赖关系和高效建模序列方面仍面临诸多挑战。因此,北京大学林宙辰、徐鑫提出了一种全新混合序列建模架构 ——MixCon,它为解决这些难题带来了创新...……更多
几百家企业接入DeepSeek 别急 后面只会更多
...R1 ;还是同一天,魅族Flyme AIOS 团队也已完成 DeepSeek-R1 大模型接入。。。手机厂商们打得热火朝天,隔壁车圈也同样没闲着。2 月 6 日,吉利汽车宣布自己的大模型和 DeepSeek 完成了深度融合。接着第二天,岚图、极氪也宣布了。...……更多
英特尔第五代至强可扩展处理器发布:AI推理性能提升42%!
...。 此外,第五代至强还能够支持运行200亿参数的大语言模型(LLM)。随着GPT-4、Meta的Llama 2和Stable Diffusion等大语言模型的兴起,英特尔也在推动其至强处理器对于相对较小规模的大模型的支持能力,对于这类工作负载,内存带...……更多
零一万物Yi-1.5来了,国产开源大模型排行榜再次刷新
...机器之心编辑部在 OpenAI 发布会的前一天,来自中国的大模型公司零一万物,让开源大模型社区活跃了起来:Yi 大模型家族新成员「Yi-1.5」模型正式开源。在项目主页可以看到,Yi-1.5 包括一系列预训练和微调模型,分为 6B、9B、3...……更多
大模型厂商急寻PlanB:英伟达改良版芯片已调试 华为等国产算力供应不足
...无相关回应。仍可以在国内销售的AMD MI 210则被认为在大模型微调阶段具有相当竞争力。“最近算力涨价太多,我们确实感到很吃力。”一家大模型创业公司人士告诉《IT时报》记者,他们迫切希望有Plan B方案。最好的Plan B当然是...……更多
...智能手机的听筒/免提双模卫星通话,端侧应用70亿参数大模型,以及潮汐架构等创新技术。据了解,此次公布的全新技术组合将全面应用于下一代旗舰产品Find X7系列。实现听筒/免提双模卫星通话近年来,我国卫星通信产业在政...……更多
阿里Qwen3登顶全球最强开源模型,用8款模型夺回中国AI话语权
出品 | 搜狐科技作者 | 梁昌均编辑 | 杨锦一口气开源8款模型,阿里通义又上新!4月29日一大早,阿里开源发布Qwen3,包括两款MoE(混合专家架构)模型,其中具备2350亿参数规模的Qwen3-235B-A22B,在对比测试中成为目前最强大的开...……更多
...)的方法,并通过一系列技术策略,最大程度地优化了大模型推理系统,实现了惊人的性能和效率。具体而言,在更大的吞吐的方面,大规模跨节点专家并行能够使得batch size(批尺寸)大大增加,从而提高GPU矩阵乘法的效率,...……更多
兑现承诺:周鸿祎抽奖送车活动首批送出20辆小鹏汽车 月底再送20辆车
...DeepSeek-R1联网满血版(671B参数)和DeepSeek-R1高速专线(32B参数)模型,与官方版本的DeepSeek相比,纳米AI搜索在可更加稳定、顺畅使用DeepSeek-R1联网满血版模型的同时,也支持语音搜索、拍照问答,以及一句话生成图片和一张图生成视频...……更多
本文转自:广州日报大模型价格战愈演愈烈科大讯飞、腾讯:跟!新闻跟踪广州日报讯(全媒体记者 张露、文静)继阿里、百度之后,昨日又有大模型厂商加入“价格战”。5月22日,科大讯飞宣布,讯飞星火API能力正式免费开...……更多
大模型“免费”送,厂商们图什么?
2024年618,传统电商行业不再喧嚣,但大模型市场却开启了惨烈的“价格战”,甚至部分企业直接免费送大模型服务。5月15日,字节跳动宣布,豆包主力模型企业市场定价为0.0008元/千Tokens,0.8厘可处理1500多个汉字,比行业便宜99...……更多
优刻得首个「国产千卡智算集群」落地,支持智源千亿大模型训练
...算集群规模,才能一路突破围追堵截,进一步促进国产大模型产业生态繁荣。作为中立、安全的云计算服务厂商,优刻得持续发力人工智能智算领域,与国内主流AI芯片厂商深度合作,共同搭建的「国产千卡智算集群」现已上线...……更多
AI视频新战场:字节对决快手、反击Sora
...节跳动以性价比策略切入市场,掀起价格竞争,但高性能模型仍保持付费门槛。B端市场对豆包视频大模型的接纳度有待观察,其商业变现与用户场景适配性成为主要考验。@科技新知 原创作者丨萧维 编辑丨蕨影一场由Sora引发的A...……更多
被认可的大模型价格战
...源大会开幕。我们在离杨植麟最近的地方,见证了一次大模型的“追星”现场。当天,杨植麟和百川智能CEO王小川、智谱AI CEO张鹏、面壁智能CEO李大海进行了一场尖峰对话。这是内行爱听的门道。两个场景,是中国AI市场由表及...……更多
重磅!TeleAI 完成首个全国产化万卡万参大模型训练
...功完成国内首个基于全国产化万卡集群训练的万亿参数大模型(万卡万参),并正式对外开源首个基于全国产化万卡集群和国产深度学习框架训练的千亿参数大模型——星辰语义大模型 TeleChat2-115B。这是由中国电信集团 CTO、首...……更多
更多关于科技的资讯:
中新经纬10月23日电 题:“山姆们”为何加速布局下沉市场?作者 江瀚 盘古智库高级研究员近日,以盒马、山姆为代表的新零售企业加速向全国下沉市场布局
2025-10-23 14:10:00
让残片活成文明的密码:专访90后文物活化创业者苗毅斐
2025 年上半年,文物拍卖市场迎来全面复苏,头部拍卖行交出亮眼成绩单,佳士得亚洲春季拍卖斩获 22 亿港元,苏富比亚洲中国艺术品专场亦录得 7
2025-10-23 14:18:00
西瓜学员科创赛事创佳绩,勇夺全球发明大会公益主题奖
2025 年 7 月 26 日至 28 日,全球发明大会中国区(ICC)全国总决赛在河南郑州国际会展中心落下帷幕。作为教育部严格筛选出的 “白名单” 竞赛
2025-10-23 14:18:00
深夜的福州南站,本应是灯火渐暗、人潮散去的时刻。然而在10月20日凌晨,这里却灯火通明、人声鼎沸——中国铁路南昌局集团有限公司首次推出的“歌迷专列”正整装待发
2025-10-23 15:29:00
万达电影亮相版博会,授权+原创双管齐下诠释“版权正当潮”
2025年10月16日,第十届中国国际版权博览会在青岛国际会展中心(崂山馆)正式开幕,万达电影作为参展商亮相北京展区。万达电影以“版权正当潮”为题
2025-10-23 16:08:00
拼多多给员工发黄金,10年老员工直接领100克金子? 网友:还得是真金白银实在!
2025年是拼多多成立10周年,日前,有拼多多员工在社交平台上晒出了拼多多给员工赠送的“周年礼”。据拼多多员工晒出的“周年礼”
2025-10-23 17:15:00
鲁网10月23日讯(记者 于胜涛)如今走进青岛市即墨区第二人民医院,会发现曾经缴费窗口排起的长队变短了,窗口前的焦灼面容也减少了
2025-10-23 17:19:00
泉韵风雅 尊享折叠 心系天下三星W26品鉴会落地济南
鲁网10月23日讯泉城济南,历史与潮流交相辉映;匠心之作,传承与创新共谱新章,10月23日,心系天下三星W26品鉴会于济南举行
2025-10-23 17:21:00
泉城雅集品匠心,心系天下三星W26品鉴会济南举办
10月23日,历史文化名城济南迎来一场科技与美学交融的盛宴——心系天下三星W26品鉴会。作为三星电子与中国电信携手打造的第18代超高端旗舰
2025-10-23 17:48:00
据统计,我国家电保有量已超 30 亿台,大量老旧热水器存在能耗高(超期服役机型能耗比新品高 50% 以上)、安全隐患突出等问题
2025-10-23 17:57:00
海尔发明了三筒洗衣机,也发明了行业新品类
中国家电品牌在海外市场的拓展速度再次刷新了大众的认知。前不久,海尔三筒洗衣机作为首个出口东南亚的中国三筒洗衣机品牌,一亮相直接登陆越南第一大现代连锁渠道
2025-10-23 18:02:00
作为深耕热水器领域 32年的专业品牌,万和始终以 “技术创新驱动用户体验升级” 为核心,依托行业领先的蓝金刚内胆、精准恒温
2025-10-23 18:05:00
2025年前三季度,社会消费品零售总额同比增长4.8%,服务零售额增速更是快于商品零售近3个百分点,消费“压舱石”作用愈发凸显
2025-10-23 18:36:00
贵州火焰山电器:开足马力备战销售旺季 AI新品成市场“硬通货”
多彩贵州网讯 随着秋冬季节来临,黔北大地寒意初显,位于贵州省遵义市播州区的贵州火焰山电器股份有限公司内却是一片火热景象
2025-10-23 18:40:00
冲刺四季度 打好收官战丨湖北铝创铝业:优产品提质效 投产首年产值破3亿
十堰广电讯(全媒体记者 何旭 通讯员 胡新)进入四季度,湖北铝创铝业有限公司以提质增效为核心,通过引进先进设备、优化产品结构
2025-10-23 20:38:00