• 我的订阅
  • 头条热搜
神州鲲泰携智算系列产品亮相2024华为北京政企合作伙伴大会
... 除此之外,本次参展的产品还包括神州鲲泰KunTaiA722智算推理服务器,该产品以鲲鹏+昇腾主板为核心,围绕数据资源、运算能力、核心算法三个维度提供强大的计算能力。凭借强大的智能算力加持,神州鲲泰KunTaiA722智算推理服...……更多
...具调用、代码执行、游戏、数据库操作、知识图谱搜索与推理、操作系统等复杂场景。以代码功能为例,它既可以让代码“小白”也具备技术能力、为女友写一段能呈现爱心图样的代码,也可以成为程序员的帮手,让它帮助生成...……更多
阿里推出全新推理模型:仅1/21参数媲美DeepSeek R1
...况下,用强化学习实现了性能上的跨越。此外,阿里还在推理模型中集成了与Agent相关的能力,使其能够在使用工具的同时进行批判性思考,并根据环境反馈调整推理过程。QwQ-32B 在一系列基准测试中进行了评估,测试了数学推...……更多
文 | 周鑫雨编辑 | 邓咏仪36氪获悉,AI推理部署解决方案厂商“清昴智能”近日完成了数千万元Pre-A+轮融资,启赋资本、达晨财智领投,老股东奇绩创坛跟投。此前,清昴智能已获得某世界500强科技巨头公司的千万元战略投资。...……更多
三个大模型组队挑战o1,实测360多模型协作干掉提示词工程
...横空出世,开启了大模型演化的新范式——Inference law(推理定律)。正如英伟达AI科学家Jim Fan所说,o1的出现标志着大模型研发者开始把集中在训练阶段的投入,开始转移到了推理过程。Jim还引用了机器学习先驱Rich Sutton的经典...……更多
DeepSeek R2没等来,R1“小升级”发布:思考时间更长,效果如何?
...其结合更加智能的门控网络层(Gating Network)以优化高负载推理任务的性能。不过,当时有内部人士向记者坦言,该传言真实度不高。从目前的情况分析,DeepSeek或许将用此次R1版本的升级,取代R2版本的推出。尽管网友评测得出的...……更多
李彦宏:开源模型将会越来越落后 | 最前线
...练效率提升到了原来的5.1倍,周均训练有效率达到98.8%,推理性能提升了105倍,推理的成本降到了原来的1%。其中,推理成本的大幅下降,对于大模型降低应用门槛意义最大。也就是说,客户原来如果一天调用模型1万次,现在同...……更多
开年“王炸”!智能体再升级,科大讯飞打造办公新范式
...独立API,让智能体能够无缝接入更多应用,让价值创新无边界。2025年,随着智能体的全面爆发,个人和企业的工作方式将会发生彻底改变。在这场生产力变革浪潮中,科大讯飞深知应用落地是关键,同时也离不开大模型底座的...……更多
Claude 3.5深夜觉醒,学会模仿人类用电脑!编程干翻o1,Agent一夜变天
...、输入文本,还能查找代码错误、自动搜集信息填表。AI推理已至瓶颈,下一个爆破点,就是AI操作电脑!Claude 3.5深夜迎来重磅升级!不出所料,Anthropic AI这周终于有了大动作——首发Claude 3.5 Haiku,全新升级版Claude 3.5 Sonnet也来...……更多
亚马逊云科技,如何用AI再赢一次
...个难题。算力成本贵。大模型的主要算力成本分成训练、推理两部分。随着AI应用数量增多,算力资源消耗也在加大,算力成本也随之攀升。采购一枚AI训练芯片起步价是1万美元。企业进行模型训练、微调、推理时还要反复试错...……更多
蚂蚁井贤栋:通过专业智能体的深度连接,AI会像互联网一样带来服务的代际升级
...型的“专业教材〞,供大模型训练学习,也能让大模型在推理中随时“翻阅”。这些“专业教材〞,是蚂蚁提升大模型的领域专业性、打造专业智能体的核心能力。以医疗行业为例,蚂蚁即将发布的“百灵医疗领域大模型”,背...……更多
...大模型产业正在经历从“百模大战”的预训练竞赛向云端推理服务效能优化的战略迁移,工程化作为大模型技术实现产业化的必要手段,在训练和推理阶段分别侧重软件工程和应用工程,需实现“硬件、软件、模型、应用+专业...……更多
...工程实验室的技术成果转化,智谱AI构建了覆盖预训练、推理、多模态及智能体的完整大模型矩阵。2025年4月,智谱AI发布新一代开源模型GLM-4-32B-0414系列,其中推理模型GLM-Z1-Air-0414的推理速度高达200 Tokens/秒(实测),成本仅为...……更多
openai发布多语言大规模多任务语言理解
...语言。其结构旨在评估模型在不同研究领域中需要常识、推理、解决问题和理解能力的任务中的表现。MMMLU的创建反映了OpenAI对测量模型实际能力的关注,尤其是在NLP研究中代表性不足的语言,纳入多种语言可确保模型在使用英...……更多
...在缺乏参考的情况下,成功复现媲美 OpenAI o1 模型的深度推理能力,而且应用程序接口(API)价格仅为后者的 1/30;此前DeepSeek V3 模型通过模型架构和基础软硬件的深度集成优化,实现与 GPT-4o 相当模型能力的同时,单次训练成本...……更多
华为推出三款DeepSeek一体机:含满血Ultra版
...专为科研与高端企业服务设计,支持千亿参数模型高性能推理,满足金融分析、药物研发等高算力需求;蒸馏Pro版:面向企业知识库问答、智能内容创作场景,支持模型微调与推理双引擎,快速定制营销文案生成、客服助手等应...……更多
Meta发布开源大模型Llama 4:首次采用“混合专家”架构
...ma 4的推出将让AI智能体变得更强大,使其具备更高水平的推理和行动能力。据知情人士透露,Llama 3已经推出一年了,而Llama4之所以迟迟未能发布,是因为在开发过程中,该模型在技术基准上没有达到Meta的预期,尤其是在推理和...……更多
AMD CEO苏姿丰:我们和英伟达观点不同 AI领域不存在“一刀切”
...日播出的节目中。AMD董事长兼CEO苏姿丰接受专访,围绕着推理与训练、DeepSeek的出圈以及AI基础设施的建设进行了探讨。在被主持人问道:是什么关键的技术和市场信号,促使AMD做出投入加倍“推理”这一决定时。苏姿丰回答道...……更多
专家模型不要专家并行!微软开源MoE新路径
...好,所以要在左上角: GRIN作为MoE架构,总参数量约42B,推理时激活的参数为6.6B,打同级别(7B)的非MoE模型是手拿把攥,甚至比14B的Phi-3还要略胜一筹。在上面的这份成绩单中,GRIN MoE表现优异,尤其是在编码和数学测试中。...……更多
每月141元的ChatGPT Plus订阅重新开放,背后发生了什么?
...」图/ X(Twitter) 但算力依然受限,核心是大模型训练、推理都严重依赖于英伟达高端 GPU,而英伟达又受限于台积电先进芯片制造工艺、封装工艺以及韩国 HBM 内存的产能。说到底,还是算力不够用,「供给」赶不上「需求」。...……更多
...部主任王芳指出。 因此有必要重估当前智能驾驶系统的边界,并在这一过程中厘清驾驶员、车企和监管者的责任。对行业来说,每次对安全问题的避重就轻,可能都会透支整个行业的未来。而对驾驶员而言,必须充分认识到智...……更多
微软发布旗下最小语言模型phi-2
...写电子邮件和故事,以及总结文本。在常识、语言理解和推理的基准测试中,该模型在某些领域能够跟上多达100亿个参数的模型。微软现在更新发布的Phi-2拥有27亿参数,规模虽然比此前版本翻番,但相比较其它主流语言模型,...……更多
戴尔以技术创新推动AI基础架构升级
...应用背后离不开底层基础设施的支持。以大模型的训练和推理为例,大模型的参数量已经从数十亿增加到几百亿、几万亿甚至更高,更大的模型带来了更大的AI算力需求。有数据显示,AI所消耗的算力平均每3至4个月就会增长一倍,而...……更多
大模型将为内容创作带来哪些变革?腾讯云、快手科技带来最新进展
...“基于多年在大模型领域的积累,腾讯混元大模型的训练推理平台Angel获得了中国电子学会2023年度科学技术奖一等奖。这一基础架构保障了混元能够高效完成模型训练、迭代升级,到应用环节又可以保障推理成本可控。”腾讯云...……更多
智联招聘官宣接入DeepSeek:推出AI招聘助手“Ailin”
...体而言,算力需求持续向上的趋势预计不会改变,特别是推理算力和端侧算力有望迎来更为迅猛的增长。此外,随着DeepSeek大模型与国产AI芯片适配度的不断提升,这将有力推动国产AI芯片在大模型训练与推理领域的应用,加速国...……更多
文档处理效能飙升!浩鲸科技“文档大模型”核心技术揭秘!
...,可帮助企业实现文档的知识抽取、知识融合,直至知识推理和问答的全流程覆盖,为企业知识资产的沉淀、高效管理与利用提供了有效通路。 鲸智文档大模型的实践逻辑浩鲸科技成立于 2003 年,立足于电信行业,智慧触角已...……更多
打脸“AI灭绝伦”!研究反驳:大模型涌现能力不会威胁人类生存
...两个任务主要依赖形式语言能力或信息检索,而非复杂的推理能力。由此可以得出,在没有上下文学习的条件下,GPT 模型的涌现能力受到了极大的限制。然而,涌现能力的来源仅仅如此吗?研究团队又将目光转向了指令微调模...……更多
...良性生态。应建立行业级AI应用标准体系,明确技术应用边界与伦理准则。其次需破解“最后一公里”的人才瓶颈。在技术演进层面,则需突破“场景碎片化”的掣肘。“未来,AI+将向‘价值网络’形态进化。深圳已出现‘AI服...……更多
以假乱真,天工音乐大模型带来颠覆式AI体验
...伴,我们将持续迭代、优化、拓宽「天工SkyMusic」的能力边界,让模型具备更强的多模态情感理解与表达能力,为用户带来更优质的AI音乐体验。最后,我们将很快给出「天工SkyMusic」音乐创作Prompt指南,并提供更多的AI音乐Demo与...……更多
开源版OpenAI再出「神作」,小模型吊打Llama 3!Ministral系列问世,边缘AI革命开启
...持高达128k上下文(目前在vLLM上为32k)。在知识、常识、推理、函数调用、效率等方面,为低于10B参数模型设立了新标杆。而且,Ministral 8B还有配备了滑动窗口注意机制(sliding-window attention),以实现更快和内存高效的推理。不...……更多
更多关于科技的资讯:
中国网12月16日讯 据网信中国微信公众号消息,党的二十届四中全会明确坚持扩大内需这个战略基点,强调要大力提振消费,要以新需求引领新供给
2025-12-16 16:06:00
近日,瑞众人寿唐山中支围绕客服节“拾光美好·瑞意相伴”核心主题,开展了2025年客服节健康生活系列活动。通过线上线下融合
2025-12-16 16:04:00
【宅男财经|专家面对面】人工智能全面融入人类的生活,还有多久能够实现?工业和信息化部电子科技委主任王江平12月16日接受宅男财经采访时表示
2025-12-16 16:52:00
《科学智能生态报告》于腾冲科学家论坛发布——我国科学智能生态培育取得6项进展
12月5日至8日,由云南省人民政府和中国科学技术协会共同主办的2025腾冲科学家论坛在腾冲举行。论坛期间上海财经大学数字经济研究院与新华网融媒体未来研究院在“未来之问”可持续发展
2025-12-16 15:20:00
6.5折、每日5张!第九届雪博会优惠力度拉满了
12月18日至22日,第九届吉林冰雪产业国际博览会将在长春东北亚国际博览中心盛大启幕,以“购物最低享6.5折+1亿元冰雪消费券+企业特惠”等多重福利组合拳
2025-12-16 16:06:00
借势“疯狂动物城”热潮,叮当快药携手百多邦开启家庭健康新“城”事
伴随动画电影《疯狂动物城2》11月26日起全球热映,叮当健康旗下专业送药平台叮当快药与皮肤健康专业品牌百多邦,开展了一场覆盖线上线下的深度跨界合作
2025-12-16 14:03:00
从濒临倒闭到业绩暴增!“沸点计划”成功模型引爆区域代理签约潮
“沸点计划”上海合生汇店以一组硬核数据印证了其商业模型的爆发力:单日营业额最高突破6万元,平均翻台率稳定在5轮,远超行业平均水平
2025-12-16 14:04:00
中国消费者报南宁讯(杨霞 记者顾艳伟)知识产权纠纷曾是不少“出海”企业面临的难题。12月12日,记者从广西壮族自治区桂林市市场监管局了解到
2025-12-16 11:07:00
河北沧州:一张操作指南卡破解企业信息填报难题
中国消费者报石家庄讯(谭鑫 记者李建)记者近日从河北省沧州市标准化所获悉,今年以来,该所紧扣行风建设,以“群众易懂、流程畅通
2025-12-16 11:07:00
江苏省消保委调查货运平台发现:价格不透明、信息掺水、服务保障差等乱象突出
中国消费者报报道(记者薛晶晶)随着网络货运市场规模持续扩容,相关平台已成为货主发货、司机找活的核心渠道,但其背后的乱象也让消费者苦不堪言
2025-12-16 11:07:00
中国消费者报报道(记者李燕京)12月8日,《疯狂动物城2》在中国内地的票房突破30亿元。数据显示,截至11月30日,2025年度国产片票房已达403
2025-12-16 11:07:00
中国消费者报报道(记者桑雪骐)中央经济工作会议12月10日至11日在北京举行。在部署明年重点任务时,会议提到了“优化‘两新’政策实施”
2025-12-16 11:07:00
海尔集团与歌尔集团达成战略合作,新时达将助力歌尔深化智能制造领域布局
12月11日,海尔集团与歌尔集团正式签署战略合作协议,双方将聚焦智能家电、工业互联网、新能源及人工智能等领域展开深度合作
2025-12-16 11:33:00
于琛刚刚过去的这个“双十二”,除了各电商平台推出的促销活动,抖音出台严打“假揭黑真带货”等违规行为的多项举措,也成为人们热议的话题
2025-12-16 11:02:00
近日,全国首家“现代骑手学院”正式揭牌,该学院设在广州职业技术大学,为在职外卖骑手和快递员提供学历和技能“双提升”通道
2025-12-16 08:07:00