• 我的订阅
  • 头条热搜
从通用人工智能到科学智能,“AI爱因斯坦”还远吗?
...需要像AlphaGo Zero那样,从围棋本身出发,具备自我学习、推理和创新能力,这样才可以达到通用人工智能。要实现这一目标,一是需要结合快思考的“黑盒”预测和慢思考的“白盒”逻辑推理,打造“灰盒”可信大模型;二是融...……更多
对标OpenAI o1!Kimi发布新一代推理模型:中考高考考研全第一
...的Kimi国产大模型正式发布k0-math。k0-math是Kimi推出的首款推理能力强化模型,采用全新强化学习和思维链推理技术,通过模拟人脑的思考和反思过程,大幅提升解决数学难题的能力。据了解,在多项数学基准能力测试中,k0-math的...……更多
专注于推理的OpenAI“草莓”模型两周内发布?是人工智能下一重大突破
...“秋季发布”(9月至11月)要更早。上述报道称,专注于推理能力的人工智能“草莓”发布前后还有一些亟待解决的问题,但看似“仓促上马”似乎说明OpenAI感受到了大语言模型驱动产品领域的激烈竞争压力,希望通过近几个月...……更多
GPT刚刚公开「草莓」项目:推理能力翻倍,定价200美元?
... OpenAI 在大语言模型领域的新尝试,也可能是对人工智能推理能力一次新的革命性提升。根据目前流出的信息来看,相比以往的 GPT 模型,「草莓」在处理复杂问题、执行多步骤任务方面展现出前所未有的潜力,使其成为通用人...……更多
文心大模型4.0 Turbo来了!百度推出文心快码2.5,已覆盖内部80%程序员
...考虑到大模型和异构多芯发展趋势,为了保障大模型训练推理性能、简化大模型开发调优过程以及更好地适配各种芯片,飞桨与文心联合,在训练、推理两个方面定向优化。▲飞桨框架设计理念具体来说,动静统一的自动并行能...……更多
o1金牌团队揭秘AI超越人类惊人时刻!22分完整版视频全公开
...共有8点:1 强化学习加持的o1,比人类更善于发现新的CoT推理步骤2 自我批评的涌现,是o1最强有力的时刻3 让o1「超时」前完成回答,然后突然有了「啊哈」时刻 4 scaling参数规模的挑战,以及继续沿着强化学习算法进步之路5 许...……更多
商汤科技sensetime推出“云端边”全栈大模型体系
...的指导下,会持续探索大模型能力的KRE三层架构(知识-推理-执行),不断突破大模型能力边界。”“日日新SenseNova5.0”性能超越GPT-4 Turbo:文理双修能力大幅提升,新增多模态交互自去年4月首次发布,商汤“日日新SenseNova”大...……更多
...山326TA国产服务器,实现了昇腾算力与DeepSeek系列模型的推理适配优化。其性能表现卓越,媲美高端GPU,为开发者带来高效、灵活且稳定的AI推理服务。在算法和工程上的优化,使得模型在保持高精度的同时,显著降低了计算负担...……更多
对话王田苗:万亿市场之下,大模型 + 机器人还有四大问题未解决
...务设定多个小模型,并提供不同的参数训练,端到端减少推理成本。另外,将专用小 GPU 芯片置入到机器人中,也可提高任务实时性,目前特斯拉已在自动驾驶中尝试了这种做法。硬氪:今年有哪些细分场景的模型值得关注?王...……更多
国产模型指令跟随全球第一!来自LeCun亲推的最难作弊LLM新榜单
...训练。 故而,Step-2总参数量达到万亿级别,每次训练或推理所激活的参数量也超过了市面上的大部分Dense模型。此外,Step-2的训练过程中,阶跃的系统团队突破了6D并行、极致显存管理、完全自动化运维等关键技术,支撑起了整...……更多
探索终端操作系统领域AI大模型创新趋势 OpenHarmony技术大会OS原生智能分论坛召开
...发展带来了崭新的机遇,有望通过强大的语义理解和常识推理能力大大提升智能个人代理支持功能的广度和深度。”清华大学助理研究员李元春主题分享中软国际有限公司智能物联网军团产品研发管理部总经理、OpenHarmony项目群技...……更多
整合长期记忆,AI实现自我进化,探索大模型这一可能性
...也能让模型在处理长期、分散和个性化的数据时逐步提升推理和学习能力。用 LTM 数据提升模型能力,使其能够自我进化在传统 LLM 中,更新模型通常需要调整所有参数,而如果目的是处理个体数据,那这种操作明显不切实际。...……更多
腾讯Angel获世界互联网大会领先科技奖:让通信成本降低70%
...评腾讯Angel机器学习平台:突破万亿级模型分布式训练和推理以及大规模应用部署等难题。据了解,突破主要在通信、效率、规模三方面实现。通信:从网卡到交换机,再到路由协议,腾讯自研的RDMA网络实现了集群高速互联,单...……更多
手机市场深陷泥沼,厂商如何破冰?
...4位量化技术,实现精度不掉点效果下更优的性能,通过推理引擎的加速,以及芯片硬件加速的方式,更是成为行业首个端侧应用的70亿参数的模型。基于来自端侧的70亿大模型参数,FindX7能够实现比其他手机更快速的大模型响应...……更多
吴泳铭官宣3800亿投入后,阿里云如何打AI这场硬仗?
...发布新的模型,最重要的方向主要是两个,一个是Reasoning推理,一个是Omin全模态融合。”刘伟光提到。在应用方向上,这次大会,阿里云宣布推出AI Agent Store,从生成式AI向代理式AI发展,并表示将首先推动阿里旗下所有服务走...……更多
比GPU性价比高百倍!Cerebras推出新AI推理服务,号称“全球最快”
...28日消息,AI芯片独角兽Cerebras Systems于8月27日宣布推出AI推理服务Cerebras Inference,号称“全球最快”。该服务已经在云端上线。据官网介绍,该推理服务在保证精度的同时,速度比英伟达的服务快20倍;其处理器内存带宽是英伟达...……更多
阿里最新开源推理模型发布:性能比肩DeepSeek-R1
阿里通义发布最新开源推理模型,称其性能比肩DeepSeek-R1。3月6日凌晨,阿里巴巴正式发布最新的开源推理模型通义千问QwQ-32B。据介绍,通过大规模强化学习,千问QwQ-32B在数学、代码及通用能力上实现质的飞跃,整体性能比肩De...……更多
小模型正在成为AI界的新宠
...算法,超越了同等大小和稍大一号的模型,在各种语言、推理、编码和数学基准测试中表现优异。苹果紧随其后,发布了 OpenELM,包含了 2.7 亿、4.5 亿、11 亿和 30 亿四个参数版本。与微软的 Phi-3 一样,OpenELM 也是一款专为终端设...……更多
智慧供热新突破!济南热力集团 × DeepSeek打造更聪明的智慧供热大脑,引领行业变革
...今年以来,深度求索的DeepSeek开源大模型,凭借其卓越的推理能力和创新的技术架构,正在为工业AI领域注入强劲动力。济南热力集团有限公司联合神思电子技术股份有限公司、英集动力科技有限公司,结合济南能源集团本地化...……更多
OpenAI发布最新技术研究,AI“黑盒”不再是难题!
...出了正确回答。大部分大模型都在给出答案的同时呈现了推理过程。智谱清言给出的推理过程显示,在比较13.11%和13.8%时,13.11%是更大的数值。这是因为当比较两个百分数时,我们首先比较整数部分,如果它们相同,则比较小数...……更多
算子开发到推理加速,一位00后开发者的“升级打怪”之旅
...框架降低了大模型训练的门槛,目前正在做大模型分布式推理加速,希望可以帮助其他开发者在生产环境中高效部署在线推理服务。在昇腾AI的生态里,像郑辉这样为大模型浪潮默默贡献自己力量的开发者不胜枚举。他们还不是...……更多
国产算力新突破!科大讯飞攻克MoE高效训练难题,发布星火X1.5
...发布,率先攻克国产算力MoE训练效率难题发布会上,深度推理大模型讯飞星火X1.5正式亮相。星火X1.5采用MoE架构,总参数量293B、激活30B,推理效率相比星火X1提升100%。它的语言理解、文本生成、知识问答、逻辑推理、数学能力、...……更多
大模型是否有推理能力?DeepMind数月前的论文让AI社区吵起来了
...,随着 OpenAI o1 模型的推出,关于大型语言模型是否拥有推理能力的讨论又多了起来。比如苹果在前段时间的一篇论文中指出,只要给模型一些干扰,最聪明的模型也会犯最简单的错误(参见《给小学数学题加句「废话」,OpenAI ...……更多
国产大模型首发中文逻辑推理,「天工大模型4.0」o1版来了
...去,如此自信的原因可能在于最近人们让大模型学会了「推理」的方法。就在 9 月份,OpenAI 正式公开前所未有的复杂推理大模型 o1,这是一个重大突破,新模型既具有通用的能力,也可以解决比此前的科学、代码和数学模型能...……更多
又慢又贵?OpenAI推理模型“草莓”来了,GPT-5还有多远
...9月12日,人工智能(AI)巨头OpenAI发布代号“草莓”的AI推理模型OpenAI o1系列,包括OpenAI o1-preview以及小版本的o1-mini。据OpenAI介绍, o1会花更多时间思考问题,然后再做出反应,就像人一样。通过训练学会了完善自己的思考过程...……更多
阿里巴巴CEO吴泳铭:AI或改变物理世界!先进模型投入门槛将提升至上百亿美金
...、生物等多方面学科接近博士水平。” 成本方面,模型推理成本指数级下降,已经远远超过摩尔定律。据他介绍,一年来,通义千问API在阿里云百炼上的调用价格下降了97%,百万Tokens调用花费最低已经降到了5毛钱。 人工智能技...……更多
字节豆包团队推出稀疏模型架构UltraMem:推理成本可降83%
...将计算和参数解耦,在保证模型效果的同时,有效解决了推理过程中的访存问题,为人工智能领域带来了新的突破。据了解,UltraMem架构巧妙地将计算与参数分离,不仅确保了模型的卓越性能,更针对推理过程中的访存瓶颈提出...……更多
chatgpt低成本复现流程开源
...。相比原生PyTorch,单机训练速度最高可提升7.73倍,单卡推理速度提升1.42倍,仅需一行代码即可调用。对于微调任务,可最多提升单卡的微调模型容量3.7倍,同时保持高速运行,同样仅需一行代码。要知道,ChatGPT火是真的火,...……更多
创新,是从积累到突破的过程
...台、统建系统、数据中台均可调用DeepSeek的v3大模型和r1强推理能力,相关服务正在分批次向全体员工开放。同时,坚持筑牢风险防控屏障,完成安全护栏在DeepSeek应用上的防护,并结合Agent平台,逐步增强复杂任务推理能力。天...……更多
...这个思路,我们开始思考:视觉模型是否也能实现类似的推理能力?”与传统大模型训练的 SFT(Supervised Fine-Tuning)方法不同,R1方法的突破在于其路径创新。SFT依赖海量标注数据进行“填鸭式”教学,而R1方法则通过强化学习,...……更多
更多关于科技的资讯:
浙江日报讯 (记者 翁云骞 通讯员 李芮) 日前,在宁波举办的2025空间计算大会上,全功能空间计算MR专用芯片“极智G-X100”发布
2025-12-05 09:14:00
三明联通将乐分公司:5G 护航“山水将乐·乐动心声”2025 文化惠民盛宴
网络保障团队开展通信服务。东南网12月5日讯(通讯员 肖锦雯)11月28日,“山水将乐·乐动心声”文化惠民活动在将乐县体育馆田径场盛大举行
2025-12-05 09:16:00
摘要:个性化推荐系统中,用户兴趣的动态演化特征对推荐效果有着直接影响。传统静态建模方法难以满足用户实时变化的偏好需求,兴趣演化建模应运而生
2025-12-05 09:26:00
“如果和父母只剩55天,你最想做什么?”面对这道假设题,许多人在调查问卷与访谈中写下了答案。我们根据回收的数据与采访实录
2025-12-05 10:15:00
中国网12月5日讯 据中国消费者协会官方网站消息,“双十二”购物旺季临近,各类促销活动密集,不少消费者早已选好想买的数码产品
2025-12-05 10:24:00
京东工业助力陕建打造供应链数据融合平台 赢得数据要素x大赛全国技术创新奖
近日,2025年“数据要素×”大赛全国总决赛成绩揭晓,京东工业携手陕建物流集团打造的“建筑行业供应链数据融合平台”项目
2025-12-05 10:58:00
据新华社消息 12月4日,在“AI·镜界—南京人工智能生态街区”,一位女士在“AI诊所”进行健康检测。近年来,江苏南京依托中国(南京)软件谷的软件产业基础
2025-12-05 09:41:00
河北日报讯(张晓超、崔虹)近日,第八届中国国际进口博览会在上海举办,河北省39家企业的70余类“燕赵好物”集中亮相,吸引了国内外客商的目光
2025-12-05 07:40:00
当人类基因组的30亿个碱基对如浩瀚星河般铺展,当大脑1000亿个神经元织就复杂网络,这本写满生命奥秘的“天书”,曾让科学家们望“脑”兴叹
2025-12-05 07:42:00
12月3日上午,一票跨境电商网购保税进口商品经杭州海关所属义乌海关审核验放后,从义乌保税物流中心发往购买的消费者手中。值得注意的是
2025-12-04 09:42:00
腾讯游戏魔方工作室迎来十五周年,《暗区突围》手游爆料地图更新
12月3日,腾讯游戏魔方工作室迎来十五周年庆。魔方多款游戏主创来到直播现场爆料,为玩家带来产品最新进度,备受玩家关注的《洛克王国》IP新作《洛克王国
2025-12-04 14:20:00
从日常随拍到户外探索 年轻人用手持设备定格热爱
脚踩陆冲板的年轻人手持全景相机,以第三人称视角“跟拍”运动瞬间;旅行博主捕捉下360°无死角的风景,剪辑时通过手动调整视角制作出炫酷转场
2025-12-04 14:20:00
在具身智能竞速加速升温的当下,真实场景的客观评测成为检验机器人模型能力最关键的一环。近日,“具身进化论”在查询最新发布的RoboChallenge测试结果时注意到
2025-12-04 15:20:00
中国移动AI听障康复智能体落地 为2780万听障人士架起沟通桥梁
12月3日是国际残疾人日。当日早间,央视财经频道《第一时间》重磅报道了中国移动自主研发的全国首个AI听障康复智能体——“中移无障碍”
2025-12-04 15:22:00
防沉迷+护安全,墨宝·AI学生机成未成年人用机优选
在数字化设备快速发展的当今,未成年教育正面临着网络沉迷、电子产品使用导致近视等前所未有的挑战。那么,究竟有没有科学、有效且合理的解决方案呢
2025-12-04 15:23:00