• 我的订阅
  • 头条热搜
...大模型的超低价格引发行业震动。据悉,豆包主力模型的推理输入价格只有0.0008元/千Tokens,比行业便宜99.3%。对此,谭待坦言,“降价是用技术优化成本来实现的。如果只是补贴,用亏损换收入是不可持续的,火山引擎不会走这...……更多
o1带火的CoT到底行不行?新论文引发了论战
...To CoT or not to CoT?OpenAI ο1 的诞生极大地提升了人们对 LLM 推理能力和思维链(CoT)的兴趣。一时之间,似乎思维链很快就会成为所有 LLM 的标配,但思维链并非万能,就连 OpenAI 自己也提到 o1 在某些任务上的表现并不比 GPT-4o 强...……更多
整合长期记忆,AI实现自我进化,探索大模型这一可能性
...也能让模型在处理长期、分散和个性化的数据时逐步提升推理和学习能力。用 LTM 数据提升模型能力,使其能够自我进化在传统 LLM 中,更新模型通常需要调整所有参数,而如果目的是处理个体数据,那这种操作明显不切实际。...……更多
AI投资时间|绿洲资本张津剑:相比GPT技术本身,创业者更应该关注其对社会的影响
...烈烈的工业革命。也许国内的大模型和OpenAI 还差很远,推理成本还太高,芯片算力有不足,但对于绝大多数AI创业者来说,当前的这一切困难都是只是噪声。当下摩尔定律仍未失效,这些问题可以留给专业人士,18个月后这些成...……更多
清华团队提出大模型“密度定律”;足球领域首个视觉语言基础模型
...交视觉-语言-动作建模框架RevThink:使用逆向思维增强 LLM 推理想要第一时间获取每日最新大模型热门论文? 点击阅读原文,查看「2024必读大模型论文」合集,以及申请加入「大模型技术分享群」。SwiftEdit:50 倍速文本引导图像...……更多
英伟达最新技术分享:手把手教你用Llama 3.1合成数据改进模型!附代码
...05B开源巨兽Llama 3.1最近正式上线,既可用于批处理和在线推理,也可以作为基座模型,进行特定领域的专门预训练或微调。尤其是考虑到Llama 3.1有如此大的参数规模,加上丰富的15.6T token训练数据,非常适合用于数据生成。这篇...……更多
智能体不够聪明怎么办?清华&蚂蚁团队:让它像学徒一样持续学习
...出的巨大潜力,而这种潜力的核心基石正是智能体的复杂推理能力。与当下广受关注的 OpenAI-o1 及其追随者略有不同,大多数实用的 AI Agent 往往需要在特定场景下发挥作用。这种情况类似于普通人类:虽然不是每个人都需要具备...……更多
中国首个音乐SOTA模型「天工音乐大模型」今日公测
...全球最大的开源MoE大模型。「天工3.0」在语义理解、逻辑推理、通用性、泛化性、不确定性知识、学习能力等领域拥有突破性的性能提升,数学/推理/代码/文创能力提升超过30%。 (天工3.0模型参数超越Grok-1,成全球最大开源MoE...……更多
AI产业化拐点前夕,百丽时尚解构「智能化」
...“某款产品为何滞销”的时候,AI可能会针对同样的数据推理出不同方向的解释,却很难穿透业务本质。问题的核心在于,无论是通用类模型还是垂类模型,都缺乏企业自有场景的规则锚点。 这也就意味着,AI的能力上限需要以...……更多
推理性能直逼o1,DeepSeek再次出手,重点:即将开源
...出手了,这次又是重磅炸弹。昨晚,DeepSeek 上线了全新的推理模型 DeepSeek-R1-Lite-Preview,直接冲击 OpenAI o1 保持了两个多月的大模型霸主地位。在美国数学竞赛(AMC)中难度等级最高的 AIME 以及全球顶级编程竞赛(codeforces)等权...……更多
国产大模型真正角逐时刻:从钉钉智能客服开始谈起
...被设定了几个高频关键词,但一旦遇到稍难或者带些逻辑推理的问题时便无计可施。这是横亘在过去企业数字化最普遍同时也是最棘手的问题。一般来说,以往的智能客服的聪明程度往往取决于它背后有多少人工,你标记的关键...……更多
DeepSeek赋能企业研发:DevOps+AI新时代再升级
近日,嘉为蓝鲸DevOps智能小嘉CAgent重磅接入了DeepSeek-R1和DeepSeek-V3模型,全面升级AI服务和辅助能力,借助DeepSeek高效的文本挖掘与信息提取能力、高效的推理和智能推荐系统以及跨模态数据分析能力和高效的深度学习推理加速能...……更多
腾讯开源最大MoE大语言模型!3D大模型同时支持文/图生成,晒混元模型及应用全家桶
...型,MoE模型在相同成本下效果更优,在相同规模下训练/推理成本更低,而且容量大,可训练更多数据。当前MoE的挑战有训练稳定性差、专家负载不均衡等。 一些应对方案包括:1)Scaling Law探索,设计基于中小模型簇的MoE Scaling ...……更多
云计算一哥终于搞多模态了:一口气6个大模型,还有个3nm芯片!
...mazon Nova Premier:亚马逊最强多模态大模型,可处理复杂的推理任务,也可用于蒸馏客户定制化的模型。在现场,Andy也晒出了Amazon Nova在CRAG、BFCL、VisualWebBench和Mind2Web等Benchmarks上取得的分数。从成绩中不难看出,其在检索增强……更多
依托数据、平台、知识增强等优势 夸克大模型降低问答幻觉率
...夸克大模型具备较好的语义理解、知识掌握与应用、逻辑推理能力。在大模型技术落地层面,夸克大模型的能力体现在四个方面,可以帮助用户提升工作、学习效率。知识能力,拥有广泛的知识覆盖、信息搜集和多语言支持等,...……更多
GPT-4o的识图能力有多牛?四大维度深度体验
...,准确率高达100%。图片来源:GPT-4o四、手写指令和逻辑推理最后,记者上了点难度,用手写的逻辑推理题来测试了GPT-4o的识图和逻辑推理能力。GPT-4o的回答堪称完美,不仅准确识别了手写体文字并遵照指示,且答题逻辑完全合...……更多
...数据+知识”混合驱动等技术,并成功引入DeepSeek-R1的深度推理能力,构建起罕见病诊疗的智能基座,使得该模型具备决策逻辑符合临床思维范式、能有效抑制AI幻觉、知识自主迭代三大核心优势。该模型对医患双方而言都有利好...……更多
昆仑万维宣布开源2千亿稀疏大模型Skywork-MoE
...万维宣布开源2千亿稀疏大模型Skywork-MoE,性能强劲,同时推理成本更低。Skywork-MoE基于之前昆仑万维开源的Skywork-13B模型中间checkpoint扩展而来,是首个完整将MoE Upcycling技术应用并落地的开源千亿MoE大模型,也是首个支持用单台409...……更多
OpenAI新功能 “深度研究” 登场,人类终极考试的表现超过DeepSeek R1
...过专门优化,适配网页浏览和数据分析场景。它能够运用推理能力,在互联网上搜索、解读和分析海量的文本、图像和PDF文件,并能根据所遇到的信息灵活调整研究方向。 值得注意的是,在对这个智能体的能力评测中,OpenAI特...……更多
突破时间序列组合推理难题!南加大发布一站式多步推理框架TS-Reasoner
【新智元导读】TS-Reasoner是一个创新的多步推理框架,结合了大型语言模型的上下文学习和推理能力,通过程序化多步推理、模块化设计、自定义模块生成和多领域数据集评估,有效提高了复杂时间序列任务的推理能力和准确性...……更多
MiniMax进化论:一群「偏执者」的破浪前行
...捉关键细节,进而有效减少HBM内存读写量逾70%,让训练与推理效率提升2.5倍。当然,这种将精力放在对的事情上、不断创新的逻辑,不只是NCR的底层技术思路,同时也是对MiniMax企业气质,以及如今地位如何炼成的最好概括。M1创...……更多
Llama3.1根本卖不动!业内人士:开源模型成本反而更高
...闭源的商业模型会配套相应的工具链,包括训练工具链、推理工具链,这些工具链的性能要比开源的好,对于客户来说,训练就能省大概10~20%的硬件成本,推理的时候省得更多,业务规模越大,省得越多。第二层,看模型带来的...……更多
语言≠思维,大模型学不了推理:一篇Nature让AI社区炸锅了
...到,人类大脑生成和解析语言的神经网络并不负责形式化推理,而且提出推理并不需要语言作为媒介。这篇论文声称「语言主要是用于交流的工具,而不是思考的工具,对于任何经过测试的思维形式都不是必需的」,引发了科技...……更多
算子开发到推理加速,一位00后开发者的“升级打怪”之旅
...框架降低了大模型训练的门槛,目前正在做大模型分布式推理加速,希望可以帮助其他开发者在生产环境中高效部署在线推理服务。在昇腾AI的生态里,像郑辉这样为大模型浪潮默默贡献自己力量的开发者不胜枚举。他们还不是...……更多
盈米基金与阿里云达成AI全栈战略合作
...深度融合进入新阶段,一个由AI+数据智能驱动的财富管理新时代正在加速到来。 ……更多
AI推理速度提升超10倍,Groq LPU能否取代英伟达GPU?
...美国人工智能初创公司Groq最新推出的面向云端大模型的推理芯片引发了业内的广泛关注。其最具特色之处在于,采用了全新的Tensor Streaming Architecture (TSA) 架构,以及拥有超高带宽的SRAM,从而使得其对于大模型的推理速度提高了1...……更多
超级推理模型正面对垒:谷歌版o1发布次日,OpenAI o1下一代o3登场
来源:硬AI圣诞节前,人工智能巨头上演了一场精彩的推理模型攻防战。谷歌和OpenAI正面对垒,谷歌刚发布自家的先进推理模型挑战OpenAI的o1,第二天,OpenAI就推出了升级版的最强推理模型o3。美东时间12月20日周五,在为期12个...……更多
超越ChatGPT:人类特有的思维要强化
...据驱动学习机制不可避免存在不可解释、数据依赖和逻辑推理弱等不足。忽略这些不足,可能会给全面认识ChatGPT带来一定的困扰。虚假关联带来隐患尽管ChatGPT可以“写”出人机莫辨的论文、诗歌,但当你尝试问它类似这样的问...……更多
清华团队提出新型光计算架构,光训练速度提升1个数量级
...了大规模智能计算的整个生命周期,开启了智能光计算的新时代。本次研究的完成,让人们看到了包括太极系列光芯片在内的智能光算力船帆的不懈航行,智能光计算平台终以解决 AI 算力所面临的问题为目标,将驶向 AI 算力的...……更多
...数据+知识”混合驱动等技术,并成功引入DeepSeek-R1的深度推理能力,构建起罕见病诊疗的智能基座,使得该模型具备决策逻辑符合临床思维范式、能有效抑制AI幻觉、知识自主迭代三大核心优势。“希望该模型的技术指标跻身国...……更多
更多关于科技的资讯:
巨头入局,珠海面向全球打造中国RISC-V生态之城
日前,一则重磅消息惊动全球半导体产业圈。当地时间12月10日晚,全球半导体巨头高通公司宣布完成对 Ventana Micro Systems的收购
2025-12-14 15:35:00
近日,上城区发布第四批“人工智能+”机会场景清单,25个场景聚焦产业升级、金融服务、智慧教育、智能医疗等重点领域。据悉
2025-12-13 08:06:00
“甩一甩”就能测温的水银体温计,即将在2026年1月1日全面禁产的政策下退出历史舞台。这则消息引发的全网热议,恰是怀旧情感与环保理性
2025-12-13 08:16:00
厦门网讯(厦门日报记者 应洁)昨日,“新质设计——红点产品设计大奖·中国获奖作品精选展”在红点厦门设计博物馆开展,来自70多家中国企业的百余件“红点奖”获奖作品呈现出国际一流设计的“中国力量”
2025-12-13 08:39:00
第六届中国人工智能大赛配套论坛在厦成功举办
厦门网讯(厦门日报记者 翁华鸿 通讯员 张晶晶 王艳红)12日,第六届中国人工智能大赛配套论坛在厦门成功举办。论坛以“融新汇智
2025-12-13 08:39:00
中新经纬12月13日电 据“网信中国”微信号13日消息,2025年12月2日,中央网信办提出并归口的《数据安全技术 电子产品信息清除技术要求》强制性国家标准由国家市场监督管理总局
2025-12-13 10:42:00
中国科大利用磁力系统实现宽带磁声混合频率梳
大皖新闻讯 12月13日,大皖新闻记者从中国科学技术大学获悉,该校郭光灿院士团队在磁力系统研究中取得新进展。该团队董春华教授研究组通过磁振子与高频声子相互作用
2025-12-13 14:35:00
京东宠物百千万爆品计划启动:联合pidan打造确定性产品 单款猫砂月销1500万
猫砂是猫用品购买频率最高的产品,其潜力被外界看好。不过,因行业门槛低,这两年入局者多、竞争加剧,猫砂利润像纸一样薄,最低仅1%
2025-12-13 14:56:00
2025年“福满榕城 奋勇争先”短视频征集展播——《项目审批专班:“五项机制”激活发展新效能》。
2025-12-13 15:03:00
沁珠宝的2025年:文化赋能,匠心质造,新中式珠宝坚定前行
2025年,是新中式珠宝赛道蓬勃发展的一年,也是沁珠宝以文化为帆、品质为桨,实现跨越式发展的关键之年。在刚刚过去的2025年11月
2025-12-13 16:41:00
鲸鸿动能系列营销案例正式入库复旦管院案例中心,开启产学融合新路径
2025年12月10日,由复旦大学管理学院与鲸鸿动能联合举办的“技术驱动的商业创新:从生态支撑到全球竞逐”主题的案例课堂暨鲸鸿动能案例入库仪式
2025-12-13 16:42:00
硬核突破!全球领先脑肿瘤放疗设备将在廊坊临空实现“中国制造、全球交付”
河北新闻网讯(刘英、刘岩)12月6日,百洋医药高端制造产业化基地在临空经济区(廊坊)高端智能制造港正式启用投产,将承担全球领先脑肿瘤精准放疗设备ZAP-X火星舟放射外科机器人的生产供应任务
2025-12-13 17:52:00
开栏语 深圳,一座将创新刻入基因的城市。无数海归人才,正是这基因中最活跃的段落。作为改革开放的窗口与先锋,她以澎湃的活力与无限的机遇
2025-12-14 11:22:00
日前,第七届浙江国际智慧交通产业博览会在杭州盛大开幕。开幕式上,多项重磅政策与创新成果集中亮相,省交通运输厅、省科技厅共同发布《交通科技创新合作协议》
2025-12-14 11:39:00