• 我的订阅
  • 头条热搜
李开复:中国大模型与美国顶尖差距从7年缩短至6个月
...战时,李开复表示,在一定程度上,整个大模型行业每年推理成本降低到1/10是可以期待的,而且是必然也应该发生的,通过降低价格让更多的人体验到大模型产品对行业是一件好事。 不过他也提到,相信大部分大模型创业者不...……更多
腾讯钟学丹:人工智能成为汽车行业新质生产力 推动数智化升级
...方式,让大模型的训练效率提升至主流开源框架的2.6倍,推理加速比达到了2倍。在大模型应用方面,腾讯已经和十多家车企围绕研、产、销、服、管理等多场景展开合作。比如,在汽车软件研发环节,大语言模型不仅懂人类语...……更多
三个大模型组队挑战o1,实测360多模型协作干掉提示词工程
...横空出世,开启了大模型演化的新范式——Inference law(推理定律)。正如英伟达AI科学家Jim Fan所说,o1的出现标志着大模型研发者开始把集中在训练阶段的投入,开始转移到了推理过程。Jim还引用了机器学习先驱Rich Sutton的经典...……更多
推动大模型自我进化,北理工推出「流星雨计划」
...我进化的方式,解决代码模型在处理复杂问题时缺少中间推理过程。核心观点:自我进化的力量跟随上述自我进化的思想,在 SRA-MCTS(Self-guided MCTS-based data generation for Reasoning Augmentation)方法中,作者无需借助额外的任何监……更多
DeepSeek/o3的弱点找到了!三心二意 明明对了又改错了
DeepSeek和o1/o3一类推理大模型持续带来震撼之际,有人开始研究他们的弱点了。最新研究揭示:在遇到高难度问题时,推理大模型可能像“三心二意的学生”一样频繁切换解题思路,却因缺乏深入探索而失败——这种现象被研究...……更多
长上下文能力只是吹牛?最强GPT-4o正确率仅55.8%,开源模型不如瞎蒙
...较长的小说了。更重要的是,LLM真的能在这个长度上进行推理吗?近日,有两篇独立研究分别表明:长上下文水分很大!LLM实际上并不能「理解」内容。读小说挑战首先是来自UMass、AI2和普林斯顿的研究人员,推出了一项针对性...……更多
超级干货丨360AI搜索如何准确识别用户意图?
...于算法和硬件上的提升,今年大模型的反应速度提升了,推理成本也降下来了,但仍然没办法在速度、智能、成本三者上达到很好的平衡。所以我们尝试用开放的思路解题,独创了一种专家协作模型技术架构CoE,召集了几乎行业...……更多
智能体首达Kaggle Grandmaster,华为结构化推理补齐思维链短板
...中的表现,研究者们提出了各种提示策略来提升大模型的推理和规划能力,比如思维链、思维树和思维图谱。这些进步与工具集成一起,推动着通用 AI 智能体的发展,让它们现在已经能够用 LLM 输出的决策策略来解决序列决策问...……更多
高文院士:鹏城实验室已训练3个大模型,今年底将拥有两万多块卡
...城实验室主任高文发表演讲,分享了鹏城实验室在打造大模型平台上的进展。他表示,大模型训练首先需要一个平台。“现在要想训练一个大模型,需要有几千块卡,甚至上万块卡。”他介绍到,鹏城实验室在2020年就搭建了这...……更多
阶跃星辰宣布开源图生视频模型,多模态领域的DeepSeek时刻何时来?
...区、芯片、云厂商、产业方等。姜大昕还透露了阶跃星辰推理模型的最新研究进展——Open-Reasoner-Zero,采用了与OpenAI的o系列模型和DeepSeek-R1类似的强化学习算法,训练效率是DeepSeek-R1-Zero的25倍,这一探索的所有的实验结果、代码...……更多
4轮暴训,Llama 7B击败GPT-4!Meta等让LLM「分饰三角」自评自进化
...judge提示模板。除了给出评价结果,meta-judge还需要生成CoT推理过程。为减少meta-judge可能存在的位置偏好(可能倾向于选择最先出现的Judgment A),对同一对数据(jm, jn)会交换顺序让meta-judge进行两次评价,得到单次结果rmn: 引入...……更多
2024北京国际车展|加速智能汽车驶入AGI时代 商汤绝影系列原生态大模型亮相
...向认知驱动的跃迁。依托多模态大模型强大的世界理解、推理能力、决策能力以及交互能力,DriveAGI将是目前最贴近人类思维模式、最能理解人类意图并有最强解决驾驶困难场景能力的技术方案。值得一提的是,前不久上市的小...……更多
机器人训练更高效低成本!英伟达官宣Isaac Sim4.2,性能翻了一倍
...发人员正在采用“three-computer solution”进行训练、模拟和推理,以取得突破。 ▲英伟达为人形机器人开发者提供的“three-computer solution”然而,在训练机器人系统的物理AI过程中,需要大量的训练数据集才能让机器人在部署中实...……更多
OpenAI未来猛料全曝光!奥特曼承认自己最大弱点是产品
...所删改。最后还有11个快问快答彩蛋~ 内容速览o1代表的推理模型这个方向对OpenAI非常重要。 创业公司的主要业务不要对着现有模型打补丁。 难道大家已经忘了几年前的模型表现多糟糕吗?其实才过去没几年。 同样的价值下,...……更多
罗格斯大学团队提出思想链概念,提高大模型的算数推理能力
...概念,提高了大语言模型(LLM,large language models)在复杂推理任务上的性能,例如算术推理、常识推理和符号推理等。图 | 金明宇(来源:金明宇)CoT 的原理是通过提供推理过程的示例,来教会模型处理推理,详细说明导致最...……更多
李开复:已进入“AI教AI”时代,AI通过慢思考具备了反思能力,能自我迭代
...而且目前看起来远没有触及天花板。与此同时,大模型的推理成本在以每年降低10倍的速度快速下降,这为AI-First应用爆发提供了非常重要的条件。”在技术层面,李开复认为,虽然预训练阶段的Scaling Law(缩放法则)的增长趋势...……更多
德国OpenAI加入开源大战!发布欧洲纯血版模型,曾获博世和惠普投资
...(Group Query Attention,GQA)的技术。Aleph Alpha声称这提高了推理速度,且几乎没有牺牲质量。模型还采用了“旋转式位置编码”(Rotary Position Embedding,RoPE)的方法,使模型能够更好地理解句子中单词的相对位置。二、注重模型合...……更多
文心大模型4.0 Turbo来了!百度推出文心快码2.5,已覆盖内部80%程序员
...考虑到大模型和异构多芯发展趋势,为了保障大模型训练推理性能、简化大模型开发调优过程以及更好地适配各种芯片,飞桨与文心联合,在训练、推理两个方面定向优化。▲飞桨框架设计理念具体来说,动静统一的自动并行能...……更多
依托数据、平台、知识增强等优势 夸克大模型降低问答幻觉率
...夸克大模型具备较好的语义理解、知识掌握与应用、逻辑推理能力。在大模型技术落地层面,夸克大模型的能力体现在四个方面,可以帮助用户提升工作、学习效率。知识能力,拥有广泛的知识覆盖、信息搜集和多语言支持等,...……更多
努比亚宣布接入满血版DeepSeek:Z70 Ultra已在内测中
...语言理解和生成能力,在自然语言处理、代码生成、逻辑推理等多个关键领域均表现优异。业内人士指出,DeepSeek的成功,不仅是中国AI技术的一次重大突破,更是全球AI格局重塑的重要标志,真正做到了花小钱办大事。通过更先...……更多
全国首个金融大模型成绩单:服务超2亿用户8大应用场景
...融安全、大数据决策、人机交互、消费者权益保护、逻辑推理泛化等多个关键领域,天镜 2.0 都有着显著的表现。 以金融安全为例,生成式AI的繁荣发展,给这个行业带来不少的挑战,假单据、假人脸、假数据等欺诈手段变得愈...……更多
还在人工炼丹?自动提示工程指南来了,还带从头实现
...状就是 LLM 难以正确应对的领域。对这些模型来说,空间推理和解释抽象视觉描述并不自然,而且它们常常无法完成人类认为相当容易的任务。这里的选择是来自 Big-Bench Hard(BBH)基准的 geometric_shapes 数据集:给定一个完整的 SVG...……更多
山东移动全面接入DeepSeek,加速产业数智升级
...模型训练提供强大的算力支撑,加速模型训练过程,优化推理效率。同时,平台提供大规模数据集处理能力,方便用户在平台提高模型训练数据的丰富性和准确性,让模型训练“既有速度更有精度”。 提供快捷的大模型应用服...……更多
图灵奖得主Yoshua Bengio新作:Were RNNs All We Needed?
...常高效在测试时,循环序列模型会按顺序推出,从而使其推理更为高效。相反,传统 RNN 的瓶颈在于其训练,需要线性训练时间(通过时间反向传播),这导致其最终被淘汰。人们对循环序列模型重新产生兴趣,是因为许多新的...……更多
超擎数智重磅发布擎天、锋锐、元景系列AI服务器,打造人工智能新质生产力强劲引擎
...擎天、锋锐、元景系列AI服务器产品,为大规模数据训练和推理提供强劲性能,帮助AI用户高效构建AI基础设施和应用环境,满足AI场景下的多元算力需求,为AI新质生产力提供强劲引擎。擎天系列L20 AI服务器,4U8卡PCle擎天系列L20 AI服务...……更多
大模型落地之战,百度靠什么突围
....8%,相比文心一言发布时,训练效率提升到当时的5.1倍,推理105倍,推理成本下降至最初的1%。6月,百度还推出了飞桨3.0,此次升级显著提高了飞桨框架与百度 AI 基础设施和文心大模型的兼容性,有望在未来进一步降低模型推...……更多
图结构转文本序列,大模型直接读懂!图推理性能大涨
...和属性,如节点计数、最大度数计算和图式形状分类等图推理任务都能完成。具体如何实现?机器学习工程师Rohan Paul发帖推荐论文并做了个总结。用多种技术开发了图线性化方法:图中心性(PageRank和度)、图退化(k-core分解)...……更多
云鼎科技:基于DeepSeek,打造垂域矿山大模型
...模型的性能水平,从而显著增强自有模型在矿山行业中的推理能力,最终蒸馏出首个基于DeepSeek-R1的垂域矿山大模型。在降低算力消耗的同时,使更小参数的模型获得更加高效、精准的推理能力,应用于山能知识助手中,经测试...……更多
腾讯云升级 AI 全家桶,混元对标 GPT-4o
...相较前代,混元 Turbo 性能大幅提升:训练效率提高 108%,推理效率提升 100%,推理成本降低 50%,目前,混元 Turbo 已在腾讯云上线,提供多个版本供企业和开发者使用。同时,在大会上,腾讯云还发布了 AI infra 品牌「腾讯云智算...……更多
...出了更令人震惊的“彩蛋”——成本利润率高达545%,V3/R1推理系统理论日利润达到346万元人民币。而在市场为这超高“暴利”连连感叹的同时,也更关心这几个问题:如何解读545%这个利润率?是否是对算力的核弹?这对云产业...……更多
更多关于科技的资讯:
摘要:随着生成式人工智能技术在各行业的广泛应用,模型输出结果的不确定性问题日益受到关注。为提高模型在关键领域的可靠性,对输出不确定性进行量化分析成为重要方向
2025-12-04 06:17:00
杭州博士后用AI让机器懂协作、更安全杭州日报讯 让机器从执行命令的“孤岛”,成为懂得协作的群体?让机器人安全走进人类生活
2025-12-04 06:38:00
12月3日从紫林醋业获悉,紫林醋业部分主导产品通过欧盟有机认证(EU Organic Certification),获准使用欧盟统一有机标识“欧洲叶标”(Euro-Leaf)
2025-12-04 07:31:00
中新经纬12月3日电 12月3日,豆包手机助手在官方微信号就“侵犯用户隐私”等问题进行回应,称不存在任何黑客行为。具体来看
2025-12-04 07:42:00
支付宝AI4SDL研发安全体系斩获首届“AI领航杯”星光金奖
12月1日-3日,由中国互联网协会主办的2025“人工智能+”产业生态大会在北京举办。开幕式上,首届“AI领航杯”“人工智能+”应用与技能大赛总决赛举行了隆重的颁奖仪式
2025-12-04 07:47:00
近期,在“智绘星空胜算在天—太空数据中心建设工作推进会”上,北京拟在700—800公里晨昏轨道建设运营超GW(千兆瓦)级集中式大型数据中心系统
2025-12-03 09:42:00
太极韵动武汉,一场独属于银发爱好者的健康之约
承武当余韵,赴江城之约——小糖乐学以“传韵江城汇,小糖太极行”为引,再启太极文化与健康同行之旅。继武当山“问道太极”盛会圆满落幕
2025-12-03 13:40:00
杭州日报讯 产品还没走下生产线,就能在虚拟世界预知它未来十年会不会开裂、变形——这样的场景正在杭州成为现实。日前,工业科技企业浙江远算科技有限公司发布“AI质检数实融合验证平台”
2025-12-03 13:41:00
本报记者 陆春花 为进一步深化江苏与中东地区在“一带一路”倡议下的经贸合作,推动江苏制造高质量“走出去”、精准“引进来”
2025-12-03 13:41:00
曹操出行与越疆合作,人形机器人入驻行业首个“绿色智能通行岛”,推进具身智能在出行、物流领域的规模化应用
12月1日,曹操出行与越疆科技正式签署战略合作协议。双方将围绕Robotaxi(自动驾驶出租车)运营场景,共同探索机器人技术在车辆清洁
2025-12-03 13:41:00
江苏“领航工厂”引领“智造”变革
从“智慧车间”到“工业大脑”,“江苏智造”通过数据驱动全流程变革,赋能产业链协同升级 近日,全国首批15家领航级智能工厂名单发布
2025-12-03 13:41:00
国内首款AI助盲眼镜发布,基于通义千问打造
12月3日,杭州瞳行科技公司正式发布国内首款AI助盲眼镜。该眼镜基于通义千问Qwen-VL、OCR等系列模型打造,具有出行避障
2025-12-03 13:41:00
橙友“橙汁儿”向橙柿直通车反映:这几天收到了短信,是杭州市公共自行车公司发来的——“尊敬的用户,由于业务升级,您之前办理的绑卡租车功能即将在2025年12月底取消
2025-12-03 13:41:00
北京上班族李想称,健身私教课结束后,教练为索要好评,直接拿他手机代笔修改达3分钟。好评既影响消费者选择,也关联平台推流与服务者收益
2025-12-03 13:41:00
找“搭子” 聊技术 谈合作每日商报讯 一个多星期前,“魔搭社区”(杭州)开发者中心启用。这个中心是国内规模最大的模型开源社区“魔搭社区”的首个线下实体空间
2025-12-03 13:41:00