• 我的订阅
  • 头条热搜
谷歌大模型推理范式,主要分为两个阶段
...究“自我发现”(Self-Discover),重新定义了大模型推理范式。与已成行业标准的思维链(CoT)相比,新方法不仅让模型在面对复杂任务时表现更佳,还把同等效果下的推理成本压缩至1/40。核心策略其实很简单:千人千面。让大...……更多
港中文团队提出大模型元推理范式,革新大模型的评价体系
...段时间。在 ChatGPT 面世以后,他意识到针对大模型的研究范式存在一定的不足,于是决定来到香港中文大学读博。图 | 曾忠燊(来源:曾忠燊)前不久,曾忠燊和所在团队提出一个全新评测范式。基于这一评测范式,他们又针对...……更多
本文转自:人民日报海外版美国斯坦福大学等机构研究团队近日宣布,在基座大模型基础上,仅耗费数十美元就开发出相对成熟的推理模型。尽管其整体性能尚无法比肩美国开放人工智能研究中心(OpenAI)开发的o1、中国深度求...……更多
科学家提出情景学习新范式,让学霸大模型向学弱大模型输送能力
...院大模型团队的研究员李志宇和同事提出一种情景学习新范式:SLEICL(基于强模型增强的情景学习,Strong LLM Enhanced ICL),能更好地加速小模型的学术研究和产业落地。借助这一方法可以大幅提升小模型的性能表现,从而让小模...……更多
对标o1,Kimi放出了最能打的国产模型
AI 领域正在经历新一轮技术范式的变化,预训练 Scaling Law 放缓之后,推理时间计算成为了新的性能提升关键。两个月前,OpenAI o1 的诞生再次引领了大模型技术的突破。从后训练阶段入手,通过更多的强化学习、原生的思维链和...……更多
大模型面临四大关键缺陷,“知识方程”能否通向强人工智能
...有很大不同。 当前AI正在经历从感知智能向认知智能的范式转变。众所周知,人类拥有两套推理系统,即直觉思考的快系统和理性思考的慢系统。快系统是一种底层、快速、下意识、不加思索便可即刻得到结论的推理方式,就...……更多
大模型步入推理Scaling时代,SambaNova如何挑战英伟达的霸主地位
...家。在性能跃升之外,更重要的是,它揭示了大模型进化范式的转变:通过更多的强化学习(训练时计算)和更多的推理(Test-Time 计算),模型可以获得更强大的性能。这又一次让我们想起 Richard Sutton 在《The Bitter Lesson》中所...……更多
让大模型能听会说,国内机构开源首个端到端语音对话模型Mini-Omni
...文本和语音。为复用语言模型「预测下一个 token」的学习范式,输出侧语音采用离散编码,本文采用了 SNAC 编解码方案。针对语音交互场景,输入语音经过预训练 whisper 的语音编码模块进行连续特征提取,然后通过 2 层 MLP 对齐...……更多
蚂蚁自研知识增强大模型服务框架KAG,可显著提升知识推理准确率
...知识关联,对大语言模型也更友好,同时,参考 DIKW 层次范式在同一实体空间中支持 Schema 约束、无模式建模及文本结构的分层表示。同时,我们探讨了 GraphRAG 范式的两种主要实现:微软的 GraphRAG 和 HippoRAG。尽管微软的 GraphRAG ...……更多
这才是真开源模型!公开后训练一切,性能超越Llama 3.1 Instruct
...幅提升了其后训练方法的复杂度,具体包括采用多轮训练范式、使用人类数据 + 合成数据、使用多个训练算法和训练目标。也正因为此,这些模型的通用性能和专业能力都非常强。但遗憾的是,他们都没有透明地公开他们的训练...……更多
WOT全球技术创新大会2024北京站:探索AI 的无限可能
...于云原生的开源异构算力整合与虚拟化解决方案——第四范式Project-HAMi,降低国产异构算力的使用门槛? 潞晨科技全球首个开源复现ChatGPT的RLHF训练过程和完整解决方案是什么?在大模型部署与应用专题,来自百度、网易云音...……更多
清华团队提出新型光计算架构,光训练速度提升1个数量级
...建立光子传播对称性模型,未采用传统的电训练反向传播范式,化“反”为“前”。这种新范式挣脱了前向-反向光场传播严格对齐的束缚,基于通用的光计算原位训练系统,突破了电训练架构对物理光计算的掣肘。该研究为光...……更多
...字,就需要写在纸上分步完成。模型也是如此,新的推理范式相当于教会了模型如何利用更长的“思考时间”或更多的“计算步骤”。一旦模型学会了这种利用时间来分解和解决复杂问题的方法,它就能解锁更多以前无法完成的...……更多
百度云升级模型服务,百度版GPTs即日开放 | 最前线
...态的3个关键组件:大模型、智能计算、AI原生应用开发新范式。百度云智算大会他提到,在AI时代,应用技术、AI技术、IT基础设施三条平行的发展线终于交汇融合:在应用层,大模型理解、生成、逻辑、记忆的独特能力会催生AI...……更多
汇付天下AI应用丨LLM在投诉风险管控中的应用实践
...用中使用多种机器学习算法和复杂的规则引擎。 “传统范式”是借助“多种算法”和“代码语言”来开发模型。如借助TF-IDF、TextRank等多种算法,并配上大量的代码去综合分析和挖掘关键词,再借助StructBert模型对风险提示词做...……更多
全模态对齐框架align-anything来啦:实现跨模态指令跟随
...地理解和表达复杂的概念。这种全模态的信息流对大模型范式转向通用人工智能也同等重要,研究人员开始尝试将大语言模型进行模态扩展,得到不仅能够处理语言,还可以理解并生成图像、音频、视频等多种信息的全模态模型...……更多
北大推出全新机器人多模态大模型!面向通用和机器人场景的高效推理和操作
...法在操作微调阶段需要更新投影层和整个 LLM。虽然这种范式可以赋予模型动作位姿预测能力,但它也破坏了 MLLM 的固有能力,并且需要大量的训练资源。为了解决这些挑战,我们提出了一种高效的微调策略,如图 3 所示。我们...……更多
阶跃星辰李璟:多模态是AGI的必经之路,视觉模型可按语言模型路线实现大一统
...生成一体化。在阶跃提出的路线图里面,模拟世界的主要范式是模仿学习,就是把互联网上的所有的数据都喂给大模型,通过预测下一个token这样的任务来学习海量数据中的结构和特征。当学会表征世界之后,下一步就要培养机...……更多
邬贺铨院士:金融大模型改变了金融科技范式
...院士邬贺铨在大会上表示“金融大模型改变了金融科技的范式,重塑金融行业的工作方式,改变了金融服务生态。”中国工程院院士邬贺铨发表主题演讲目前金融大模型已经应用在金融资讯、产品介绍内容的文本自动生成,构建...……更多
昇思MindSpore 2.3全新发布
...开发MindSpore开源框架推动了软件性能提升。 AIforScience新范式,生成式AI赋能气动外形设计中国科学院院士、中国空气动力学会理事长唐志共表示:基于昇思MindSpore,生成式气动设计大模型平台打破传统设计范式,设计时长由月...……更多
ECCV 2024 | 南洋理工三维数字人生成新范式:结构扩散模型
...散模型(Structured Latent Diffusion Model)的三维数字人生成新范式 StructLDM。该范式包括三个关键设计:结构化的高维人体表征、结构化的自动解码器以及结构化的隐空间扩散模型。 StructLDM 是一个从图像、视频中学习的前馈三维生...……更多
又慢又贵?OpenAI推理模型“草莓”来了,GPT-5还有多远
...,但GPT-5很可能还会包括本次推出的推理技术。“有两种范式。”穆拉蒂表示,“缩放范式和这种新范式。我们希望将它们结合在一起。”GPT-5的开发之路并不好走。就在当地时间9月11日,GPT-4o/GPT-5的研究领导人、OpenAI版“Her”...……更多
成本不到150元!26分钟训出个推理模型 媲美o1和R1
...并为它配备了简单的budget forcing后,它采用了不同的scaling范式。具体来说,通过多数投票在基础模型上对test-time compute进行Scale的方法,训出的模型无法赶上s1-32B的性能。这就验证了团队之前的“直觉”,即顺序Scaling比并行Scaling...……更多
o1核心作者分享:激励AI自我学习,比试图教会AI每一项任务更重要
“o1发布后,一个新的范式产生了”。其中关键,OpenAI研究科学家、o1核心贡献者Hyung Won Chung,刚刚就此分享了他在MIT的一次演讲。演讲主题为“Don’t teach. Incentivize(不要教,要激励),核心观点是:激励AI自我学习比试图教会...……更多
卷模型技术,更要卷工程实现
...-运营的全链路开发工作。《开谈》圆桌AI 时代的研发新范式与开发者能力演进毕业于北京航空航天大学,从一线软件及算法工程师至创业企业CTO,进入资本市场,多年来一直专注在Data&AI Infra方向,为多家知名创业公司提供咨...……更多
阶跃星辰CEO姜大昕:强化学习不是AI的尽头,下一步是自主学习,Agent将成超级应用
...和归纳世界三个阶段。在模拟世界阶段,训练模型的主要范式是模仿学习,学习的主要目标是各种模态的表征,下一步是培养模型能够解决复杂问题的能力。人脑对复杂问题的解决是启动系统2的模式,通过问题拆解不断探索。...……更多
科学家提出大模型分子交互学习框架,已在400多万分子对中验证
...lti-hierarchical Chain-of-thought)的概念,来优化大模型的思考范式和训练范式。同时,该团队还采用一个分子交互任务间的动态参数来共享策略,以实现预测效率和预测精度的双赢。目前来看,这款框架最直观的应用在于:能被用来...……更多
云知声山海大模型成功发布,为各行业带来新增长范式
...大飞跃,人工智能技术发展,将为各行各业带来新的增长范式与无限可能。云知声此次山海大模型的推出,顺应了时代发展的规律,推动中国人工智能技术向前跨出一步。期待未来,云知声能坚守技术创新的信条,与同行者共同...……更多
对话商汤王晓刚:自动驾驶借助强化学习将超越人类,今年商业化迎爆发
...是模仿学习,很难突破人类驾驶水平的天花板。但AI技术范式的突破,为自动驾驶技术范式提供了新思路。最近火爆的DeepSeek基于纯强化学习的长思维链涌现,打破了数据瓶颈,为自动驾驶带来了突破可能。王晓刚认为,有了强...……更多
o1金牌团队揭秘AI超越人类惊人时刻!22分完整版视频全公开
...6 通过规划、纠错,o1能够解决世界上的新问题7 新的训练范式是一种全新的方法,可以将更多的算力投入到模型中8 o1编写代码时,当其输出要使用的代码时,需要通过单元测试接下来,具体来看下o1模型背后的故事。强化学习+...……更多
更多关于科技的资讯:
据IDC与《2025中国生成式AI搜索生态白皮书》联合数据显示,截至2025年第三季度,中国GEO服务市场规模已达220亿元
2025-10-25 21:09:00
周一围与博斯绅威共赴“轻装之约”,解锁网球生活新方式
金秋济南,共赴网球生活时光。10月25日下午,博斯绅威携品牌体验官、著名演员周一围先生,在济南银座商城举办了一场主题为“轻装上阵
2025-10-26 12:28:00
曹县汉服“遇上”拼多多:95后的创业翻盘记
鲁网10月24日讯曹县,素有“中国汉服产业重镇”之称,曾见证无数小微创业者在行业竞争中艰难求索。对许多创业者而言,汉服市场度过初期蓝海阶段后
2025-10-24 14:29:00
突破光谱检测瓶颈!中国计量大学本科生团队研制高分辨率光谱仪
通讯员:吴瑞鹏 何秋阳近日,第十九届“挑战杯”全国大学生课外学术科技作品竞赛正火热备赛中,全国高校参赛队伍蓄势待发。中国计量大学光学与电子科技学院本科生团队项目——“基于微反射镜阵列的高分辨率光谱仪”
2025-10-24 15:02:00
开普勒机器人登陆IROS 2025 以开放平台携手全球开发者共筑新生态
10月19日至25日,全球机器人领域两大顶级国际会议之一的2025年IEEE/RSJ智能机器人与系统国际会议(IROS 2025)在杭州隆重举行
2025-10-24 15:02:00
蓝月亮:用十二年为洁净艺术种下一棵“树”
10月23日,第十七届国际大学生暨青年艺术博览会(简称:大艺博)开幕。在武汉东部的中国光谷科技会展中心10000平方米的专业展馆内
2025-10-24 15:14:00
京东工业与南方电网供应链集团签署战略合作 以数智技术驱动供应链全面升级
10月20日,京东工业与南方电网供应链集团在广州正式签署战略合作协议,双方相关负责人出席签约仪式。此次合作标志着京东集团与南方电网在供应链领域的协作迈入全新阶段
2025-10-24 15:23:00
从OS到AI OS:荣耀MagicOS 10定义AI OS新时代
2025年10月23日,荣耀全球开发者大会暨AI终端生态大会在深圳坪山燕子湖国际会展中心隆重举行。本次大会系统阐释了MagicOS 10的品牌战略与发展路径
2025-10-24 15:32:00
最后窗口期!2025FHC上海环球食品展免费领票即将截止
2025FHC上海环球食品展已进入开幕倒计时!这场被誉为“全球食饮贸易超级接口”的盛会,已成为零售买家囤货、拓品的关键“战场”—20万㎡展出面积
2025-10-24 15:47:00
K90定价后引热议闪电降价,雷军:标准版12GB+512GB 版本首销月直降300元
2025年10月23日的红米K90发布会后,12GB+512GB版本原定价为3199元,但因用户反馈该版本与其他配置差价过大
2025-10-24 15:57:00
iPhone 17系列首批用户反应褪色? 苹果官方客服回应
近日,部分苹果 iPhone 17 Pro 及 iPhone 17 Pro Max 的首批用户在社交平台反映,其设备遭遇了机身褪色问题
2025-10-24 15:59:00
阿里夸克AI眼镜开启预售 体验者:轻若无物,稳如长在脸上“看一眼”就能支付
阿里巴巴首款自研AI眼镜——夸克AI眼镜24日0时在夸克智能设备天猫旗舰店开启预售。88VIP会员实际到手价为3699元
2025-10-24 16:35:00
河北新闻网讯(梁轩轩)“原以为开业办税很繁琐,没想到这么简单!”近日,石家庄市桥西区律吕五金产品商行法人柴浩在桥西区税务局办税大厅完成税务申报后
2025-10-24 16:59:00
近日,瑞众人寿河北分公司在保定举办了2025年嘉年华客服节系列活动之“养老规划线下体验日”活动,通过创新融合中医药文化
2025-10-24 17:06:00
“尖货”频出!临安这里科技含量UpUpUp
是一场什么样的比赛技术“尖货”频出“硬核”创新不断近日,2025“海康创行・瓴创青山”智能物联青山湖科技城高层次人才创业大赛第二期
2025-10-24 17:07:00