• 我的订阅
  • 头条热搜
谷歌大模型推理范式,主要分为两个阶段
...究“自我发现”(Self-Discover),重新定义了大模型推理范式。与已成行业标准的思维链(CoT)相比,新方法不仅让模型在面对复杂任务时表现更佳,还把同等效果下的推理成本压缩至1/40。核心策略其实很简单:千人千面。让大...……更多
港中文团队提出大模型元推理范式,革新大模型的评价体系
...段时间。在 ChatGPT 面世以后,他意识到针对大模型的研究范式存在一定的不足,于是决定来到香港中文大学读博。图 | 曾忠燊(来源:曾忠燊)前不久,曾忠燊和所在团队提出一个全新评测范式。基于这一评测范式,他们又针对...……更多
科学家提出情景学习新范式,让学霸大模型向学弱大模型输送能力
...院大模型团队的研究员李志宇和同事提出一种情景学习新范式:SLEICL(基于强模型增强的情景学习,Strong LLM Enhanced ICL),能更好地加速小模型的学术研究和产业落地。借助这一方法可以大幅提升小模型的性能表现,从而让小模...……更多
对标o1,Kimi放出了最能打的国产模型
AI 领域正在经历新一轮技术范式的变化,预训练 Scaling Law 放缓之后,推理时间计算成为了新的性能提升关键。两个月前,OpenAI o1 的诞生再次引领了大模型技术的突破。从后训练阶段入手,通过更多的强化学习、原生的思维链和...……更多
大模型步入推理Scaling时代,SambaNova如何挑战英伟达的霸主地位
...家。在性能跃升之外,更重要的是,它揭示了大模型进化范式的转变:通过更多的强化学习(训练时计算)和更多的推理(Test-Time 计算),模型可以获得更强大的性能。这又一次让我们想起 Richard Sutton 在《The Bitter Lesson》中所...……更多
让大模型能听会说,国内机构开源首个端到端语音对话模型Mini-Omni
...文本和语音。为复用语言模型「预测下一个 token」的学习范式,输出侧语音采用离散编码,本文采用了 SNAC 编解码方案。针对语音交互场景,输入语音经过预训练 whisper 的语音编码模块进行连续特征提取,然后通过 2 层 MLP 对齐...……更多
蚂蚁自研知识增强大模型服务框架KAG,可显著提升知识推理准确率
...知识关联,对大语言模型也更友好,同时,参考 DIKW 层次范式在同一实体空间中支持 Schema 约束、无模式建模及文本结构的分层表示。同时,我们探讨了 GraphRAG 范式的两种主要实现:微软的 GraphRAG 和 HippoRAG。尽管微软的 GraphRAG ...……更多
这才是真开源模型!公开后训练一切,性能超越Llama 3.1 Instruct
...幅提升了其后训练方法的复杂度,具体包括采用多轮训练范式、使用人类数据 + 合成数据、使用多个训练算法和训练目标。也正因为此,这些模型的通用性能和专业能力都非常强。但遗憾的是,他们都没有透明地公开他们的训练...……更多
WOT全球技术创新大会2024北京站:探索AI 的无限可能
...于云原生的开源异构算力整合与虚拟化解决方案——第四范式Project-HAMi,降低国产异构算力的使用门槛? 潞晨科技全球首个开源复现ChatGPT的RLHF训练过程和完整解决方案是什么?在大模型部署与应用专题,来自百度、网易云音...……更多
清华团队提出新型光计算架构,光训练速度提升1个数量级
...建立光子传播对称性模型,未采用传统的电训练反向传播范式,化“反”为“前”。这种新范式挣脱了前向-反向光场传播严格对齐的束缚,基于通用的光计算原位训练系统,突破了电训练架构对物理光计算的掣肘。该研究为光...……更多
百度云升级模型服务,百度版GPTs即日开放 | 最前线
...态的3个关键组件:大模型、智能计算、AI原生应用开发新范式。百度云智算大会他提到,在AI时代,应用技术、AI技术、IT基础设施三条平行的发展线终于交汇融合:在应用层,大模型理解、生成、逻辑、记忆的独特能力会催生AI...……更多
全模态对齐框架align-anything来啦:实现跨模态指令跟随
...地理解和表达复杂的概念。这种全模态的信息流对大模型范式转向通用人工智能也同等重要,研究人员开始尝试将大语言模型进行模态扩展,得到不仅能够处理语言,还可以理解并生成图像、音频、视频等多种信息的全模态模型...……更多
北大推出全新机器人多模态大模型!面向通用和机器人场景的高效推理和操作
...法在操作微调阶段需要更新投影层和整个 LLM。虽然这种范式可以赋予模型动作位姿预测能力,但它也破坏了 MLLM 的固有能力,并且需要大量的训练资源。为了解决这些挑战,我们提出了一种高效的微调策略,如图 3 所示。我们...……更多
邬贺铨院士:金融大模型改变了金融科技范式
...院士邬贺铨在大会上表示“金融大模型改变了金融科技的范式,重塑金融行业的工作方式,改变了金融服务生态。”中国工程院院士邬贺铨发表主题演讲目前金融大模型已经应用在金融资讯、产品介绍内容的文本自动生成,构建...……更多
昇思MindSpore 2.3全新发布
...开发MindSpore开源框架推动了软件性能提升。 AIforScience新范式,生成式AI赋能气动外形设计中国科学院院士、中国空气动力学会理事长唐志共表示:基于昇思MindSpore,生成式气动设计大模型平台打破传统设计范式,设计时长由月...……更多
ECCV 2024 | 南洋理工三维数字人生成新范式:结构扩散模型
...散模型(Structured Latent Diffusion Model)的三维数字人生成新范式 StructLDM。该范式包括三个关键设计:结构化的高维人体表征、结构化的自动解码器以及结构化的隐空间扩散模型。 StructLDM 是一个从图像、视频中学习的前馈三维生...……更多
又慢又贵?OpenAI推理模型“草莓”来了,GPT-5还有多远
...,但GPT-5很可能还会包括本次推出的推理技术。“有两种范式。”穆拉蒂表示,“缩放范式和这种新范式。我们希望将它们结合在一起。”GPT-5的开发之路并不好走。就在当地时间9月11日,GPT-4o/GPT-5的研究领导人、OpenAI版“Her”...……更多
o1核心作者分享:激励AI自我学习,比试图教会AI每一项任务更重要
“o1发布后,一个新的范式产生了”。其中关键,OpenAI研究科学家、o1核心贡献者Hyung Won Chung,刚刚就此分享了他在MIT的一次演讲。演讲主题为“Don’t teach. Incentivize(不要教,要激励),核心观点是:激励AI自我学习比试图教会...……更多
科学家提出大模型分子交互学习框架,已在400多万分子对中验证
...lti-hierarchical Chain-of-thought)的概念,来优化大模型的思考范式和训练范式。同时,该团队还采用一个分子交互任务间的动态参数来共享策略,以实现预测效率和预测精度的双赢。目前来看,这款框架最直观的应用在于:能被用来...……更多
o1金牌团队揭秘AI超越人类惊人时刻!22分完整版视频全公开
...6 通过规划、纠错,o1能够解决世界上的新问题7 新的训练范式是一种全新的方法,可以将更多的算力投入到模型中8 o1编写代码时,当其输出要使用的代码时,需要通过单元测试接下来,具体来看下o1模型背后的故事。强化学习+...……更多
被认可的大模型价格战
...在Scaling Law之外,一定要在数据、算法、算力等方面寻找范式上新的转化,“不论是战略上还是信仰上,我认为Scaling Law之外都还有范式变化的可能,不只是去简单地变成压缩模式,而是会走出一个体系,这样才有机会走向AGI,...……更多
AI发展变慢了?几位AI头部创业者并不赞同
...式从文字走向了语音,思考方式从快思考走向了慢思考,范式在突破。面壁智能是国内较早发布端侧模型的AI创业公司,该公司创始人李大海称,今年AI技术变化非常多,相比去年并不算少。不过他也理解外界认为AI发展速度变慢...……更多
Llama版o1来了,来自上海AI Lab,强化学习代码已开源,
...树搜索,Self-Play强化学习,PPO,以及AlphaGo Zero的双重策略范式(先验策略+价值评估)。在2024年6月,o1发布之前,团队就开始探索蒙特卡洛树搜索提高大模型数学能力,积累了一些关注。这次最新开源代码,也在开发者社区引起...……更多
整合长期记忆,AI实现自我进化,探索大模型这一可能性
...基础模型。目前人们有一个普遍的看法:在这种曲线拟合范式中,架构并不重要,关键的因素是数据集。但到了阶段 3,架构就会变得和数据一样重要。核心的难题是如何在统计模型的基础上有效表达少数个体的数据。该研究关...……更多
算力浪费超50%!百度AI计算部负责人拆解大模型时代的算力成本
...,GPU集群规模甚至达到10万卡。在王雁鹏看来,上述计算范式的变迁决定了计算体系机构的技术发展,而这种结构上的变化,又催生了云计算的技术和产品格局。“云计算可以看作一种售卖AI基础设施的形式”,他说道。打个比...……更多
李开复辟谣「掉队」传闻,零一万物推「白菜价」顶级模型
...展到现在,我们应该关注什么?像 OpenAI o1 这样的技术新范式是其一;像 canvas、NotebookLM 这样的产品新思路也是;还包括用户、客户营收这样的商业化指标。目标多元,但资源有限。进入 10 月,国内的大模型创业公司「六小虎」...……更多
超星未来梁爽:软硬件协同优化,赋能AI 2.0新时代
...模块功能的实现,尽量减少人工规则,并通过数据驱动的范式提升性能,大幅降低人工处理各种长尾问题的难度。在AI2.0时代,系统将由一个统一的通用基础大模型来应对多源数据输入,完成多种复杂任务,这一基础模型应该具...……更多
...人杨巍看来,大模型的诞生实际上带来了一个计算机使用范式的变化,迭代了人类与机器之间的交流模式,而随着各大厂家陆续推出中国本土的大模型,且各家产品形态已经初具雏形,当下的大模型行业开始进入应用落地的第二...……更多
大模型重构生命科学!最大基础模型面世,解锁DNA超长序列
...整场大会出现的关键词,而大模型在生命科学领域应用的范式,也成为各个领域专家的共识——生命科学领域有着明显的特点,实验验证过的有标签的数据很贵很少,已有的数据又是不同场景,很难用来直接训练任务模型。但它...……更多
从空间智能到具身智能,跨维践行Sim2Real AI最高效路径
...火热的空间智能和具身智能的本质是什么?以 Scaling Law 范式实现空间与具身智能的具体涵义是什么?哪条路是实现通用具身智能的最高效路径?具身智能如何从技术到产品再到商业落地?未来,有哪些能够突破行业生产范式的...……更多
更多关于科技的资讯:
盒马启用“电子验蟹师”,专挑肥满度超七成的报恩大闸蟹
秋分一过,大闸蟹长成,开始批量上市。近期,盒马的大闸蟹也正式上架,还做出了“不肥包退”的承诺。能够做到“不肥包退”,是因为今年盒马推出了首个大闸蟹分级企业标准
2025-09-24 20:37:00
康宝莱全球产品创新中心焕新启航 智驱未来 聚力共赢
2025年9月23日,上海 - 全球知名的健康公司康宝莱今日在上海举行“康宝莱全球产品创新中心”揭幕仪式。该中心由原“康宝莱中国产品创新中心”战略升级而成
2025-09-24 20:45:00
近日,由山东移动张店公司为区融媒体中心量身打造的“智慧研学服务平台”正式投入使用。该平台以信息化手段打通家长、教师、基地之间的信息壁垒
2025-09-24 20:48:00
2025第五届邹区国际照明博览会将于9月26日启幕
备受行业关注的2025第五届邹区国际照明博览会将于9月26日正式拉开帷幕,将集合全球照明领域的最新技术成果与产品,致力于促进产业链各环节的深度协作
2025-09-24 20:55:00
冲刺三季度 决胜下半年|华药(十堰)药业:AI“慧眼”识药 质效大幅提升
十堰广电讯(全媒体记者 翁红)华药(十堰市)药业有限公司中药饮片生产线项目是京堰对口协作重点招商项目。自今年6月试生产以来
2025-09-24 21:00:00
我武生物践行“实业报国,治病救人”,无偿助力“畅享呼吸”
由北京康盟慈善基金会与北京生命绿洲公益服务中心共同发起的“医药筹—畅享呼吸患者援助项目”,将于2025年10月1日起正式将援助范围扩展至甘肃省
2025-09-24 21:24:00
华为这一突破,意义非同寻常
(一)关注中国科技,我们必须关注华为;关注华为,我们必然就看到这一突破。我的第一感觉,这个突破,意义非凡。对华为来说是这样
2025-09-24 07:34:00
全球首发,钟楼智造闪耀第25届中国国际工业博览会!
9月23日第25届中国国际工业博览会(简称“工博会”)在上海盛大启幕这场聚焦“新质”展现大国工业硬核实力的博览会以“工业新质
2025-09-24 20:55:00
在制造业提质增效的浪潮中,那些藏在生产环节里的“细枝末节”,往往藏着撬动效益升级的关键密码。近日,太重包储分公司的散件箱优化项目传来捷报
2025-09-24 07:52:00
被3000亿资金哄抢的创新药企,上市首日暴涨110%
文|胡香赟编辑|海若镜港股迎来今年第11家上市的创新药公司。9月19日,劲方医药在港交所挂牌,首日涨幅接近110%、市值逼近150亿
2025-09-24 06:26:00
2025北京文化论坛“虚实无界:视听产业融合破圈”平行论坛举办
中国青年报客户端北京9月23日电(中青报·中青网记者 沈杰群)今天,2025北京文化论坛平行论坛——“虚实无界:视听产业融合破圈”在北京国际饭店会议中心举行
2025-09-24 00:03:00
中信银行南京分行成功举办“小天元”企业生态服务平台江苏区域发布会
9月22日下午,在百余家江苏企业代表的共同见证下,中信银行“小天元”企业生态服务平台江苏区域发布会暨“进万企 信服惠企”系列活动在南京成功举办
2025-09-23 23:15:00
聚焦京津冀协同发展|一个平台,推动黄骅模具迈向高端
北京市科学技术委员会牵头,京冀相关单位共建智能模具科技成果转化中试平台一个平台,推动黄骅模具迈向高端9月11日,智能模具科技成果转化中试平台工作人员正在操作四轴机床进行生产
2025-09-23 08:49:00
AI赋能千行百业一线故事(十二):数智化转型,让电厂越来越智慧
数智化转型,让电厂越来越智慧——AI赋能千行百业一线故事(十二)8月28日,石家庄良村热电有限公司生产技术部专业主管苏朝宏介绍智慧展厅
2025-09-23 08:53:00
“产业炬光灯”系列短视频首期聚焦中材航特
“产业炬光灯”系列短视频于厦门日报官方视频号、抖音号、快手号、B站账号、央视频账号等全媒体平台同步上线,首期节目走进中材航特
2025-09-23 08:58:00