• 我的订阅
  • 头条热搜
RAG真能提升LLM推理能力?人大最新研究:数据有噪声,RAG性能不升反降
...复杂的推理,降低问题求解所需的推理深度,但由于文档噪声的存在,其提升效果可能会受限。中国人民大学的研究表明,尽管RAG可以提升LLM的推理能力,但这种提升作用并不是无限的,并且会受到文档中噪声信息的影响。通过...……更多
突破时间序列组合推理难题!南加大发布一站式多步推理框架TS-Reasoner
...合成时间序列推理任务上表现良好,但在极端数据稀缺或噪声数据较多的环境下,其模型鲁棒性仍需进一步验证。最后,虽然TS-Reasoner能够通过自定义模块生成处理外部约束,但不同类型的外部知识(例如不同领域的领域知识)...……更多
大模型新趋势之MoE:现状、挑战及研究方向
...整、专家模型设计及协作、动态性适应数据变化、对数据噪声相对敏感等技术难题仍有待解决。二是MoE架构设计很复杂,涉及网络类型、专家数量选择等多个方面。目前FFN、LSTM、CNN、Attention和LoRA等多种网络架构已被用作专家模...……更多
Meta提出“可持续思维链”,让大模型在连续潜空间中推理
...的视觉条件——通过在掩码视频数据中添加随时间变化的噪声而生成的纯 2D 归纳视觉信号。最后,他们通过将 See3D 集成到基于翘曲的高保真 3D 生成流水线中,引入了新颖的视觉条件 3D 生成框架。 他们在单一和稀疏重建基准上...……更多
英伟达SC24六大技术亮点,不止加速超算500强
...性,只能运行一定数量的运算,该现象被研究人员称为“噪声”。谷歌量子AI正在使用量子-经典混合计算平台和NVIDIA Eos超级计算机,以模拟其量子处理器的物理特性,这将有助于克服量子计算硬件当前的局限。谷歌量子AI研究科...……更多
扩散模型也能搞定社交信息推荐,港大数据智能实验室提出RecDiff
用扩散模型搞社交信息推荐,怎么解决数据噪声难题?现有的一些自监督学习方法效果还是有限。针对此,港大数据智能实验室提出了新项目RecDiff。RecDiff是一种全新的基于扩散模型的推荐框架,能够更好地捕捉用户的潜在偏好...……更多
给小学数学题加句废话,OpenAI o1就翻车了,苹果论文质疑AI推理
苹果新论文:AI 大模型可能不会推理。AI 大模型(LLM)真的像我们理解的那样能「思考」或「推理」吗?最近,苹果的一篇论文探讨了这个问题,并且给出了一个倾向于「否」的答案。相关帖子被很多人围观。这篇题为「GSM-Symb...……更多
刚刚,Llama 3.2 来了!支持图像推理,还有可在手机上运行的版本
...开始,首先,添加图像适应器和编码器,然后在大规模有噪声的成对 (图像,文本) 数据上进行预训练。接下来,在中等规模的高质量域内和经过知识增强的 (图像,文本) 对数据上进行训练。在后训练阶段,再使用与文本模型类...……更多
奥林匹克竞赛里选最聪明的AI:Claude-3.5-Sonnet vs. GPT-4o?
...异,近来Anthropic公司最新发布的Claude-3.5-Sonnet因在知识型推理、数学推理、编程任务及视觉推理等任务上设立新行业基准而引发广泛讨论:Claude-3.5-Sonnet 已经取代OpenAI的GPT4o成为世界上”最聪明的AI“(Most Intelligent AI)了……更多
o1带火的CoT到底行不行?新论文引发了论战
...To CoT or not to CoT?OpenAI ο1 的诞生极大地提升了人们对 LLM 推理能力和思维链(CoT)的兴趣。一时之间,似乎思维链很快就会成为所有 LLM 的标配,但思维链并非万能,就连 OpenAI 自己也提到 o1 在某些任务上的表现并不比 GPT-4o 强...……更多
RAG没有银弹!四级难度,最新综述覆盖数据集、解决方案,教你「LLM+外部数据」的正确使用姿势
...能取决于问题和数据集,固定数量的检索可能会导致信息噪声或信息不足。2. 推理与检索之间的协调(Coordination between reasoning and retrieval):推理可以指导需要检索的内容,而从检索中获得的信息可以迭代地完善推理策略。解决...……更多
一文看尽Meta开源大礼包!全面覆盖图像分割、语音、文本、表征、材料发现、密码安全性等
...的难题之上。 这种难题假设,如果只提供与随机向量有噪声的内积,那么学习一个秘密向量是非常困难的,此前已经有研究人员展示了针对这种方法的机器学习攻击。Meta Lingua:通过高效的模型训练加速研究Meta Lingua 是一个轻...……更多
LLM群体智能崛起,数学性能暴增11.6%!谷歌DeepMind四大机构联手新作
...认知,数学最考验元认知,原本是指,人类对自己思维、推理过程的直观认识。那么,大模型也具备「元认知」的能力吗?研究人员对此,提出了一种假设,并设想是否可以通过知识引导,进一步提高LLM的能力。 其实,此前的...……更多
免训练大模型知识编辑,吸收新数据更高效|EMNLP\'24
...的连续提示学习新方法,可以提高知识终身学习的编辑和推理效率。模型编辑旨在纠正大语言模型中过时或错误的知识,同时不需要昂贵的代价进行再训练。终身模型编辑是满足LLM持续编辑要求的最具挑战性的任务。之前的工作...……更多
百倍提升7B模型推理能力!颜水成团队携手新加坡南洋理工大学发布Q*算法
...-7b等小模型达到参数量比其大数十倍、甚至上百倍模型的推理能力,使模型性能迎来惊人提升。自OpenAI的Q*项目曝光后,业内相关讨论始终层出不穷。据现有信息汇总,Q*项目被视作OpenAI在探索人工通用智能(Artificial General Intelli...……更多
推动大模型自我进化,北理工推出「流星雨计划」
...我进化的方式,解决代码模型在处理复杂问题时缺少中间推理过程。核心观点:自我进化的力量跟随上述自我进化的思想,在 SRA-MCTS(Self-guided MCTS-based data generation for Reasoning Augmentation)方法中,作者无需借助额外的任何监……更多
成本不到150元!26分钟训出个推理模型 媲美o1和R1
成本不到150元,训练出一个媲美DeepSeek-R1和OpenAI o1的推理模型?!这不是洋葱新闻,而是AI教母李飞飞、斯坦福大学、华盛顿大学、艾伦人工智能实验室等携手推出的最新杰作:s1。在数学和编程能力的评测集上,s1的表现比肩Dee...……更多
北大推出全新机器人多模态大模型!面向通用和机器人场景的高效推理和操作
...码仓库 Trending Research 第一位。为了赋予机器人端到端的推理和操纵能力,本文创新性地将视觉编码器与高效的状态空间语言模型集成,构建了全新的 RoboMamba 多模态大模型,使其具备视觉常识任务和机器人相关任务的推理能力,...……更多
...基座大模型基础上,仅耗费数十美元就开发出相对成熟的推理模型。尽管其整体性能尚无法比肩美国开放人工智能研究中心(OpenAI)开发的o1、中国深度求索公司的DeepSeek-R1等,但此类尝试意味着企业可以较低成本研发出适合自...……更多
研究人员给了人工智能一个“内心独白”,结果大大提高了其性能
...工智能系统,让它在说话前先思考。内心独白提高了常识推理能力,并使其数学成绩翻了一番。一项新的研究表明,给人工智能系统一个“内心独白”会大大提高它们的推理能力。这种方法训练的人工智能系统,会在对提示做出...……更多
大模型步入推理Scaling时代,SambaNova如何挑战英伟达的霸主地位
...震。o1 能像人类一样「思考」复杂问题,拥有优秀的通用推理能力。在未经专门训练的情况下,o1 能够直接拿下数学奥赛金牌,甚至能在博士级别的科学问答环节上超越人类专家。在性能跃升之外,更重要的是,它揭示了大模型...……更多
阿里云全面升级GPU云服务:AI大模型推理性能可提升100%
...云推出全面升级的GPU云服务,通过全新优化GPU套件,多GPU推理服务性能可最大提升100%。针对调用GPU算力最常用的容器技术,阿里云推出ACK云原生AI套件,帮助开发者及企业更高效地开发和部署AI应用,加速大模型应用落地。随着A...……更多
英伟达开源NVLM 1.0屠榜多模态!纯文本性能不降反升
...例如,OCRBench)的性能,但与低分辨率版本模型相比,在推理相关任务(例如,MMMU)上的准确率却会下降。此外,虽然开源的多模态大模型在视觉-语言任务上取得了非常亮眼的基准测试结果,但在纯文本任务上的性能却有显著...……更多
智能体首达Kaggle Grandmaster,华为结构化推理补齐思维链短板
...中的表现,研究者们提出了各种提示策略来提升大模型的推理和规划能力,比如思维链、思维树和思维图谱。这些进步与工具集成一起,推动着通用 AI 智能体的发展,让它们现在已经能够用 LLM 输出的决策策略来解决序列决策问...……更多
第一个100%开源的MoE大模型,7B的参数,1B的推理成本
...语言模型 (LM) 在各种任务上取得了重大进展,但在训练和推理方面,性能和成本之间仍然需要权衡。对于许多学者和开发人员来说,高性能的 LM 是无法访问的,因为它们的构建和部署成本过高。改善成本 - 性能的一种方法是使...……更多
“弱智吧”成最佳中文AI语料库,究竟什么算优质数据?
...解和处理各种场景和任务。干净合理是指数据要干净、无噪声,数据应该尽量减少错误与不合理的内容,确保数据的正确性。及时性是指数据可以随着时间推移持续扩充与更新。他表示,在一些专业领域,往往也需要一些带有对...……更多
CMU&清华:让LLM自己合成数据来学习,特定任务性能同样大幅提升
...成后和输出注释后分别进行了两轮基于规则的数据过滤。噪声过滤(Noise Filter):研究者手动整理了一份噪声术语列表,包括常见的问候语和噪声字符(例如,生成内容中的”\\”)。如果生成示例的输入或输出中出现了任何来...……更多
无一大模型及格! 北大/通研院提出超难基准,评估长文本理解生成
...的长依赖任务中的多信息检索、时间重排序、计算、理解推理能力表现均不乐观。比如像Claude3-200k,GPT4-32k、GPT4-8k、GPT3.5-turbo-6k、LlamaIndex这种商业模型,平均只有40%的准确率。而像开源模型表现就更不理想了…ChatGLM2-6B、LongLL……更多
零样本即可时空预测!港大、华南理工等发布时空大模型UrbanGPT | KDD 2024
...入额外的文本信息不仅不会影响模型的性能,也不会引入噪声,这进一步证明了利用大型语言模型来增强时空预测任务的有效性。表2:端到端有监督设置下的预测性能评估消融实验(1)时空上下文的重要性:STC。 当从指示文本...……更多
清华团队提出大模型“密度定律”;足球领域首个视觉语言基础模型
...交视觉-语言-动作建模框架RevThink:使用逆向思维增强 LLM 推理想要第一时间获取每日最新大模型热门论文? 点击阅读原文,查看「2024必读大模型论文」合集,以及申请加入「大模型技术分享群」。SwiftEdit:50 倍速文本引导图像...……更多
更多关于科技的资讯:
26岁女孩出门全副武装防晒致骨质疏松:每天还喝大量咖啡
5月22日消息,据报道,26岁的小张被确诊为骨质疏松,医生询问病史发现,小张为了应对工作咖啡一杯接一杯,全靠那浓郁苦涩的液体提神醒脑
2025-05-22 23:51:00
《财富》发布2025年全球最具影响力的商界女性榜:AMD苏姿丰、华为孟晚舟等上榜
快科技5月23日消息,日前,《财富》发布2025年全球最具影响力的商界女性排行榜。今年排名前三的分别是:蝉联榜首的通用汽车公司首席执行官玛丽·巴拉(Mary Barra)
2025-05-23 00:51:00
51岁曹颖自曝患胃癌:最放心不下儿子
5月23日消息,微博话题“曹颖患胃癌”上了微博热搜。据媒体报道,知名主持人曹颖曾在节目中自曝患胃癌,坦言最放心不下儿子
2025-05-23 00:51:00
全球首个5G—A露天矿落地(记录中国)
本文转自:人民日报无人电动矿卡集群在矿区作业。无人电动矿卡行驶在华能伊敏露天矿区。以上图片均为王轶群摄(人民视觉)近日
2025-05-23 05:41:00
本文转自:人民日报在2025中关村国际技术交易大会发布的百项新技术新产品榜单中,来自山东潍坊高新区的液流储能科技有限公司凭借“材料创新—工艺突破—标准主导”全链条技术优势
2025-05-23 05:42:00
本文转自:人民日报本报北京5月22日电 (记者金歆)记者从中央网信办获悉:按照2025年“清朗”系列专项行动总体安排
2025-05-23 05:42:00
于生命长河照见“我是谁”
本文转自:人民日报《有生以来:生命演化启示录》:刘晨光著;上海交通大学出版社出版。进入21世纪以来,生命科学不断取得突破
2025-05-23 05:49:00
□南京日报/紫金山新闻记者 李都夏雪晴邓露洁张希“南京重点布局的创新型产业集群令我印象深刻,这里的营商环境和创新氛围都十分优异
2025-05-23 06:28:00
文化科技融合,“宝藏企业”亮点纷呈“数字金陵”亮相深圳文博会□南京日报/紫金山新闻记者 朱静轻点手机小程序下单,一只白色机械臂随即灵活转动
2025-05-23 06:29:00
首发搭载玄戒O1!小米15S Pro首销送4大权益:价值1366元
快科技5月23日消息,小米15S Pro已经正式发布,首发搭载自研玄戒O1芯片,官方定价5499元起,叠加国补到手价是4999元起
2025-05-23 06:51:00
B友长大了 B站赚麻了
搁以前,提起B站的赚钱能力,不管是不是资深B友,心里可能都得嘀咕一下。印象里的小破站嘛,年轻人多,氛围好,创意足,就是
2025-05-23 06:51:00
微软发布杰洛特狼头手柄
CDPR与微软联合设计了这款带有独特标识的手柄,以庆祝《狩魔猎人3》面市十周年: 手柄正面印有杰洛特的狼头吊坠,采用黑红双色配色方案
2025-05-23 06:51:00
新一批南京大模型通过国家备案
南京3款大模型产品近日通过国家生成式人工智能服务备案。截至目前,南京累计有16款大模型产品通过国家网信办备案,展现出发展大模型的强大动力江苏省委网信办近日公布第七批通过国家生成式人工智能服务备案的大模型名单
2025-05-23 07:03:00
在“5·15全国投资者保护宣传日”活动期间,为积极响应监管部门关于加强投资者教育的号召,5月14日,招商基金携手江苏商报走进南京邮电大学
2025-05-23 07:03:00
近日,紫金农商银行栖霞支行营业部开展“绘爱随行,感恩相伴”母亲节主题客户沙龙活动,以别出心裁的形式向女性客户传递节日祝福与金融关怀
2025-05-23 07:03:00