噪声,推理,性能,能力,数据,研究头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

RAG真能提升LLM推理能力？人大最新研究：数据有噪声，RA

...复杂的推理，降低问题求解所需的推理深度，但由于文档噪声的存在，其提升效果可能会受限。中国人民大学的研究表明，尽管RAG可以提升LLM的推理能力，但这种提升作用并不是无限的，并且会受到文档中噪声信息的影响。通过...……更多

2024-10-23 13:34:00噪声,推理,性能,能力,数据,研究

突破时间序列组合推理难题！南加大发布一站式多步推理框架TS-

...合成时间序列推理任务上表现良好，但在极端数据稀缺或噪声数据较多的环境下，其模型鲁棒性仍需进一步验证。最后，虽然TS-Reasoner能够通过自定义模块生成处理外部约束，但不同类型的外部知识（例如不同领域的领域知识）...……更多

2024-10-29 09:55:00推理,时间序列,序列,框架,难题,突破

大模型新趋势之MoE：现状、挑战及研究方向

...整、专家模型设计及协作、动态性适应数据变化、对数据噪声相对敏感等技术难题仍有待解决。二是MoE架构设计很复杂，涉及网络类型、专家数量选择等多个方面。目前FFN、LSTM、CNN、Attention和LoRA等多种网络架构已被用作专家模...……更多

2024-11-04 16:00:00研究方向,模型,现状,方向,趋势,研究

扩散模型也能搞定社交信息推荐，港大数据智能实验室提出RecD

用扩散模型搞社交信息推荐，怎么解决数据噪声难题？现有的一些自监督学习方法效果还是有限。针对此，港大数据智能实验室提出了新项目RecDiff。RecDiff是一种全新的基于扩散模型的推荐框架，能够更好地捕捉用户的潜在偏好...……更多

2024-07-30 09:31:00社交,实验室,模型,实验,智能,数据

给小学数学题加句废话，OpenAI o1就翻车了，苹果论文质

苹果新论文：AI 大模型可能不会推理。AI 大模型（LLM）真的像我们理解的那样能「思考」或「推理」吗？最近，苹果的一篇论文探讨了这个问题，并且给出了一个倾向于「否」的答案。相关帖子被很多人围观。这篇题为「GSM-Symb...……更多

2024-10-14 09:55:00数学题,推理,废话,苹果,数学,小学

刚刚，Llama 3.2 来了！支持图像推理，还有可在手机上

...开始，首先，添加图像适应器和编码器，然后在大规模有噪声的成对 (图像，文本) 数据上进行预训练。接下来，在中等规模的高质量域内和经过知识增强的 (图像，文本) 对数据上进行训练。在后训练阶段，再使用与文本模型类...……更多

2024-09-27 13:42:00推理,可在,图像,运行,版本,支持

奥林匹克竞赛里选最聪明的AI：Claude-3.5-Sonn

...异，近来Anthropic公司最新发布的Claude-3.5-Sonnet因在知识型推理、数学推理、编程任务及视觉推理等任务上设立新行业基准而引发广泛讨论：Claude-3.5-Sonnet 已经取代OpenAI的GPT4o成为世界上”最聪明的AI“（Most Intelligent AI）了……更多

2024-06-25 09:45:00奥林,奥林匹克,竞赛,模型,推理,能力

o1带火的CoT到底行不行？新论文引发了论战

...To CoT or not to CoT？OpenAI ο1 的诞生极大地提升了人们对 LLM 推理能力和思维链（CoT）的兴趣。一时之间，似乎思维链很快就会成为所有 LLM 的标配，但思维链并非万能，就连 OpenAI 自己也提到 o1 在某些任务上的表现并不比 GPT-4o 强...……更多

2024-09-21 09:37:00新论,推理,符号,性能,任务,数据

LLM群体智能崛起，数学性能暴增11.6%！谷歌DeepMi

...认知，数学最考验元认知，原本是指，人类对自己思维、推理过程的直观认识。那么，大模型也具备「元认知」的能力吗？研究人员对此，提出了一种假设，并设想是否可以通过知识引导，进一步提高LLM的能力。其实，此前的...……更多

2024-09-23 09:50:00新作,群体,性能,数学,机构,智能

$免训练大模型知识编辑，吸收新数据更高效｜EMNLP\\\'24$

免训练大模型知识编辑，吸收新数据更高效｜EMNLP\'24

...的连续提示学习新方法，可以提高知识终身学习的编辑和推理效率。模型编辑旨在纠正大语言模型中过时或错误的知识，同时不需要昂贵的代价进行再训练。终身模型编辑是满足LLM持续编辑要求的最具挑战性的任务。之前的工作...……更多

2024-10-30 09:57:00模型,训练,知识,数据,模型,知识

百倍提升7B模型推理能力！颜水成团队携手新加坡南洋理工大学发

...-7b等小模型达到参数量比其大数十倍、甚至上百倍模型的推理能力，使模型性能迎来惊人提升。自OpenAI的Q*项目曝光后，业内相关讨论始终层出不穷。据现有信息汇总，Q*项目被视作OpenAI在探索人工通用智能（Artificial General Intelli...……更多

2024-06-26 09:19:00南洋,水成,新加坡,理工大学,算法,推理

北大推出全新机器人多模态大模型！面向通用和机器人场景的高效推

...码仓库 Trending Research 第一位。为了赋予机器人端到端的推理和操纵能力，本文创新性地将视觉编码器与高效的状态空间语言模型集成，构建了全新的 RoboMamba 多模态大模型，使其具备视觉常识任务和机器人相关任务的推理能力，...……更多

2024-06-21 09:52:00机器,模态,人多,机器人,推理,北大

研究人员给了人工智能一个“内心独白”，结果大大提高了其性能

...工智能系统，让它在说话前先思考。内心独白提高了常识推理能力，并使其数学成绩翻了一番。一项新的研究表明，给人工智能系统一个“内心独白”会大大提高它们的推理能力。这种方法训练的人工智能系统，会在对提示做出...……更多

2024-03-21 16:13:00人工智能,研究人员,独白,人工,内心,性能

大模型步入推理Scaling时代,SambaNova如何挑战

...震。o1 能像人类一样「思考」复杂问题，拥有优秀的通用推理能力。在未经专门训练的情况下，o1 能够直接拿下数学奥赛金牌，甚至能在博士级别的科学问答环节上超越人类专家。在性能跃升之外，更重要的是，它揭示了大模型...……更多

2024-10-21 09:55:00英伟,霸主,推理,模型,地位,时代

阿里云全面升级GPU云服务：AI大模型推理性能可提升100%

...云推出全面升级的GPU云服务，通过全新优化GPU套件，多GPU推理服务性能可最大提升100%。针对调用GPU算力最常用的容器技术，阿里云推出ACK云原生AI套件，帮助开发者及企业更高效地开发和部署AI应用，加速大模型应用落地。随着A...……更多

2024-07-19 17:21:00阿里,推理,模型,性能,升级,服务

智能体首达Kaggle Grandmaster,华为结构化推

...中的表现，研究者们提出了各种提示策略来提升大模型的推理和规划能力，比如思维链、思维树和思维图谱。这些进步与工具集成一起，推动着通用 AI 智能体的发展，让它们现在已经能够用 LLM 输出的决策策略来解决序列决策问...……更多

2024-11-09 09:53:00华为,结构化,推理,思维,结构,智能

英伟达开源NVLM 1.0屠榜多模态！纯文本性能不降反升

...例如，OCRBench）的性能，但与低分辨率版本模型相比，在推理相关任务（例如，MMMU）上的准确率却会下降。此外，虽然开源的多模态大模型在视觉-语言任务上取得了非常亮眼的基准测试结果，但在纯文本任务上的性能却有显著...……更多

2024-09-24 13:36:00英伟,模态,文本,性能,模态,模型

第一个100%开源的MoE大模型，7B的参数，1B的推理成本

...语言模型 (LM) 在各种任务上取得了重大进展，但在训练和推理方面，性能和成本之间仍然需要权衡。对于许多学者和开发人员来说，高性能的 LM 是无法访问的，因为它们的构建和部署成本过高。改善成本 - 性能的一种方法是使...……更多

2024-09-06 10:01:00推理,模型,成本,参数,模型,训练

“弱智吧”成最佳中文AI语料库，究竟什么算优质数据？

...解和处理各种场景和任务。干净合理是指数据要干净、无噪声，数据应该尽量减少错误与不合理的内容，确保数据的正确性。及时性是指数据可以随着时间推移持续扩充与更新。他表示，在一些专业领域，往往也需要一些带有对...……更多

2024-04-15 17:00:00语料库,语料,中文,数据,数据,模型

无一大模型及格！北大/通研院提出超难基准，评估长文本理解生

...的长依赖任务中的多信息检索、时间重排序、计算、理解推理能力表现均不乐观。比如像Claude3-200k，GPT4-32k、GPT4-8k、GPT3.5-turbo-6k、LlamaIndex这种商业模型，平均只有40%的准确率。而像开源模型表现就更不理想了…ChatGLM2-6B、LongLL……更多

2024-08-08 09:39:00基准,北大,生成,模型,文本,评估