推理,框架,模型,苹果,训练,语言头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

...，苹果在 Hugging Face 平台上发布了一个“具有开源训练和推理框架的高效语言模型”，名为 OpenELM。当然，这是一项开源语言模型，其源码及预训练的模型权重和训练配方可在苹果 Github 库中获取。IT之家将官方简介翻译如下：参...……更多

2024-04-25 09:24:00推理,框架,模型,苹果,训练,语言

Meta提出“可持续思维链”，让大模型在连续潜空间中推理

...ta 提出“可持续思维链”：让大语言模型在连续潜空间中推理GameArena：通过实时电脑游戏评估 LLM 推理想要第一时间获取每日最新大模型热门论文？点击阅读原文，查看「2024必读大模型论文」合集，以及申请加入「大模型技术...……更多

2024-12-13 09:19:00推理,模型,思维,空间,模型,生成

苹果开源7B模型，训练过程数据集一口气全给了，网友：很不像苹

...CLM-Baseline取得了更高的平均分，且在ARC（小学生科学问题推理）、HellaSwag（常识推理）、MMLU等任务上表现更好。 “小”模型成新趋势回到开头，“小”模型最近已成新趋势。先是HuggingFace推出了小模型家族“SmolLM”，其中包含1...……更多

2024-07-23 09:33:00苹果,一口,模型,一口气,训练,过程

给小学数学题加句废话，OpenAI o1就翻车了，苹果论文质

苹果新论文：AI 大模型可能不会推理。AI 大模型（LLM）真的像我们理解的那样能「思考」或「推理」吗？最近，苹果的一篇论文探讨了这个问题，并且给出了一个倾向于「否」的答案。相关帖子被很多人围观。这篇题为「GSM-Symb...……更多

2024-10-14 09:55:00数学题,推理,废话,苹果,数学,小学

全模态对齐框架align-anything来啦：实现跨模态指

...-Vision-11B 既准确地识别出了餐厅，还提供了细致的思考与推理过程。在 Meta 并未披露 Llama-3.2-11B-Vision-Instruct 对齐技术细节情况下，北大对齐小组愿开源数据、训练、模型、评估的全流程，为全模态对齐研究贡献力量。对齐框架...……更多

2024-10-18 09:47:00模态,指令,框架,模态,模型,数据

首个o1复现开源RL框架OpenR来了，UCL、上交等高校联

...湖大学工学院助理教授（研究）杨林易。o1 作为 OpenAI 在推理领域的最新模型，大幅度提升了 GPT-4o 在推理任务上的表现，甚至超过了平均人类水平。o1 背后的技术到底是什么？OpenAI 技术报告中所强调的强化学习和推断阶段的 Sca...……更多

2024-10-15 09:56:00框架,团队,联合,模型,过程,步骤

清华团队提出大模型“密度定律”；足球领域首个视觉语言基础模型

...交视觉-语言-动作建模框架RevThink：使用逆向思维增强 LLM 推理想要第一时间获取每日最新大模型热门论文？点击阅读原文，查看「2024必读大模型论文」合集，以及申请加入「大模型技术分享群」。SwiftEdit：50 倍速文本引导图像...……更多

2024-12-10 09:53:00模型,语言基础,清华,定律,密度,团队

苹果的封闭生态为大模型打开！发布开源多模态大模型、每天为 A

...布了两篇新的研究论文，介绍了 3D 头像和高效语言模型推理的新技术，被认为可能带来更身临其境的视觉体验，并允许复杂的人工智能系统在 iPhone 和 iPad 等消费设备上运行。 AI 社区中的许多人后来才注意到 Ferret 的发布，他...……更多

2023-12-26 14:06:00模型,生态,模态,零碎,苹果,模型

百川智能发布baichuan3稳定语言模型

...处理和代码生成领域的强大实力。不仅如此，其在对逻辑推理能力及专业性要求极高的MCMLE、MedExam、CMExam等权威医疗评测上的中文效果同样超过了GPT-4，是中文医疗任务表现最佳的大模型。Baichuan3还突破“迭代式强化学习”技术...……更多

2024-01-29 19:57:00百川,模型,语言,智能,模型,百川

混合架构赋予AI人类推理能力

...AI)系统在编码、战略规划和机器人科学三个领域执行复杂推理任务。聊天生成预训练转换器(ChatGPT)和“克劳德3-奥普斯”(Claude 3 Opus)等大语言模型(LLM)，根据人类输入“提示词”处理和生成文本。研究人员说，过去18个月，这些技...……更多

2024-06-12 18:15:00推理,架构,混合,人类,能力,语言

姚期智院士大模型新研究：思维图DoT，用数学理论确保AI逻辑

姚期智院士领衔，推出大模型新推理框架，CoT“王冠”戴不住了。提出思维图（DiagramofThought），让大模型思考更像人类。团队更是为这种推理过程提供了数学基础，通过拓扑斯理论（Topos Theory）正式化（formalize）DoT，确保其逻...……更多

2024-09-24 13:36:00维图,院士,逻辑,模型,一致,理论

苹果大模型，不藏了

...存中的大型语言模型：在有限内存下高效的大型语言模型推理》的论文，直指大模型落地iPhone等“内存有限”设备的方法。进入新年，Siri助手将搭载生成式模型Ajax的消息，再次不胫而走。去年六月和九月的两次重要发布会，苹...……更多

2024-01-06 09:10:00模型,苹果,模型,苹果,数据,处理

苹果让大模型学会偷懒：更快吐出第一个token，准确度还保住

...小的 8B 版本可能也依然会有明显延迟。为了提升模型的推理效率，研究者想出了多种多样的方法，但其中很多都会让模型牺牲一些准确度。近日，苹果和 Meta AI 的一个研究团队提出了一种新方法，可在保证准确度不明显下降的...……更多

2024-08-05 09:35:00准确度,更快,模型,苹果,缓存,模型

ICML2024演讲爆火!Meta朱泽园揭秘大模型内心世界:

...M) 是如何解数学题的？是通过模板记忆，还是真的学会了推理思维？模型的心算过程是怎样的？能学会怎样的推理技能？与人类相同，还是超越了人类？只学一种类型的数学题，是会对通用智能的发展产生帮助？LLM 为什么会犯...……更多

2024-08-06 09:27:00推理,模型,内心,人类,世界,模型

苹果AI登场，与OpenAI合作，Siri将采用GPT-4o

...Bootstrap3D 数据集已全面开源。北大博士生等全新 BoT 框架推理暴涨 70 倍，24 点图形推理一步成神：BoT 可有效提升 LLM 在多个任务上的性能，在 BoT 的加持下，Llama3-8B 在多项任务中的性能甚至超越了 Llama3-70B，且 BoT 的成本相对较...……更多

2024-06-11 09:00:00情报局,独角兽,情报,芯片,进展,苹果

本周硅谷发生了什么？｜苹果Vision Pro正式开售；Ne

...推出数据分析工具“办公小浣熊”面壁智能发布2B模型，推理成本仅为GPT-4的1/360科大讯飞发布全民开放大模型星火V3.5百川智能发布Baichuan 3大模型，更好理解中文阿里巴巴开发的自主多模态AI代理MobileAgent上线苹果Vision Pro正式在...……更多

2024-02-05 11:37:00硅谷,字节,接口,人类,苹果,模型

腾讯开源最大MoE大语言模型！3D大模型同时支持文/图生成，

...型，MoE模型在相同成本下效果更优，在相同规模下训练/推理成本更低，而且容量大，可训练更多数据。当前MoE的挑战有训练稳定性差、专家负载不均衡等。一些应对方案包括：1）Scaling Law探索，设计基于中小模型簇的MoE Scaling ...……更多

2024-11-06 09:41:00模型,腾讯,全家,生成,同时,语言

CMU清华教LLM练成数学高手，LeanSTaR训练模型边思

...办？CMU清华团队提出了Lean-STaR训练框架，在语言模型进行推理的每一步中都植入CoT，提升了模型的定理证明能力，成为miniF2F上的新SOTA。如果想训练LLM证明定理的能力，你会怎么做？既然模型可以通过海量语料学会生成文本，那...……更多

2024-08-10 09:47:00顶新,成数,清华,模型,训练,高手

突破时间序列组合推理难题！南加大发布一站式多步推理框架TS-

【新智元导读】TS-Reasoner是一个创新的多步推理框架，结合了大型语言模型的上下文学习和推理能力，通过程序化多步推理、模块化设计、自定义模块生成和多领域数据集评估，有效提高了复杂时间序列任务的推理能力和准确性...……更多

2024-10-29 09:55:00推理,时间序列,序列,框架,难题,突破

苹果AI震撼上线iPhone，进化版Siri却没有ChatG

...复适配器进行微调，它们不会产生任何额外的内存使用或推理成本。关于适配器的大小，团队发现秩为16的适配器在模型容量和推理性能之间提供了最佳平衡。然而，为了提供更多的灵活性，苹果提供了一套不同秩的精度恢复适...……更多

2024-08-01 09:40:00进化,模型,苹果,报告,技术,苹果

AI 的“心智理论”难题：Meta ExploreToM 探

...单的预定义场景，无法复制人类用来推断心理状态的复杂推理。ExploreToM 框架ExploreToM 通过生成多样化、可扩展的对抗性数据集，为提升 AI 的 ToM 能力奠定了坚实基础。该研究强调了当前模型的局限性，以及高质量训练数据对于...……更多

2024-12-21 09:27:00之路,心智,难题,突破,理论,模型

智能体不够聪明怎么办？清华&蚂蚁团队：让它像学徒一样持续学习

...出的巨大潜力，而这种潜力的核心基石正是智能体的复杂推理能力。与当下广受关注的 OpenAI-o1 及其追随者略有不同，大多数实用的 AI Agent 往往需要在特定场景下发挥作用。这种情况类似于普通人类：虽然不是每个人都需要具备...……更多

2024-12-11 09:53:00清华,学徒,蚂蚁,不够,团队,怎么办

苹果300亿参数大模型首亮相，还买了家AI公司｜焦点分析

...模有30亿、70亿、300亿三种大小，有图像识别和自然语言推理能力。其中，参与该论文的作者有30人，一半以上都是华人。 MM1测试效果不如Gemini和GPT4V和市面上其他大模型相比，MM1亮点并不在惊艳的效果上，也没有提出特别的技...……更多

2024-03-16 18:14:00模型,苹果,参数,焦点,分析,公司

苹果展示ferret-uiai系统可理解应用程序

...指令来设计的，以便于精确引用和接地。为了增强模型的推理能力，我们进一步编制了高级任务数据集，包括详细描述、感知/交互对话和功能推理。苹果在论文中表示相比较现有的GPT-4V，以及其它MLLMs模型，Ferret-UIAI模型更为优...……更多

2024-04-11 02:30:00应用程序,苹果,程序,应用,系统,模型

vivo发布自研大模型，为用户和开发者带来诸多惊喜

...能计算领域的探索与创新。他指出，大规模训练、高性能推理及海量算力治理是AI落地面临的三大挑战。为此，vivo构建了大模型工程体系，解决了大规模训练的问题，让模型能按天迭代;解决高性能推理的问题，能秒级生成图片;...……更多

2024-10-14 01:53:00开发者,模型,惊喜,用户,开发,模型

系统级玩家微软、苹果先后出牌，端侧大模型路径清晰了？

...MGSM（跨语言数学能力）提升 2.3%，而DROP（文本段落分析推理）则下降了 3%。但与此同时，杀手级应用仍未出现。根据第三方网站SimilarWeb的监测数据，早在去年6月，ChatGPT流量即已见顶，当月其网站与移动客户端的全球流量（PV）...……更多

2024-06-21 09:16:00微软,路径,模型,先后,苹果,玩家

模型即服务，卓世科技MaaS平台 2.0 正式上线

...。本次新上线了包括：模型训练新基座，支持模型训练、推理、量化、评测等功能。卓世科技MaaS平台是一款基于知识增强大模型的一站式行业模型训练开发平台。面向开发者和企业提供从基础算力服务、数据服务、模型训练服...……更多

2024-08-07 09:45:00模型,服务,平台,科技,模型,数据

苹果新论文证明LLM大模型存在缺陷！没有进行真正的逻辑推理

...tical Reasoning”的论文，揭示了大型语言模型（LLM）在数学推理方面的显著局限性。尽管这些模型在生成人类水平的文本方面表现出色，但当处理简单的数学问题时，即使问题仅进行了微小的改动，如添加无关信息，模型的表现也...……更多

2024-10-13 14:15:00逻辑推理,新论,推理,缺陷,逻辑,模型

推动大模型自我进化，北理工推出「流星雨计划」

...我进化的方式，解决代码模型在处理复杂问题时缺少中间推理过程。核心观点：自我进化的力量跟随上述自我进化的思想，在 SRA-MCTS（Self-guided MCTS-based data generation for Reasoning Augmentation）方法中，作者无需借助额外的任何监……更多

2024-12-06 09:52:00流星雨,进化,理工,流星,模型,模型