推理,框架,模型,苹果,训练,语言头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

...，苹果在 Hugging Face 平台上发布了一个“具有开源训练和推理框架的高效语言模型”，名为 OpenELM。当然，这是一项开源语言模型，其源码及预训练的模型权重和训练配方可在苹果 Github 库中获取。IT之家将官方简介翻译如下：参...……更多

2024-04-25 09:24:00推理,框架,模型,苹果,训练,语言

苹果开源7B模型，训练过程数据集一口气全给了，网友：很不像苹

...CLM-Baseline取得了更高的平均分，且在ARC（小学生科学问题推理）、HellaSwag（常识推理）、MMLU等任务上表现更好。 “小”模型成新趋势回到开头，“小”模型最近已成新趋势。先是HuggingFace推出了小模型家族“SmolLM”，其中包含1...……更多

2024-07-23 09:33:00苹果,一口,模型,一口气,训练,过程

给小学数学题加句废话，OpenAI o1就翻车了，苹果论文质

苹果新论文：AI 大模型可能不会推理。AI 大模型（LLM）真的像我们理解的那样能「思考」或「推理」吗？最近，苹果的一篇论文探讨了这个问题，并且给出了一个倾向于「否」的答案。相关帖子被很多人围观。这篇题为「GSM-Symb...……更多

2024-10-14 09:55:00数学题,推理,废话,苹果,数学,小学

全模态对齐框架align-anything来啦：实现跨模态指

...-Vision-11B 既准确地识别出了餐厅，还提供了细致的思考与推理过程。在 Meta 并未披露 Llama-3.2-11B-Vision-Instruct 对齐技术细节情况下，北大对齐小组愿开源数据、训练、模型、评估的全流程，为全模态对齐研究贡献力量。对齐框架...……更多

2024-10-18 09:47:00模态,指令,框架,模态,模型,数据

首个o1复现开源RL框架OpenR来了，UCL、上交等高校联

...湖大学工学院助理教授（研究）杨林易。o1 作为 OpenAI 在推理领域的最新模型，大幅度提升了 GPT-4o 在推理任务上的表现，甚至超过了平均人类水平。o1 背后的技术到底是什么？OpenAI 技术报告中所强调的强化学习和推断阶段的 Sca...……更多

2024-10-15 09:56:00框架,团队,联合,模型,过程,步骤

百川智能发布baichuan3稳定语言模型

...处理和代码生成领域的强大实力。不仅如此，其在对逻辑推理能力及专业性要求极高的MCMLE、MedExam、CMExam等权威医疗评测上的中文效果同样超过了GPT-4，是中文医疗任务表现最佳的大模型。Baichuan3还突破“迭代式强化学习”技术...……更多

2024-01-29 19:57:00百川,模型,语言,智能,模型,百川

混合架构赋予AI人类推理能力

...AI)系统在编码、战略规划和机器人科学三个领域执行复杂推理任务。聊天生成预训练转换器(ChatGPT)和“克劳德3-奥普斯”(Claude 3 Opus)等大语言模型(LLM)，根据人类输入“提示词”处理和生成文本。研究人员说，过去18个月，这些技...……更多

2024-06-12 18:15:00推理,架构,混合,人类,能力,语言

苹果的封闭生态为大模型打开！发布开源多模态大模型、每天为 A

...布了两篇新的研究论文，介绍了 3D 头像和高效语言模型推理的新技术，被认为可能带来更身临其境的视觉体验，并允许复杂的人工智能系统在 iPhone 和 iPad 等消费设备上运行。 AI 社区中的许多人后来才注意到 Ferret 的发布，他...……更多

2023-12-26 14:06:00模型,生态,模态,零碎,苹果,模型

姚期智院士大模型新研究：思维图DoT，用数学理论确保AI逻辑

姚期智院士领衔，推出大模型新推理框架，CoT“王冠”戴不住了。提出思维图（DiagramofThought），让大模型思考更像人类。团队更是为这种推理过程提供了数学基础，通过拓扑斯理论（Topos Theory）正式化（formalize）DoT，确保其逻...……更多

2024-09-24 13:36:00维图,院士,逻辑,模型,一致,理论

苹果大模型，不藏了

...存中的大型语言模型：在有限内存下高效的大型语言模型推理》的论文，直指大模型落地iPhone等“内存有限”设备的方法。进入新年，Siri助手将搭载生成式模型Ajax的消息，再次不胫而走。去年六月和九月的两次重要发布会，苹...……更多

2024-01-06 09:10:00模型,苹果,模型,苹果,数据,处理

苹果让大模型学会偷懒：更快吐出第一个token，准确度还保住

...小的 8B 版本可能也依然会有明显延迟。为了提升模型的推理效率，研究者想出了多种多样的方法，但其中很多都会让模型牺牲一些准确度。近日，苹果和 Meta AI 的一个研究团队提出了一种新方法，可在保证准确度不明显下降的...……更多

2024-08-05 09:35:00准确度,更快,模型,苹果,缓存,模型

ICML2024演讲爆火!Meta朱泽园揭秘大模型内心世界:

...M) 是如何解数学题的？是通过模板记忆，还是真的学会了推理思维？模型的心算过程是怎样的？能学会怎样的推理技能？与人类相同，还是超越了人类？只学一种类型的数学题，是会对通用智能的发展产生帮助？LLM 为什么会犯...……更多

2024-08-06 09:27:00推理,模型,内心,人类,世界,模型

苹果AI登场，与OpenAI合作，Siri将采用GPT-4o

...Bootstrap3D 数据集已全面开源。北大博士生等全新 BoT 框架推理暴涨 70 倍，24 点图形推理一步成神：BoT 可有效提升 LLM 在多个任务上的性能，在 BoT 的加持下，Llama3-8B 在多项任务中的性能甚至超越了 Llama3-70B，且 BoT 的成本相对较...……更多

2024-06-11 09:00:00情报局,独角兽,情报,芯片,进展,苹果

本周硅谷发生了什么？｜苹果Vision Pro正式开售；Ne

...推出数据分析工具“办公小浣熊”面壁智能发布2B模型，推理成本仅为GPT-4的1/360科大讯飞发布全民开放大模型星火V3.5百川智能发布Baichuan 3大模型，更好理解中文阿里巴巴开发的自主多模态AI代理MobileAgent上线苹果Vision Pro正式在...……更多

2024-02-05 11:37:00硅谷,字节,接口,人类,苹果,模型

腾讯开源最大MoE大语言模型！3D大模型同时支持文/图生成，

...型，MoE模型在相同成本下效果更优，在相同规模下训练/推理成本更低，而且容量大，可训练更多数据。当前MoE的挑战有训练稳定性差、专家负载不均衡等。一些应对方案包括：1）Scaling Law探索，设计基于中小模型簇的MoE Scaling ...……更多

2024-11-06 09:41:00模型,腾讯,全家,生成,同时,语言

CMU清华教LLM练成数学高手，LeanSTaR训练模型边思

...办？CMU清华团队提出了Lean-STaR训练框架，在语言模型进行推理的每一步中都植入CoT，提升了模型的定理证明能力，成为miniF2F上的新SOTA。如果想训练LLM证明定理的能力，你会怎么做？既然模型可以通过海量语料学会生成文本，那...……更多

2024-08-10 09:47:00顶新,成数,清华,模型,训练,高手

突破时间序列组合推理难题！南加大发布一站式多步推理框架TS-

【新智元导读】TS-Reasoner是一个创新的多步推理框架，结合了大型语言模型的上下文学习和推理能力，通过程序化多步推理、模块化设计、自定义模块生成和多领域数据集评估，有效提高了复杂时间序列任务的推理能力和准确性...……更多

2024-10-29 09:55:00推理,时间序列,序列,框架,难题,突破

苹果AI震撼上线iPhone，进化版Siri却没有ChatG

...复适配器进行微调，它们不会产生任何额外的内存使用或推理成本。关于适配器的大小，团队发现秩为16的适配器在模型容量和推理性能之间提供了最佳平衡。然而，为了提供更多的灵活性，苹果提供了一套不同秩的精度恢复适...……更多

2024-08-01 09:40:00进化,模型,苹果,报告,技术,苹果

苹果300亿参数大模型首亮相，还买了家AI公司｜焦点分析

...模有30亿、70亿、300亿三种大小，有图像识别和自然语言推理能力。其中，参与该论文的作者有30人，一半以上都是华人。 MM1测试效果不如Gemini和GPT4V和市面上其他大模型相比，MM1亮点并不在惊艳的效果上，也没有提出特别的技...……更多

2024-03-16 18:14:00模型,苹果,参数,焦点,分析,公司

苹果展示ferret-uiai系统可理解应用程序

...指令来设计的，以便于精确引用和接地。为了增强模型的推理能力，我们进一步编制了高级任务数据集，包括详细描述、感知/交互对话和功能推理。苹果在论文中表示相比较现有的GPT-4V，以及其它MLLMs模型，Ferret-UIAI模型更为优...……更多

2024-04-11 02:30:00应用程序,苹果,程序,应用,系统,模型

vivo发布自研大模型，为用户和开发者带来诸多惊喜

...能计算领域的探索与创新。他指出，大规模训练、高性能推理及海量算力治理是AI落地面临的三大挑战。为此，vivo构建了大模型工程体系，解决了大规模训练的问题，让模型能按天迭代;解决高性能推理的问题，能秒级生成图片;...……更多

2024-10-14 01:53:00开发者,模型,惊喜,用户,开发,模型

模型即服务，卓世科技MaaS平台 2.0 正式上线

...。本次新上线了包括：模型训练新基座，支持模型训练、推理、量化、评测等功能。卓世科技MaaS平台是一款基于知识增强大模型的一站式行业模型训练开发平台。面向开发者和企业提供从基础算力服务、数据服务、模型训练服...……更多

2024-08-07 09:45:00模型,服务,平台,科技,模型,数据

系统级玩家微软、苹果先后出牌，端侧大模型路径清晰了？

...MGSM（跨语言数学能力）提升 2.3%，而DROP（文本段落分析推理）则下降了 3%。但与此同时，杀手级应用仍未出现。根据第三方网站SimilarWeb的监测数据，早在去年6月，ChatGPT流量即已见顶，当月其网站与移动客户端的全球流量（PV）...……更多

2024-06-21 09:16:00微软,路径,模型,先后,苹果,玩家

让大模型能听会说,国内机构开源首个端到端语音对话模型Mini

...交互能力的核心是模型能够直接在语音模态上进行理解和推理，这与传统的语音对话功能有本质的不同。现有的语音对话系统中主要包含 3 个过程：首先将输入语音内容转换为文本，其次利用大语言模型进行文本推理，最后利用...……更多

2024-09-07 09:44:00模型,语音,对话,机构,语音,文本

苹果新论文证明LLM大模型存在缺陷！没有进行真正的逻辑推理

...tical Reasoning”的论文，揭示了大型语言模型（LLM）在数学推理方面的显著局限性。尽管这些模型在生成人类水平的文本方面表现出色，但当处理简单的数学问题时，即使问题仅进行了微小的改动，如添加无关信息，模型的表现也...……更多

2024-10-13 14:15:00逻辑推理,新论,推理,缺陷,逻辑,模型

北大推出全新机器人多模态大模型！面向通用和机器人场景的高效推

...码仓库 Trending Research 第一位。为了赋予机器人端到端的推理和操纵能力，本文创新性地将视觉编码器与高效的状态空间语言模型集成，构建了全新的 RoboMamba 多模态大模型，使其具备视觉常识任务和机器人相关任务的推理能力，...……更多

2024-06-21 09:52:00机器,模态,人多,机器人,推理,北大

苹果发布mm1.5-ui模型

...从10亿到300亿的多种参数规模，拥有图像识别和自然语言推理能力。在新版本中，苹果公司的研发人员改进了数据混合策略，极大地增强了模型在多文本图像理解、视觉引用与定位以及多图像推理等方面的能力。参考论文可知，...……更多

2024-10-13 10:57:00模型,苹果,模型,苹果公司,数据,苹果

英伟达地表最强，黄教主被称作AI界“霉霉”

...来支持高达10万亿参数的AI模型训练和大语言模型的实时推理。有望在数据处理、工程模拟、电子设计自动化、计算机辅助药物设计、量子计算和生成人工智能等领域实现新的突破。用黄仁勋的原话来说，它就是“当今世界上最...……更多

2024-03-19 11:56:00英伟,地表,教主,英伟,模型,人工智能

小红书技术副总裁王晓博：大模型让AI越来越像人，更懂小红书的

...数据对用户和内容进行建模，会导致新笔记分发难，缺乏推理能力导致信息茧房等问题。在小红书的推荐系统中，率先将大模型作为笔记的语义编码器来使用，通过语义压缩提示词（prompt）结合对比学习技术，让大模型能够把笔...……更多

2024-07-08 14:43:00小红,越来,副总,模型,越来越,内容

$免训练大模型知识编辑，吸收新数据更高效｜EMNLP\\\'24$

免训练大模型知识编辑，吸收新数据更高效｜EMNLP\'24

...的连续提示学习新方法，可以提高知识终身学习的编辑和推理效率。模型编辑旨在纠正大语言模型中过时或错误的知识，同时不需要昂贵的代价进行再训练。终身模型编辑是满足LLM持续编辑要求的最具挑战性的任务。之前的工作...……更多

2024-10-30 09:57:00模型,训练,知识,数据,模型,知识

page 1/1334 首页上一页 12 3 4 5 6 下一页末页

更多关于科技的资讯：

Roxtec电缆和管道密封技术赋能济南地下管廊为城市生命线

随着城市化的快速发展，地下综合管廊已成为城市运转不可或缺的“隐形动脉”，承担着输送能源与信息的重要任务。济南市工业北路沿线工厂众多

2025-01-03 19:52:00

华为鸿蒙next5.0来袭，新增应用锁功能

每次提到手机系统的时候，原生鸿蒙就被提及，原因是其证明了中国人独立自主、自力更生的强大精神力量，这也是华为品牌影响力能够得到很大幅度提升的关键

2025-01-03 19:58:00

司东海：电商运营模式差异决定补贴受益程度

中新经纬1月3日电题：电商运营模式差异决定补贴受益程度作者司东海巨丰投顾高级投资顾问1月3日上午，国务院新闻办公室举行“中国经济高质量发展成效”系列新闻发布会

2025-01-03 20:57:00

得物App开放日活动，身临其境体验正品保障全流程

如今，线上购物已成为人们日常生活不可或缺的一部分，而如何在海量商品中甄选出真正值得信赖的正品，成为了每一位消费者关注的焦点

2025-01-03 21:14:00

挥杆结缘品味清雅: 国缘V9高尔夫赛事成功营销案例复盘

近日，白酒行业在经济复苏与消费场景恢复的推动下稳步发展，高端白酒市场竞争愈发激烈。在此背景下，今世缘酒业的国缘V9凭借独特的高尔夫赛事营销项目成功突围

2025-01-03 21:49:00

又一位安徽餐饮老板要IPO，老乡鸡9个月收入近50亿，有望成

快餐的生意越来越不好做。紧随小菜园，又一安徽餐饮品牌冲击港交所，这次是老乡鸡。撤回上交所主板上市申请近1年半后，1月3日

2025-01-03 22:14:00

美国科研新突破：抗老“神器”PSSOPP诞生，掀起社会热议浪

长生不老，这一人类亘古以来的梦想，正逐渐在科学的助力下变为现实。全球顶尖的研发机构纷纷投入大量的人才和资源，致力于寻找青春永驻的秘诀

2025-01-03 17:01:00

与拜耳分手自建销售团队，糖尿病市场老将陆宇加盟华领医药，华堂

华领医药组建销售团队。 2025年开年，华领医药（02552.HK）组建销售团队有了新进展。1月1日，华领医药对外宣布

2025-01-03 17:13:00

7000mAh超大电池！真我Neo7限时回归首销价：2099

快科技1月3日消息，在今天下午的不良人限定版发布会上，真我Neo7宣布限时重回首销价，2099元起。这是目前2K档最热门的机型之一

2025-01-03 17:14:00

国漫典藏级定制！真我Neo7《画江湖之不良人》限定礼盒发布：

快科技1月3日消息，今天下午，真我Neo7《画江湖之不良人》限定版礼盒正式发布，售价2899元（16GB+512GB）

2025-01-03 17:14:00

老外评PS5十大年度游戏：《宇宙机器人》强势夺冠《黑神话》

PushSquare之前曾开启过“2024年十大PS5游戏”的用户投票，每名玩家最多可以为五款游戏投票，共计12652有效票数

2025-01-03 17:14:00

499元配置良心！王腾：REDMI 14C没做任何宣传的情况

快科技1月3日消息，日前，REDMI百元入门新机——REDMI 14C发布，起售价仅499元，新机配置十分良心，不仅有120Hz高刷新率屏幕

2025-01-03 17:15:00

男子利用小程序Bug逃匿28万加油费：获刑4年

1月3日消息，日常生活中确实会有不少“聪明人”，善于发现利用一些漏洞来为自己谋私利，然而这种行为往往会给自己带来严重的后果

2025-01-03 17:15:00

数智赋能医保服务渤海银行荣获国家医保局“医保码优秀合作伙伴

近日，国家医疗保障局（以下简称“国家医保局”）在北京举办“五年筑基智启未来”医保码五周年活动，渤海银行股份有限公司（以下简称“渤海银行”）受邀参加并荣获“医保码优秀合作伙伴”证书

2025-01-03 17:20:00

李毅中：产业数字化转型要走深向实做优

本文转自：人民网人民网北京1月3日电（记者王震）2024年12月29日，由国家制造强国建设战略咨询委员会指导，中国工业经济联合会联合十多家全国性行业联合会（协会）共同举办

2025-01-03 17:36:00

头条订阅服务