推理,框架,模型,苹果,训练,语言头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

...，苹果在 Hugging Face 平台上发布了一个“具有开源训练和推理框架的高效语言模型”，名为 OpenELM。当然，这是一项开源语言模型，其源码及预训练的模型权重和训练配方可在苹果 Github 库中获取。IT之家将官方简介翻译如下：参...……更多

2024-04-25 09:24:00推理,框架,模型,苹果,训练,语言

苹果开源7B模型，训练过程数据集一口气全给了，网友：很不像苹

...CLM-Baseline取得了更高的平均分，且在ARC（小学生科学问题推理）、HellaSwag（常识推理）、MMLU等任务上表现更好。 “小”模型成新趋势回到开头，“小”模型最近已成新趋势。先是HuggingFace推出了小模型家族“SmolLM”，其中包含1...……更多

2024-07-23 09:33:00苹果,一口,模型,一口气,训练,过程

给小学数学题加句废话，OpenAI o1就翻车了，苹果论文质

苹果新论文：AI 大模型可能不会推理。AI 大模型（LLM）真的像我们理解的那样能「思考」或「推理」吗？最近，苹果的一篇论文探讨了这个问题，并且给出了一个倾向于「否」的答案。相关帖子被很多人围观。这篇题为「GSM-Symb...……更多

2024-10-14 09:55:00数学题,推理,废话,苹果,数学,小学

全模态对齐框架align-anything来啦：实现跨模态指

...-Vision-11B 既准确地识别出了餐厅，还提供了细致的思考与推理过程。在 Meta 并未披露 Llama-3.2-11B-Vision-Instruct 对齐技术细节情况下，北大对齐小组愿开源数据、训练、模型、评估的全流程，为全模态对齐研究贡献力量。对齐框架...……更多

2024-10-18 09:47:00模态,指令,框架,模态,模型,数据

首个o1复现开源RL框架OpenR来了，UCL、上交等高校联

...湖大学工学院助理教授（研究）杨林易。o1 作为 OpenAI 在推理领域的最新模型，大幅度提升了 GPT-4o 在推理任务上的表现，甚至超过了平均人类水平。o1 背后的技术到底是什么？OpenAI 技术报告中所强调的强化学习和推断阶段的 Sca...……更多

2024-10-15 09:56:00框架,团队,联合,模型,过程,步骤

百川智能发布baichuan3稳定语言模型

...处理和代码生成领域的强大实力。不仅如此，其在对逻辑推理能力及专业性要求极高的MCMLE、MedExam、CMExam等权威医疗评测上的中文效果同样超过了GPT-4，是中文医疗任务表现最佳的大模型。Baichuan3还突破“迭代式强化学习”技术...……更多

2024-01-29 19:57:00百川,模型,语言,智能,模型,百川

混合架构赋予AI人类推理能力

...AI)系统在编码、战略规划和机器人科学三个领域执行复杂推理任务。聊天生成预训练转换器(ChatGPT)和“克劳德3-奥普斯”(Claude 3 Opus)等大语言模型(LLM)，根据人类输入“提示词”处理和生成文本。研究人员说，过去18个月，这些技...……更多

2024-06-12 18:15:00推理,架构,混合,人类,能力,语言

苹果的封闭生态为大模型打开！发布开源多模态大模型、每天为 A

...布了两篇新的研究论文，介绍了 3D 头像和高效语言模型推理的新技术，被认为可能带来更身临其境的视觉体验，并允许复杂的人工智能系统在 iPhone 和 iPad 等消费设备上运行。 AI 社区中的许多人后来才注意到 Ferret 的发布，他...……更多

2023-12-26 14:06:00模型,生态,模态,零碎,苹果,模型

姚期智院士大模型新研究：思维图DoT，用数学理论确保AI逻辑

姚期智院士领衔，推出大模型新推理框架，CoT“王冠”戴不住了。提出思维图（DiagramofThought），让大模型思考更像人类。团队更是为这种推理过程提供了数学基础，通过拓扑斯理论（Topos Theory）正式化（formalize）DoT，确保其逻...……更多

2024-09-24 13:36:00维图,院士,逻辑,模型,一致,理论

苹果大模型，不藏了

...存中的大型语言模型：在有限内存下高效的大型语言模型推理》的论文，直指大模型落地iPhone等“内存有限”设备的方法。进入新年，Siri助手将搭载生成式模型Ajax的消息，再次不胫而走。去年六月和九月的两次重要发布会，苹...……更多

2024-01-06 09:10:00模型,苹果,模型,苹果,数据,处理

苹果让大模型学会偷懒：更快吐出第一个token，准确度还保住

...小的 8B 版本可能也依然会有明显延迟。为了提升模型的推理效率，研究者想出了多种多样的方法，但其中很多都会让模型牺牲一些准确度。近日，苹果和 Meta AI 的一个研究团队提出了一种新方法，可在保证准确度不明显下降的...……更多

2024-08-05 09:35:00准确度,更快,模型,苹果,缓存,模型

ICML2024演讲爆火!Meta朱泽园揭秘大模型内心世界:

...M) 是如何解数学题的？是通过模板记忆，还是真的学会了推理思维？模型的心算过程是怎样的？能学会怎样的推理技能？与人类相同，还是超越了人类？只学一种类型的数学题，是会对通用智能的发展产生帮助？LLM 为什么会犯...……更多

2024-08-06 09:27:00推理,模型,内心,人类,世界,模型

苹果AI登场，与OpenAI合作，Siri将采用GPT-4o

...Bootstrap3D 数据集已全面开源。北大博士生等全新 BoT 框架推理暴涨 70 倍，24 点图形推理一步成神：BoT 可有效提升 LLM 在多个任务上的性能，在 BoT 的加持下，Llama3-8B 在多项任务中的性能甚至超越了 Llama3-70B，且 BoT 的成本相对较...……更多

2024-06-11 09:00:00情报局,独角兽,情报,芯片,进展,苹果

本周硅谷发生了什么？｜苹果Vision Pro正式开售；Ne

...推出数据分析工具“办公小浣熊”面壁智能发布2B模型，推理成本仅为GPT-4的1/360科大讯飞发布全民开放大模型星火V3.5百川智能发布Baichuan 3大模型，更好理解中文阿里巴巴开发的自主多模态AI代理MobileAgent上线苹果Vision Pro正式在...……更多

2024-02-05 11:37:00硅谷,字节,接口,人类,苹果,模型

腾讯开源最大MoE大语言模型！3D大模型同时支持文/图生成，

...型，MoE模型在相同成本下效果更优，在相同规模下训练/推理成本更低，而且容量大，可训练更多数据。当前MoE的挑战有训练稳定性差、专家负载不均衡等。一些应对方案包括：1）Scaling Law探索，设计基于中小模型簇的MoE Scaling ...……更多

2024-11-06 09:41:00模型,腾讯,全家,生成,同时,语言

CMU清华教LLM练成数学高手，LeanSTaR训练模型边思

...办？CMU清华团队提出了Lean-STaR训练框架，在语言模型进行推理的每一步中都植入CoT，提升了模型的定理证明能力，成为miniF2F上的新SOTA。如果想训练LLM证明定理的能力，你会怎么做？既然模型可以通过海量语料学会生成文本，那...……更多

2024-08-10 09:47:00顶新,成数,清华,模型,训练,高手

突破时间序列组合推理难题！南加大发布一站式多步推理框架TS-

【新智元导读】TS-Reasoner是一个创新的多步推理框架，结合了大型语言模型的上下文学习和推理能力，通过程序化多步推理、模块化设计、自定义模块生成和多领域数据集评估，有效提高了复杂时间序列任务的推理能力和准确性...……更多

2024-10-29 09:55:00推理,时间序列,序列,框架,难题,突破

苹果AI震撼上线iPhone，进化版Siri却没有ChatG

...复适配器进行微调，它们不会产生任何额外的内存使用或推理成本。关于适配器的大小，团队发现秩为16的适配器在模型容量和推理性能之间提供了最佳平衡。然而，为了提供更多的灵活性，苹果提供了一套不同秩的精度恢复适...……更多

2024-08-01 09:40:00进化,模型,苹果,报告,技术,苹果

苹果展示ferret-uiai系统可理解应用程序

...指令来设计的，以便于精确引用和接地。为了增强模型的推理能力，我们进一步编制了高级任务数据集，包括详细描述、感知/交互对话和功能推理。苹果在论文中表示相比较现有的GPT-4V，以及其它MLLMs模型，Ferret-UIAI模型更为优...……更多

2024-04-11 02:30:00应用程序,苹果,程序,应用,系统,模型

苹果300亿参数大模型首亮相，还买了家AI公司｜焦点分析

...模有30亿、70亿、300亿三种大小，有图像识别和自然语言推理能力。其中，参与该论文的作者有30人，一半以上都是华人。 MM1测试效果不如Gemini和GPT4V和市面上其他大模型相比，MM1亮点并不在惊艳的效果上，也没有提出特别的技...……更多

2024-03-16 18:14:00模型,苹果,参数,焦点,分析,公司

vivo发布自研大模型，为用户和开发者带来诸多惊喜

...能计算领域的探索与创新。他指出，大规模训练、高性能推理及海量算力治理是AI落地面临的三大挑战。为此，vivo构建了大模型工程体系，解决了大规模训练的问题，让模型能按天迭代;解决高性能推理的问题，能秒级生成图片;...……更多

2024-10-14 01:53:00开发者,模型,惊喜,用户,开发,模型

模型即服务，卓世科技MaaS平台 2.0 正式上线

...。本次新上线了包括：模型训练新基座，支持模型训练、推理、量化、评测等功能。卓世科技MaaS平台是一款基于知识增强大模型的一站式行业模型训练开发平台。面向开发者和企业提供从基础算力服务、数据服务、模型训练服...……更多

2024-08-07 09:45:00模型,服务,平台,科技,模型,数据

系统级玩家微软、苹果先后出牌，端侧大模型路径清晰了？

...MGSM（跨语言数学能力）提升 2.3%，而DROP（文本段落分析推理）则下降了 3%。但与此同时，杀手级应用仍未出现。根据第三方网站SimilarWeb的监测数据，早在去年6月，ChatGPT流量即已见顶，当月其网站与移动客户端的全球流量（PV）...……更多

2024-06-21 09:16:00微软,路径,模型,先后,苹果,玩家

让大模型能听会说,国内机构开源首个端到端语音对话模型Mini

...交互能力的核心是模型能够直接在语音模态上进行理解和推理，这与传统的语音对话功能有本质的不同。现有的语音对话系统中主要包含 3 个过程：首先将输入语音内容转换为文本，其次利用大语言模型进行文本推理，最后利用...……更多

2024-09-07 09:44:00模型,语音,对话,机构,语音,文本

苹果新论文证明LLM大模型存在缺陷！没有进行真正的逻辑推理

...tical Reasoning”的论文，揭示了大型语言模型（LLM）在数学推理方面的显著局限性。尽管这些模型在生成人类水平的文本方面表现出色，但当处理简单的数学问题时，即使问题仅进行了微小的改动，如添加无关信息，模型的表现也...……更多

2024-10-13 14:15:00逻辑推理,新论,推理,缺陷,逻辑,模型

北大推出全新机器人多模态大模型！面向通用和机器人场景的高效推

...码仓库 Trending Research 第一位。为了赋予机器人端到端的推理和操纵能力，本文创新性地将视觉编码器与高效的状态空间语言模型集成，构建了全新的 RoboMamba 多模态大模型，使其具备视觉常识任务和机器人相关任务的推理能力，...……更多

2024-06-21 09:52:00机器,模态,人多,机器人,推理,北大

苹果发布mm1.5-ui模型

...从10亿到300亿的多种参数规模，拥有图像识别和自然语言推理能力。在新版本中，苹果公司的研发人员改进了数据混合策略，极大地增强了模型在多文本图像理解、视觉引用与定位以及多图像推理等方面的能力。参考论文可知，...……更多

2024-10-13 10:57:00模型,苹果,模型,苹果公司,数据,苹果

英伟达地表最强，黄教主被称作AI界“霉霉”

...来支持高达10万亿参数的AI模型训练和大语言模型的实时推理。有望在数据处理、工程模拟、电子设计自动化、计算机辅助药物设计、量子计算和生成人工智能等领域实现新的突破。用黄仁勋的原话来说，它就是“当今世界上最...……更多

2024-03-19 11:56:00英伟,地表,教主,英伟,模型,人工智能

小红书技术副总裁王晓博：大模型让AI越来越像人，更懂小红书的

...数据对用户和内容进行建模，会导致新笔记分发难，缺乏推理能力导致信息茧房等问题。在小红书的推荐系统中，率先将大模型作为笔记的语义编码器来使用，通过语义压缩提示词（prompt）结合对比学习技术，让大模型能够把笔...……更多

2024-07-08 14:43:00小红,越来,副总,模型,越来越,内容

$免训练大模型知识编辑，吸收新数据更高效｜EMNLP\\\'24$

免训练大模型知识编辑，吸收新数据更高效｜EMNLP\'24

...的连续提示学习新方法，可以提高知识终身学习的编辑和推理效率。模型编辑旨在纠正大语言模型中过时或错误的知识，同时不需要昂贵的代价进行再训练。终身模型编辑是满足LLM持续编辑要求的最具挑战性的任务。之前的工作...……更多

2024-10-30 09:57:00模型,训练,知识,数据,模型,知识

page 1/1334 首页上一页 12 3 4 5 6 下一页末页

更多关于科技的资讯：

小米SU7冬季进店福利：18项免费车辆检测防冻液、玻璃水免

快科技12月14日消息，小米SU7宣布推出冬季进店免费服务活动，限时从12月16日至2025年1月26日。在此期间，小米SU7车主可享受18项免费车辆检测

2024-12-14 16:47:00

小鹏汇天：飞行汽车2026年量产交付先飞码用户尝鲜起飞

快科技12月14日消息，小鹏汇天今日在上海陆家嘴举办了“陆地航母”飞行汽车首飞活动。创始人、总裁赵德力中表示，预计在2025年第三季度

2024-12-14 16:47:00

决胜四季度打好收官战丨湖北新耀：扩产能提质效加班加点忙生

十堰广电讯（郧西县融媒记者王琴）岁末年尾，十堰企业坚持国际国内市场“双轮驱动”，全力以赴抓订单、拓市场，开足马力忙生产

2024-12-14 17:05:00

微星48.9英寸带鱼屏旗舰显示器国内上市

12月13日消息，微星宣布旗下型号为491CQPX的48.9英寸带鱼屏旗舰显示器现已在国内上市，这款显示器采用双2K240Hz规格

2024-12-14 17:09:00

森强金融：创新服务模式，铸就金融服务卓越品牌

在当前金融行业动态不断变化的背景下，金融服务市场正日益呈现出多元化的发展态势。随着经济的发展和人们对资金需求的日益增长

2024-12-14 17:14:00

「面对面」Talk局：OPPO广告携手金融行业客户共话新机遇

营销的变化,在数字时代的浪潮效应下,总是显得日新月异。大家都在为提升增长的双效而绞尽脑汁,大到行业方法,小到产品实操和投放

2024-12-14 17:14:00

周鸿祎：95%以上的中国电脑安装了360

快科技12月14日消息，今年7月，微软蓝屏事件被记录为史上最严重的IT系统崩溃。此次事件由杀毒软件更新触发，导致全球超过20个国家的逾千万Windows设备陷入瘫痪

2024-12-14 17:17:00

《耳语的世界》开启限免：好评率75%

12月13日消息，游戏《TheWhisperedWorld：SpecialEdition》现已在GOG平台开启限免活动

2024-12-14 17:28:00

医日健品牌升级发布会：智联健康丨数绘蓝图

2024年12月11日，在上海陆家嘴CBD有着蓝宝石一称的金融信息中心三楼上海厅，一场聚焦数字医疗健康领域创新发展的盛会——上海医日健品牌升级发布会隆重举行

2024-12-14 18:12:00

区间测速终点前龟速行驶惨被撞司机：前面跑太快、怕被抓拍

快科技12月14日消息，经常跑高速的朋友对区间测速并不陌生，它是指检测机动车通过两个相邻测速监控点之间的路段（测速区间）的平均速率的方法

2024-12-14 18:17:00

同济大学张玉臣：原创性、颠覆性的科技创新培育和塑造新兴产业｜

【宅男财经·从重磅会议看商机】中央经济工作会议确定，以科技创新引领新质生产力发展，建设现代化产业体系；开展“人工智能+”行动

2024-12-14 18:20:00

1.3万极越车主再吃定心丸百度集团副总裁：兜底智驾和地图导

快科技12月14日消息，极越汽车闪崩一事有了进一步的发展，今日下午，百度集团副总裁、智能驾驶事业群组总裁王云鹏发表了朋友圈

2024-12-14 18:47:00

投资12亿元山西亚鑫煤化工项目核心装置试车成功

12月14日消息，山西亚鑫融科新材料有限公司高端电子新材料项目迎来重要里程碑——DMC(碳酸二甲酯)循环气压缩机一次性试车成功

2024-12-14 19:04:00

能玩3A游戏的全能本！无界15 Pro国补到手仅3199元

快科技12月14日消息，机械革命无界15 Pro全能本原价3999元，国补到手仅3199.2元。无界15 Pro轻薄本搭载ZEN4架构的锐龙7 8745HS处理器

2024-12-14 19:17:00

蔚来法务部：因散播谣言三人已被行拘、含某汽车品牌两员工

快科技12月14日消息，蔚来汽车法务部今日发布消息称，蔚来已对恶意造谣人员提起诉讼。法务部表示：11月底，在微博、抖音

2024-12-14 19:17:00

头条订阅服务