• 我的订阅
  • 头条热搜
Meta提出“可持续思维链”,让大模型在连续潜空间中推理
...ta 提出“可持续思维链”:让大语言模型在连续潜空间中推理GameArena:通过实时电脑游戏评估 LLM 推理想要第一时间获取每日最新大模型热门论文? 点击阅读原文,查看「2024必读大模型论文」合集,以及申请加入「大模型技术...……更多
ICML2024演讲爆火!Meta朱泽园揭秘大模型内心世界:不同于人类推理
...M) 是如何解数学题的?是通过模板记忆,还是真的学会了推理思维?模型的心算过程是怎样的?能学会怎样的推理技能?与人类相同,还是超越了人类?只学一种类型的数学题,是会对通用智能的发展产生帮助?LLM 为什么会犯...……更多
语言≠思维,大模型学不了推理:一篇Nature让AI社区炸锅了
...到,人类大脑生成和解析语言的神经网络并不负责形式化推理,而且提出推理并不需要语言作为媒介。这篇论文声称「语言主要是用于交流的工具,而不是思考的工具,对于任何经过测试的思维形式都不是必需的」,引发了科技...……更多
CMU清华教LLM练成数学高手,LeanSTaR训练模型边思考边证明,登顶新SOTA
...办?CMU清华团队提出了Lean-STaR训练框架,在语言模型进行推理的每一步中都植入CoT,提升了模型的定理证明能力,成为miniF2F上的新SOTA。如果想训练LLM证明定理的能力,你会怎么做?既然模型可以通过海量语料学会生成文本,那...……更多
清华团队提出大模型“密度定律”;足球领域首个视觉语言基础模型
...交视觉-语言-动作建模框架RevThink:使用逆向思维增强 LLM 推理想要第一时间获取每日最新大模型热门论文? 点击阅读原文,查看「2024必读大模型论文」合集,以及申请加入「大模型技术分享群」。SwiftEdit:50 倍速文本引导图像...……更多
OpenAI o1模型到博士水平了?复旦教授:没有真正推理能力,学到的还是概率相关性
...小尺寸版o1-mini。OpenAI官方发文称,新模型旨在解决复杂推理问题,训练模型在响应之前花更多时间思考,类似于人类的思考方式。“新模型在推理能力上代表了AI能力的新水平。”OpenAI称,该模型可以解决科学、编程和数学等更...……更多
奥林匹克竞赛里选最聪明的AI:Claude-3.5-Sonnet vs. GPT-4o?
...异,近来Anthropic公司最新发布的Claude-3.5-Sonnet因在知识型推理、数学推理、编程任务及视觉推理等任务上设立新行业基准而引发广泛讨论:Claude-3.5-Sonnet 已经取代OpenAI的GPT4o成为世界上”最聪明的AI“(Most Intelligent AI)了……更多
思维链让大模型推理更准确?谷歌早于OpenAI押中o1模型核心原理
...本质的不同。其不仅进入到复杂的领域,还表现出超强的推理能力。OpenAI 将 GPT-4o 和 o1 在国际数学奥林匹克竞赛资格考试方面进行对比测试。根据结果,二者差异显著,其中,前者正确解决问题的准确率是 13.4%,而 o1 的准确率...……更多
云知声山海大模型成功发布,为各行业带来新增长范式
...十大核心能力,即语言生成、语言理解、知识问答、逻辑推理、代码能力、数学能力、安全合规能力七项通用能力及插件扩展、领域增强、企业定制三项行业落地能力,云知声通过语音输入、实时互动的方式进行讲解演示,并推...……更多
蚂蚁自研知识增强大模型服务框架KAG,可显著提升知识推理准确率
...地,也一定要对时间、数字和逻辑敏感,无论让它做多跳推理,还是逻辑规则数字计算,而这些恰好是大语言模型所不擅长的,包括前一段时间热议的 9.9 和 9.12 比大小的例子。基于此,我们认为在垂直领域落地的时候,大语言...……更多
ChatGPT 火爆,程序员会不会被取代?答案都在这里!
...评测方法、大模型如何能持续学习、怎么显著提升训练和推理的效率这等。从左起:吴海涛、肖仰华、王文广、蒋涛、林咏华、于建岗、王千祥、王昊奋复旦大学教授肖仰华:大模型绝不仅仅是模型系统和算力,数据是非常重要...……更多
OpenAI-o1思考替代法火了!焦剑涛高徒一作提出思考偏好优化
...,大模型能根据任务复杂度进行不同时间的思考。不限于推理性的逻辑或数学任务,一般问答也能思考的那种。最近畅销书《Python机器学习》作者Sebastian Raschka推荐了一项新研究,被网友们齐刷刷码住了。论文一作为华人学者Tian...……更多
让OpenAI o1逆天的慢思考,360两月前就做出来了?周鸿祎CoE媲美CoT,应用太前瞻
...读】o1大火背后,最关键的技术是CoT。模型通过一步一步推理,恰恰是「慢思考」的核心要义。而这一观点,其实这家国内大厂早就率先实现了。OpenAI的理念,居然被国内公司抢先践行了?比起OpenAI,这家公司的idea提出得更早,...……更多
AI新时代揭幕!会“思考解题逻辑”的OpenAI推理大模型登场
...凌晨1时许,AI时代迎来崭新的起点——能够进行通用复杂推理的大模型终于走到台前。OpenAI在官网发布公告称,开始向全体订阅用户开始推送OpenAI o1预览模型——也就是此前被广泛期待的“草莓”大模型。OpenAI表示,对于复杂推...……更多
姚期智院士大模型新研究:思维图DoT,用数学理论确保AI逻辑一致
姚期智院士领衔,推出大模型新推理框架,CoT“王冠”戴不住了。提出思维图(DiagramofThought),让大模型思考更像人类。团队更是为这种推理过程提供了数学基础,通过拓扑斯理论(Topos Theory)正式化(formalize)DoT,确保其逻...……更多
谷歌大模型推理范式,主要分为两个阶段
...新研究“自我发现”(Self-Discover),重新定义了大模型推理范式。与已成行业标准的思维链(CoT)相比,新方法不仅让模型在面对复杂任务时表现更佳,还把同等效果下的推理成本压缩至1/40。核心策略其实很简单:千人千面。...……更多
突破时间序列组合推理难题!南加大发布一站式多步推理框架TS-Reasoner
【新智元导读】TS-Reasoner是一个创新的多步推理框架,结合了大型语言模型的上下文学习和推理能力,通过程序化多步推理、模块化设计、自定义模块生成和多领域数据集评估,有效提高了复杂时间序列任务的推理能力和准确性...……更多
三个大模型组队挑战o1,实测360多模型协作干掉提示词工程
...横空出世,开启了大模型演化的新范式——Inference law(推理定律)。正如英伟达AI科学家Jim Fan所说,o1的出现标志着大模型研发者开始把集中在训练阶段的投入,开始转移到了推理过程。Jim还引用了机器学习先驱Rich Sutton的经典...……更多
重磅!OpenAI o1模型还没有实现真正的逻辑推理能力
...-preview和o1-mini模型已经可以使用。OpenAI宣布,“新模型在推理能力上代表了人工智能能力的新水平,因此,计数器将重置为1”。根据OpenAI的自测,o1在竞赛编程问题(Codeforces)中排名第89个百分点,在美国数学奥林匹克竞赛(AIM...……更多
北大等发布多模态版o1!首个慢思考VLM将开源,视觉推理超闭源
...ion模型打造,超越传统思维链提示,实现自主“慢思考”推理。在多模态推理基准测试中,LLaVA-o1超越其基础模型8.9%,并在性能上超越了一众开闭源模型。新模型具体如何推理,直接上实例,比如问题是:减去所有的小亮球和紫...……更多
倒计时10天!百度世界2023五大亮点全剧透
...以来,文心一言在一个月内即完成四次升级,让大模型的推理成本降低至原来的十分之一;文心大模型升级至3.5版本后,训练速度提升到原来的3倍,推理速度达到原本的30多倍。它是否还能更进一步,追超GPT-4,在生活生产中扮...……更多
上海AI实验室版o1已上线!数学题、Leetcode全拿下,还会玩24点
...编程、数字游戏等任务。这就是上海AI实验室版o1——强推理模型书生InternThinker,刚刚正式开放试用!新模型不仅在长思维能力方面有了很大提升,而且还能在推理过程中进行自我反思和纠正。先来一起看两个例子感受一下:比...……更多
推动大模型自我进化,北理工推出「流星雨计划」
...我进化的方式,解决代码模型在处理复杂问题时缺少中间推理过程。核心观点:自我进化的力量跟随上述自我进化的思想,在 SRA-MCTS(Self-guided MCTS-based data generation for Reasoning Augmentation)方法中,作者无需借助额外的任何监……更多
刚刚,OpenAI震撼发布o1大模型!强化学习突破LLM推理极限
...专门解决难题。这是一个重大突破,新模型可以实现复杂推理,一个通用模型解决比此前的科学、代码和数学模型能做到的更难的问题。OpenAI 称,今天在 ChatGPT 和大模型 API 中新发布的是该系列中的第一款模型,而且还只是预览...……更多
权威榜单 | 网易易盾入选中国信通院生成式 AI 技术和应用优秀案例
...容信息,即过往内容风控是感知层面识别,而非认知层面推理。·同时,对于有害类型的定义往往存在很多主观、边界、细节上的差异,频繁 地根据标准的多样更替适配模型,无法真正做到差异化分级分层精准防护。因此,如何...……更多
对标GPT-4o!商汤发布两大国内首个大模型 入局价格战
...短两个月,综合性能较“日日新5.0”平均提升30%,在数学推理、英文能力和指令跟随等能力明显增强,交互效果和多项核心指标实现对标GPT-4o。据了解,“日日新5.5”模型训练是基于超10TB tokens高质量数据,包括大量合成的思维...……更多
智能体首达Kaggle Grandmaster,华为结构化推理补齐思维链短板
...中的表现,研究者们提出了各种提示策略来提升大模型的推理和规划能力,比如思维链、思维树和思维图谱。这些进步与工具集成一起,推动着通用 AI 智能体的发展,让它们现在已经能够用 LLM 输出的决策策略来解决序列决策问...……更多
21.5万张X光,78万个问题!德州大学NIH等联合发布医学视觉问答数据集Medical-CXR-VQA
...规模较小,仅包含相当于分类任务的简单问题,缺乏语义推理和临床知识。如图1所示,现有的ImageCLF VQA-MED数据集仅包含「这张图像里主要异常是什么?」和「这张图片里看到了什么?」这两种完全相当于分类任务的问题。较小...……更多
NeurIPS 2024 | 数学推理场景下,首个分布外检测研究成果来了
本文将介绍数学推理场景下的首个分布外检测研究成果。该篇论文已被 NeurIPS 2024 接收,第一作者王一鸣是上海交通大学计算机系的二年级博士生,研究方向为语言模型生成、推理,以及可解释、可信大模型。该工作由上海交通...……更多
新扩散模型OmniGen一统图像生成,架构还高度简化、易用
...的任务和领域,并展示新颖的功能。我们还探讨了模型的推理能力和思维链机制的在图像生成领域的潜在应用。Paper: https://arxiv.org/pdf/2409.11340 Code: https://github.com/VectorSpaceLab/OmniGen Demo: https://huggingface……更多
更多关于科技的资讯:
00后整顿不了的职场 它能
人类正在通过 AI 重塑文明。或许很多人还不大认可这个说法,但在前两天,差评君受邀参加了火山引擎 Force 原动力大会之后
2024-12-26 00:06:00
华为:全球首个海拔5000米高原露天矿无人驾驶成果发布
快科技12月25日消息,华为中国发文宣布,与西部矿业、中铁十九局在西藏昌都玉龙铜矿三方共同建设的全球首个5000米高原露天矿无人驾驶项目成果交付
2024-12-26 00:06:00
不能摸也不能烧!这棵树全株有毒太魔性 树下躲雨也会中毒
世界上最倒霉的事情是只在树下躲了个雨,4个学生的皮肤和眼睛就被莫名“灼伤”,出现不同程度的炎症,有的部位甚至还起了水泡
2024-12-26 00:06:00
华为推出FreeBuds Pro 4蛇年典藏版:自带灵动小蛇 云杉绿、曜石黑双色
快科技12月26日消息,华为FreeBuds Pro 4蛇年典藏版已经在京东平台上架,目前尚未公布售价。从目前信息来看
2024-12-26 00:36:00
凯迪拉克女销售涉嫌私收购车款“跑路” 有人转账26万无法提车
快科技12月26日消息,据报道,近日,有不少在江苏南京一凯迪拉克4S店购车的市民在网络上反映,自己购车时被店内一女销售陈某某忽悠
2024-12-26 00:36:00
春节档“神仙打架”!2025年五部大片定档 前作票房一个比一个牛
快科技12月26日消息,今年春节档可谓神仙打架,目前已有5部大片定档2025年春节档上映。分别为《封神第二部:战火西岐》《射雕英雄传
2024-12-26 00:36:00
帝都、魔都双双押宝 年底了AI圈居然还有高手
好好好,本以为 OpenAI 直播已经是 24 年 AI 领域的尾声,没想到还有高手,国内 AI 圈又传出个大新闻。就在前几天
2024-12-26 00:36:00
都别喷萤火虫了 人家可能压根没想卖国内
要说这几天哪台新车心里最难受,那肯定是蔚来的 ET9 。在上周的 Nio Day 2024 上市,定价超过 80 万,身上集合了蔚来迄今为止所有最强的技术
2024-12-26 00:36:00
雷军公布小米su7冬测新成绩:全能之星、智能安全之星
12月25日晚,小米集团CEO雷军公布了小米SU7冬测新成绩。在中国汽研2024极北寒测挑战中,小米SU7被评为全能之星
2024-12-26 01:27:00
联想将推出legiongos掌上游戏机
联想正紧锣密鼓地为2025年国际消费类电子产品展览会(CES2025)做准备,并宣布将推出LegionGoS掌上游戏机
2024-12-26 01:32:00
小米15ultra电池曝光:超级微距、全焦段大光圈
随着2025年的脚步日益临近,各大品牌的Ultra机型也将陆续登场,相关爆料信息也随之涌现。近日,博主“智慧皮卡丘”透露
2024-12-26 01:34:00
特斯拉公布限时员工购车福利,需要在12.31之前提车
2月25日,据汽车博主@胖虎Shawn消息,特斯拉刚刚公布了限时员工购车福利:除了原本的赠送FSD(全自动驾驶)之外,额外增加了赠送两个选配
2024-12-26 01:51:00
一加与redmi又要对上了!新机均将配备1.5koled直屏
OPPO子品牌一加与小米子品牌REDMI算是一对老对手了。2024年,双方就在中高端和旗舰市场展开了多轮交锋,一加Ace3Pro与REDMIK70至尊版
2024-12-26 02:55:00
华为2024年全球文件存储和对象存储报告发布
据@华为数据存储消息,近日,国际权威研究机构ColdagoResearch发布了2024年全球文件存储和对象存储报告。在这两个榜单中
2024-12-26 03:27:00
华为freebudspro4开启年货节活动
最近想入手TWS耳机的同学有福利了,随着新年将至,华为音频也开启了年货节活动,多款华为音频产品开启了不同力度的促销活动
2024-12-26 03:35:00