• 我的订阅
  • 头条热搜
ICML2024演讲爆火!Meta朱泽园揭秘大模型内心世界:不同于人类推理
...M) 是如何解数学题的?是通过模板记忆,还是真的学会了推理思维?模型的心算过程是怎样的?能学会怎样的推理技能?与人类相同,还是超越了人类?只学一种类型的数学题,是会对通用智能的发展产生帮助?LLM 为什么会犯...……更多
...智能的旗舰产品GPT-4为代表的大语言模型在逻辑测试中的推理表现很糟糕:它们犯下前后不一致的错误,而且推理过程往往是荒谬的。近日发表在《皇家学会开放科学》杂志上的一项研究表明,大语言模型所依赖的语料库往往反...……更多
o1金牌团队揭秘AI超越人类惊人时刻!22分完整版视频全公开
...共有8点:1 强化学习加持的o1,比人类更善于发现新的CoT推理步骤2 自我批评的涌现,是o1最强有力的时刻3 让o1「超时」前完成回答,然后突然有了「啊哈」时刻 4 scaling参数规模的挑战,以及继续沿着强化学习算法进步之路5 许...……更多
刚刚,OpenAI震撼发布o1大模型!强化学习突破LLM推理极限
...专门解决难题。这是一个重大突破,新模型可以实现复杂推理,一个通用模型解决比此前的科学、代码和数学模型能做到的更难的问题。OpenAI 称,今天在 ChatGPT 和大模型 API 中新发布的是该系列中的第一款模型,而且还只是预览...……更多
重磅!OpenAI o1模型还没有实现真正的逻辑推理能力
...-preview和o1-mini模型已经可以使用。OpenAI宣布,“新模型在推理能力上代表了人工智能能力的新水平,因此,计数器将重置为1”。根据OpenAI的自测,o1在竞赛编程问题(Codeforces)中排名第89个百分点,在美国数学奥林匹克竞赛(AIM...……更多
语言≠思维,大模型学不了推理:一篇Nature让AI社区炸锅了
...到,人类大脑生成和解析语言的神经网络并不负责形式化推理,而且提出推理并不需要语言作为媒介。这篇论文声称「语言主要是用于交流的工具,而不是思考的工具,对于任何经过测试的思维形式都不是必需的」,引发了科技...……更多
谷歌大模型推理范式,主要分为两个阶段
...新研究“自我发现”(Self-Discover),重新定义了大模型推理范式。与已成行业标准的思维链(CoT)相比,新方法不仅让模型在面对复杂任务时表现更佳,还把同等效果下的推理成本压缩至1/40。核心策略其实很简单:千人千面。...……更多
...AI)系统在编码、战略规划和机器人科学三个领域执行复杂推理任务。聊天生成预训练转换器(ChatGPT)和“克劳德3-奥普斯”(Claude 3 Opus)等大语言模型(LLM),根据人类输入“提示词”处理和生成文本。研究人员说,过去18个月,这些技...……更多
人类和AI在推理任务中的表现相似,Google DeepMind研究揭示AI局限性
...人工智能(AI),特别是大型Transformer语言模型(LMs)在推理任务中的表现及其局限性。研究结果显示,尽管这些模型在处理自然语言方面表现卓越,但在复杂逻辑推理任务中,人类和语言模型都会受到语义内容合理性和可信度...……更多
整合长期记忆,AI实现自我进化,探索大模型这一可能性
...也能让模型在处理长期、分散和个性化的数据时逐步提升推理和学习能力。用 LTM 数据提升模型能力,使其能够自我进化在传统 LLM 中,更新模型通常需要调整所有参数,而如果目的是处理个体数据,那这种操作明显不切实际。...……更多
专注于推理的OpenAI“草莓”模型两周内发布?是人工智能下一重大突破
...“秋季发布”(9月至11月)要更早。上述报道称,专注于推理能力的人工智能“草莓”发布前后还有一些亟待解决的问题,但看似“仓促上马”似乎说明OpenAI感受到了大语言模型驱动产品领域的激烈竞争压力,希望通过近几个月...……更多
研究人员给了人工智能一个“内心独白”,结果大大提高了其性能
...工智能系统,让它在说话前先思考。内心独白提高了常识推理能力,并使其数学成绩翻了一番。一项新的研究表明,给人工智能系统一个“内心独白”会大大提高它们的推理能力。这种方法训练的人工智能系统,会在对提示做出...……更多
大模型是否有推理能力?DeepMind数月前的论文让AI社区吵起来了
...,随着 OpenAI o1 模型的推出,关于大型语言模型是否拥有推理能力的讨论又多了起来。比如苹果在前段时间的一篇论文中指出,只要给模型一些干扰,最聪明的模型也会犯最简单的错误(参见《给小学数学题加句「废话」,OpenAI ...……更多
阿里CEO吴泳铭:AI计算正在加速演进,成为计算体系的主导
...会变成智能机器人。5、未来几乎所有的软硬件都会具备推理能力,它们的计算内核将变成GPU AI算力为主、CPU传统计算为辅的计算模式。6、过去一年,阿里云投资新建了大量的AI算力,但还是远远不能满足客户的旺盛需求。7、人...……更多
LeCun最新万字演讲:纯语言模型到不了人类水平,我们基本已放弃
...:完全是胡说八道。最新的公开演讲中,他表示,系统要推理、规划和理解物理世界,至少还需要几年甚至十年的时间,这时候人工智能才能达到人类水平。他还透露,现在Meta基本已经放弃纯语言模型,因为,仅通过文本训练...……更多
OpenAI o1模型到博士水平了?复旦教授:没有真正推理能力,学到的还是概率相关性
...小尺寸版o1-mini。OpenAI官方发文称,新模型旨在解决复杂推理问题,训练模型在响应之前花更多时间思考,类似于人类的思考方式。“新模型在推理能力上代表了AI能力的新水平。”OpenAI称,该模型可以解决科学、编程和数学等更...……更多
OpenAI发布最新技术研究,AI“黑盒”不再是难题!
...出了正确回答。大部分大模型都在给出答案的同时呈现了推理过程。智谱清言给出的推理过程显示,在比较13.11%和13.8%时,13.11%是更大的数值。这是因为当比较两个百分数时,我们首先比较整数部分,如果它们相同,则比较小数...……更多
从通用人工智能到科学智能,“AI爱因斯坦”还远吗?
...需要像AlphaGo Zero那样,从围棋本身出发,具备自我学习、推理和创新能力,这样才可以达到通用人工智能。要实现这一目标,一是需要结合快思考的“黑盒”预测和慢思考的“白盒”逻辑推理,打造“灰盒”可信大模型;二是融...……更多
对话云天励飞董事长陈宁:2030年人类将实现AGI,推理芯片将是蓝海市场|钛媒体AGI
...拥有一个AI Agent。“如果说2024年是大模型落地应用之年,推理就会越来越重要。此前在训练芯片市场上,英伟达一骑绝尘,占有绝对的市场占有率,那么今天,推理芯片市场没有垄断性的巨头。这不仅是万亿级、万亿颗芯片的蓝...……更多
Transformer推理天花板被谷歌打破?DeepMind首席科学家亮出84页PPT,却遭LeCun反对
...科学家Denny Zhou拿出一篇ICLR 2024论文称:CoT可以让Transformer推理无极限。但随即他就遭到了田渊栋和LeCun等的质疑。最终,CoT会是通往AGI的正确路径吗?随着OpenAI o1的爆火,最近CoT也成了圈内热议的高频词。靠着CoT的强力加持,o1...……更多
推理性能直逼o1,DeepSeek再次出手,重点:即将开源
...出手了,这次又是重磅炸弹。昨晚,DeepSeek 上线了全新的推理模型 DeepSeek-R1-Lite-Preview,直接冲击 OpenAI o1 保持了两个多月的大模型霸主地位。在美国数学竞赛(AMC)中难度等级最高的 AIME 以及全球顶级编程竞赛(codeforces)等权...……更多
菲尔兹奖得主亲测GPT-4o,经典过河难题破解失败!最强Claude 3.5回答离谱,LeCun嘲讽LLM
... 3.5依旧答错了。LeCun在此嘲讽大模型一番,大模型竟可以推理...?问题在于,LLM没有常识,不理解现实世界,也不会规划和推理。LLM行不行,就看提示了一位网友分析总结了,以上LLM失败的原因。他表示,LLM本身就是个「哑巴」...……更多
AI新时代揭幕!会“思考解题逻辑”的OpenAI推理大模型登场
...凌晨1时许,AI时代迎来崭新的起点——能够进行通用复杂推理的大模型终于走到台前。OpenAI在官网发布公告称,开始向全体订阅用户开始推送OpenAI o1预览模型——也就是此前被广泛期待的“草莓”大模型。OpenAI表示,对于复杂推...……更多
科学家竞相破解大型语言模型背后的谜团
...复杂行为。面对复杂问题,人类在潜意识里会进行分步骤推理。受此启发,谷歌团队2022年引入了“思维链提示”,以描述一种让LLM展示其“思维”的方法。简单来说,思维链提示是一种特殊的上下文学习。不同于标准提示只给...……更多
OpenAI没有放弃的机器人梦想
...人团队,理由是缺乏训练机器人使用人工智能进行移动和推理所需的数据,研发受到了阻碍。当时,在美国创业孵化器Y Combinator的论坛上,BuzzFeed数据科学家马克思·伍尔夫(Max Woolf)直言 :“一种可能准确但带有讽刺意味的观...……更多
语音克隆达到人类水平,微软全新VALL-E 2模型让DeepFake堪比配音员
...零样本TTS依旧是一个有挑战性的问题。「零样本」意味着推理过程中,模型只能参照一段简短的陌生语音样本,用相同的声音说出文本内容,就像一个能即时模仿的口技大师。听到这里,不知道你会不会突然警觉——有这种能力...……更多
AI表现直逼国际奥数优秀选手, 它要 “征服”数学了吗?
...同步揭晓。这项赛事的目的是推动发展大语言模型的数学推理能力,训练出更高数学水平的新AI模型。纯数学领域中的重大发现是推理和创造力的灵感结晶,往往意味着人类智慧极限的突破。迄今为止,解决或协助解决高等级数...……更多
罗格斯大学团队提出思想链概念,提高大模型的算数推理能力
...概念,提高了大语言模型(LLM,large language models)在复杂推理任务上的性能,例如算术推理、常识推理和符号推理等。图 | 金明宇(来源:金明宇)CoT 的原理是通过提供推理过程的示例,来教会模型处理推理,详细说明导致最...……更多
让大模型能听会说,国内机构开源首个端到端语音对话模型Mini-Omni
...交互能力的核心是模型能够直接在语音模态上进行理解和推理,这与传统的语音对话功能有本质的不同。现有的语音对话系统中主要包含 3 个过程:首先将输入语音内容转换为文本,其次利用大语言模型进行文本推理,最后利用...……更多
全模态对齐框架align-anything来啦:实现跨模态指令跟随
...-Vision-11B 既准确地识别出了餐厅,还提供了细致的思考与推理过程。 在 Meta 并未披露 Llama-3.2-11B-Vision-Instruct 对齐技术细节情况下,北大对齐小组愿开源数据、训练、模型、评估的全流程,为全模态对齐研究贡献力量。对齐框架...……更多
更多关于科技的资讯:
深蓝航天完成新一轮近5亿融资!重点加速“星云”可回收液体火箭
快科技3月6日消息,深蓝航天官宣近期完成新一轮融资,总规模近5亿元人民币。本轮融资由泰山产业发展投资集团旗下泰安远望新能源产业投资基金合伙企业(有限合伙)领投
2025-03-06 11:43:00
“韩国宾利”捷尼赛思将国产:或用上华为智驾
快科技3月6日消息,伴随着丰田雷克萨斯确定在中国生产,更多品牌也坐不住了。近日,素有“韩国宾利”美誉的捷尼赛思正式宣布品牌开启国产化进程
2025-03-06 11:43:00
谷歌测试纯AI版搜索引擎:取消传统展示形式
快科技3月6日消息,据报道,Alphabet旗下谷歌推出了一款实验版搜索引擎, 彻底取消了传统的10个蓝色链接展示形式
2025-03-06 11:43:00
高通荣获GTI Awards三项大奖:引领智能手机+AI创新 协同5G-A重塑移动体验
作为每年MWC巴塞罗那备受瞩目的重磅奖项之一,GTI Awards 2025于当地时间3月4日在GTI国际产业大会上正式揭晓
2025-03-06 11:43:00
“直播探企”让就业服务上“云端”
(通讯员:查灵艺)“大家好,今天我们来到了九江国家级经开区的TCL空调智能制造基地,近距离感受这座“科技+温度”的智慧工厂
2025-03-06 11:44:00
重庆邮电大学携手好老师教育成立“博智云”教育智能体生态联盟!
2025年3月5日,好老师教育集团与重庆邮电大学在重庆邮电大学江南分院学术报告厅隆重举行“博智云”教育智能体生态联盟战略发布会
2025-03-06 12:01:00
问界M8今启预订,预售价36.8万起,商标被一生活用品公司抢注
3月6日,鸿蒙智行发微博官宣,问界M8和问界M92025款均开启预订。家庭智慧旗舰SUV鸿蒙智行问界M8开启预订,预售价36
2025-03-06 12:04:00
在山东见证智造中国新脉动|从行业首个透明工厂看见美妆山东“智”变
编者按:制造业是我国经济命脉所系,是立国之本、强国之基。3月5日,政府工作报告中介绍今年政府工作任务时提出,加快制造业数字化转型
2025-03-06 12:05:00
优派新款27寸显示器首发899元:支持超频210Hz刷新率
快科技3月6日消息,优派推出了一款27寸显示器——VX27G81-2K-W,首发899元。新款显示器采用了27英寸的Fast IPS屏
2025-03-06 12:13:00
真正的骨骼惊奇:19岁女孩天生髌骨脱位双膝可随意移动
3月6日消息,“骨骼惊奇”真的存在,只是看起来略显骇人。近日,19岁女孩晒视频称自己双膝盖可随意转动,从小就这样,视频里
2025-03-06 12:13:00
最新Mac Studio用的还是上代M3 Ultra:苹果给出解释
快科技3月6日消息,今天苹果更新了Mac Studio,但其高端型号搭载的仍是上一代的M3 Ultra芯片,而非最新的M4 Ultra
2025-03-06 12:13:00
SHURE全新MOVEMIC 88+无线麦克风,为视频带来出色的音频多功能性
Shure全新无线立体声麦克风具有四种可选拾音模式,可在任何环境下捕捉专业音频2025年3月4日 -Shure推出了MoveMic88+无线立体声麦克风
2025-03-06 12:22:00
全新小鹏G9亮相:全车66项升级 智驾、双腔空悬全部标配
快科技3月6日消息,小鹏汽车今日发布了全新小鹏G9官图。小鹏汽车董事长何小鹏表示,全新小鹏G9全车升级了66项体验,并且
2025-03-06 12:43:00
最强游戏CPU!锐龙9 9950X3D、9900X3D已上架:3月12开售
快科技3月6日消息,AMD最新的锐龙9 9900X3D和9950X3D处理器已经在京东上架,显示将于3月12日22:00正式开售
2025-03-06 12:43:00
哈雷最强摩托车登场:售价能买一辆路虎卫士
快科技3月6日消息,海外科技媒体报道,哈雷·戴维森(注:即哈雷)推出限量版CVO Road Glide RR摩托车,这款车被视作该品牌史上最强劲
2025-03-06 12:43:00