• 我的订阅
  • 头条热搜
...智能的旗舰产品GPT-4为代表的大语言模型在逻辑测试中的推理表现很糟糕:它们犯下前后不一致的错误,而且推理过程往往是荒谬的。近日发表在《皇家学会开放科学》杂志上的一项研究表明,大语言模型所依赖的语料库往往反...……更多
三个大模型组队挑战o1,实测360多模型协作干掉提示词工程
...横空出世,开启了大模型演化的新范式——Inference law(推理定律)。正如英伟达AI科学家Jim Fan所说,o1的出现标志着大模型研发者开始把集中在训练阶段的投入,开始转移到了推理过程。Jim还引用了机器学习先驱Rich Sutton的经典...……更多
OpenAI-o1思考替代法火了!焦剑涛高徒一作提出思考偏好优化
...,大模型能根据任务复杂度进行不同时间的思考。不限于推理性的逻辑或数学任务,一般问答也能思考的那种。最近畅销书《Python机器学习》作者Sebastian Raschka推荐了一项新研究,被网友们齐刷刷码住了。论文一作为华人学者Tian...……更多
Meta版慢思考来了!田渊栋团队整合快慢思考,能走迷宫推箱子
...本更低。能解决迷宫、推箱子等复杂问题。通过让模型在推理轨迹和最终答案上进行训练,再基于特定策略丢掉部分轨迹,Dualformer模型可以在模仿慢思考的同时,像快思考一样走捷径。由此能形成更简洁的思维链(CoT)。从结...……更多
姚期智院士大模型新研究:思维图DoT,用数学理论确保AI逻辑一致
姚期智院士领衔,推出大模型新推理框架,CoT“王冠”戴不住了。提出思维图(DiagramofThought),让大模型思考更像人类。团队更是为这种推理过程提供了数学基础,通过拓扑斯理论(Topos Theory)正式化(formalize)DoT,确保其逻...……更多
黄仁勋:我从不在乎市场份额、英伟达唯一目标是创造新市场
...英伟达,老黄还讨论了AGI的智能扩展、机器学习的加速、推理与训练的重要性……虽然时长感人(近1个半小时),但一大波网友已经看完并交起了作业(开始卷了是吧!)网友:学起来!学起来! 黄仁勋:未来推理的增长将远...……更多
科学家推出大模型数据集,涵盖奥赛数学题,有望让AI辅导数学课程
...解决复杂数学问题的能力。通过此,他们不仅提高了算法推理速度,还提高了算法搜索中间结果的质量。所新推出的数据集 TriMaster100,也更加符合算法在复杂数学问题下的评价场景。目前,赵子龙的合作者正在基于本次成果开...……更多
科学家竞相破解大型语言模型背后的谜团
...复杂行为。面对复杂问题,人类在潜意识里会进行分步骤推理。受此启发,谷歌团队2022年引入了“思维链提示”,以描述一种让LLM展示其“思维”的方法。简单来说,思维链提示是一种特殊的上下文学习。不同于标准提示只给...……更多
对标o1,Kimi放出了最能打的国产模型
...历新一轮技术范式的变化,预训练 Scaling Law 放缓之后,推理时间计算成为了新的性能提升关键。两个月前,OpenAI o1 的诞生再次引领了大模型技术的突破。从后训练阶段入手,通过更多的强化学习、原生的思维链和更长的推理时...……更多
对标OpenAI o1!Kimi发布新一代推理模型:中考高考考研全第一
...的Kimi国产大模型正式发布k0-math。k0-math是Kimi推出的首款推理能力强化模型,采用全新强化学习和思维链推理技术,通过模拟人脑的思考和反思过程,大幅提升解决数学难题的能力。据了解,在多项数学基准能力测试中,k0-math的...……更多
全新开源王者!NVIDIA悄然推出70B AI模型:力压GPT-4o、仅次于OpenAI o1
...,Nemotron-70B基于Llama-3.1-70B开发,在没有专门提示和额外推理token的情况下,Nemotron-70B也能答对复杂的推理问题,如“草莓有几个r”的经典难题。业内人士评价,NVIDIA在Llama 3.1基础上训练出的这个不太大模型,能够超越GPT-4o和Claud.……更多
大模型时代下的机器人应用:我们离具身智能还有多远?| 新程序员
【导读】机器人应用,因其充满变化的应用场景与复杂的任务需求,其对定制化芯片的要求,一直是领域内难以被攻克的一个难题。本文详细阐述和讨论了为机器人应用定制芯片的困难所在、解决思路,并更进一步,介绍了可...……更多
智能体首达Kaggle Grandmaster,华为结构化推理补齐思维链短板
...中的表现,研究者们提出了各种提示策略来提升大模型的推理和规划能力,比如思维链、思维树和思维图谱。这些进步与工具集成一起,推动着通用 AI 智能体的发展,让它们现在已经能够用 LLM 输出的决策策略来解决序列决策问...……更多
大模型不会推理,为什么也能有思路?有人把原理搞明白了
大模型不会照搬训练数据中的数学推理,回答事实问题和推理问题的「思路」也不一样。大语言模型的「推理」能力应该不是推理,在今年 6 月,一篇 Nature 论文《Language is primarily a tool for communication rather than thought》曾引发……更多
...能设备或家庭服务器上,使用存储在本地的个人数据进行推理和学习的人工智能基础模型。它不仅可以像公共大模型那样通过对话提供答案、创作内容,而且更精准、贴切,甚至根据用户的思维模式预测任务,并自主寻找解决方...……更多
港中文团队提出大模型元推理范式,革新大模型的评价体系
...一定启示。日前,相关论文以《大型语言模型评价中的元推理革命》(MR-GSM8K: A Meta-Reasoning Revolution in Large Language Model Evaluation)为题发在 arXiv,曾忠燊是第一作者,香港中文大学教授贾佳亚担任通讯作者 [1]。图……更多
o1核心作者分享:激励AI自我学习,比试图教会AI每一项任务更重要
...绍下Hyung Won Chung,从公布的o1背后人员名单来看,他属于推理研究的基础贡献者。资料显示,他是MIT博士(方向为可再生能源和能源系统),去年2月加入OpenAI担任研究科学家。加入OpenAI之前,他在Google Brain负责大语言模型的预训...……更多
郑小林:建立思维链的AI 具有里程碑意义
...段即对话式AI,AI能解决语言交互问题;第二阶段是具备推理阶段;第三阶段,AI能感知物理世界并与物理世界实现交互;第四阶段,AI将进入创新领域,具备开创新想法和技术的能力;到了第五阶段,AI将具备战略思维和自我管...……更多
OpenAI o1太贵?那就自己做一个!纯提示方法让普通LLM进化出复杂推理能力
...爆火,利用纯提示方法让普通LLM摇身一变,成为具备复杂推理能力的OpenAI o1。九月份,OpenAI o1正式登场。作为新一代的老大哥,o1系列专注于复杂的推理任务,一经推出也是直接屠榜了大模型竞技场。在下面这些难度较大的数学...……更多
谷歌最新自然语言推理算法
谷歌发布全新反向推理算法LAMBADA,无惧搜索空间爆炸!自动推理绝对算是自然语言处理领域的一大难题,模型需要根据给定的前提和知识推导出有效且正确的结论。尽管近年来NLP领域借着大规模预训练语言模型在各种「自然语...……更多
商汤科技与金山办公达成商业合作,“日日新”大模型补强办公软件理科大脑
...直是大模型的痛点,理科领域需要高度的抽象思维和逻辑推理能力,并且要求非常精准的答案,作为计算机科学和信息技术领域的重要工具,代码能力被视作衡量大模型智慧的关键维度。事实上,在过去一年国产大模型如火如荼...……更多
蚂蚁自研知识增强大模型服务框架KAG,可显著提升知识推理准确率
...地,也一定要对时间、数字和逻辑敏感,无论让它做多跳推理,还是逻辑规则数字计算,而这些恰好是大语言模型所不擅长的,包括前一段时间热议的 9.9 和 9.12 比大小的例子。基于此,我们认为在垂直领域落地的时候,大语言...……更多
9.11比9.9大?多个大模型翻车!业内人士:就是偏科,文科强理科弱
...文认为,模型产生幻觉的三大来源:数据源、训练过程和推理。大模型可能会过度依赖训练数据中的一些模式,如位置接近性、共现统计数据和相关文档计数,从而导致幻觉。此外,大模型还可能会出现长尾知识回忆不足、难以...……更多
大模型价格战“卷”向何方?|深度
...千亿参数MoE架构模型。MoE架构中基于多个专家并行机制,推理时只激活部分专家,以稀疏性压缩了参数数量和推理成本。“这就可以极大地节省算力耗费”。而率先掀起价格战的幻方DeepSeek-V2,就是其通过架构创新,实现了大模...……更多
9.11和9.9哪个大?实测12个大模型8个都答错,ChatGPT也翻车了
...模型的短板,此前行业也多次讨论过大模型的数学和复杂推理能力较差,即便是目前最好的大模型GPT-4也仍然有很大进步空间。最近的一次,第一财经曾在6月报道过,根据司南评测体系OpenCompass的高考全卷测试,包括GPT-4在内,7...……更多
o1带火的CoT到底行不行?新论文引发了论战
...To CoT or not to CoT?OpenAI ο1 的诞生极大地提升了人们对 LLM 推理能力和思维链(CoT)的兴趣。一时之间,似乎思维链很快就会成为所有 LLM 的标配,但思维链并非万能,就连 OpenAI 自己也提到 o1 在某些任务上的表现并不比 GPT-4o 强...……更多
谷歌员工曝AI改进速度放缓,Gemini已成立新团队解决问题
...无解可能会导向悲观派所说的“AI泡沫”。世界离AGI还有多远?还要看这些巨头公司们多久突破技术瓶颈。来源:The Information ……更多
Bengio团队提出多模态新基准,直指Claude 3.5和GPT-4o弱点
...型开发的关键指导之一便是如何让机器像人类一样思考和推理。诸如注意力机制和思维链(Chain-of-Thought)等技术正是由此产生的灵感。然而,可能很多人并没有意识到,很多对人类来说很简单的认知任务也往往伴随着非常复杂...……更多
手机上能跑的「GPT-4V」来啦!多图、视频理解首次上端!面壁小钢炮开源史上最强端侧多模态
...类模型低 75%。端侧友好:量化后端侧内存仅占 6 GB;端侧推理速度高达 18 tokens/s,相比上代模型快 33%。并且发布即支持 llama.cpp、ollama、vllm 推理;且支持多种语言。统一高清框架,高效能力一拖三:小钢炮的传统优势 OCR 能力延...……更多
2023IDEA大会:让大模型更好应对复杂问题
...本正经的胡说八道”怎么解?众所周之,大模型存在深度推理能力差、知识不可追溯、实时更新代价高等局限性,这也成为其在许多严肃领域落地的主要瓶颈。如何弥补大模型的这部分缺陷,是当下AI应用的重要课题。为此,IDEA...……更多
更多关于科技的资讯:
百度和吉利内部已开始转账流程 为极越员工缴纳11月社保
快科技12月12日消息,据报道,晚间,极越员工代表、极越CEO夏一平,以及吉利和百度两大股东召开闭门会。报道称,经多轮沟通
2024-12-12 23:46:00
“双孔屏版红米K80”!小米Civi 5 Pro外观曝光
快科技12月13日消息,博主数码闲聊站曝光了小米Civi 5 Pro的外观细节。据悉,小米Civi 5 Pro正面是1
2024-12-13 00:16:00
小米CEO同款!雷军带火武汉大学羽绒服 销量大涨
快科技12月13日消息,日前,武汉大学雷军班到小米科技园参观,雷军班的学生送了小米CEO雷军几份礼品,其中一件就是“雷军班”同款的班服
2024-12-13 00:16:00
ios18新功能正在通过多个小版本更新上线
近日,彭博社记者马克·古尔曼(MarkGurman)爆料称,由于iOS18的新功能正在逐步通过多个小版本更新上线,苹果原本为iOS19计划的开发进程受到了显著影响
2024-12-13 00:46:00
日本2024年度汉字出炉:“金”字第五次当选
快科技12月13日消息,据媒体报道,日前,位于日本京都的清水寺公布2024年日本年度汉字——“金”。据了解,主办方共收到22万多票征集的汉字
2024-12-13 00:46:00
有多少人被网红民宿狠狠背刺了
一转眼又到了旅游旺季。南方朋友们去看北国冰封、万里雪飘;北方朋友们不想过冬,厌倦沉重,就飞去热带的岛屿游泳。出门旅游绕不开“住”
2024-12-13 00:46:00
嘎子哥谢孟伟后悔直播带货卖酒:把路人缘都给败光了
12月13日消息,据媒体报道,演员谢孟伟在一次直播中公开表示后悔曾经直播带货卖酒。他表示,自己的这一行为把路人缘都给败光了
2024-12-13 00:46:00
vivox200系列正式亮相印度市场
在经过多轮爆料和传闻后,vivoX200系列在12月12日正式在印度市场亮相。本次发布的机型共有两款——vivoX200和vivoX200Pro
2024-12-13 00:48:00
小米全新机械键盘MK 71 Pro首秀:71键TTC轴 自带屏幕
快科技12月13日消息,日前,小米生态链总经理陈波晒出小米最新款机械键盘——MK 71 Pro。据了解,MK 71 Pro为71键布局
2024-12-13 01:16:00
天津北方网讯:12月12日,天津市人社局与渤海银行天津分行签署了《天津市社会保障卡创新应用服务合作协议》,双方将在第三代社会保障卡的发行、推广、行业应用等方面展开深入合作,为天津
2024-12-13 01:47:00
本报讯 中国江西新闻网全媒体记者陈春伟报道:12月11日,江西省商务厅发布手机、平板电脑专场补贴活动。12月12日起,在江西省内
2024-12-13 04:45:00
华为matepadpro12.2英寸强势来袭
在移动办公和在线学习的热潮中,平板产品表现出了强势增长潜力。IDC数据显示,华为在2024年第三季度以36.7%的市场份额
2024-12-13 04:47:00
20万级纯电suv零百充电速度排行榜出炉
12月12日,某知名汽车媒体在社交平台上发布了“20万级800V纯电SUV零百充电速度排行榜”,引起了广泛关注。该榜单针对2024年纯电SUV市场的充电性能进行了详细比较
2024-12-13 04:49:00
海信荣获“2024年度产品技术创新指南”殊荣
2024年中国音视频大会(AVF)于12月11日在北京盛大召开,由中国电子视像行业协会主办,汇聚了音视频领域的精英与前沿技术
2024-12-13 04:52:00
蔚来新增自动紧急避让aes,紧急情况下可自动变换车道避险
12月12日,据蔚来官微消息,蔚来智能安全辅助系统即将新增自动紧急避让AES,在紧急情况下可自动变换车道避险,覆盖场景更多
2024-12-13 04:55:00