• 我的订阅
  • 头条热搜
语言≠思维,大模型学不了推理:一篇Nature让AI社区炸锅了
...到,人类大脑生成和解析语言的神经网络并不负责形式化推理,而且提出推理并不需要语言作为媒介。这篇论文声称「语言主要是用于交流的工具,而不是思考的工具,对于任何经过测试的思维形式都不是必需的」,引发了科技...……更多
...智能的旗舰产品GPT-4为代表的大语言模型在逻辑测试中的推理表现很糟糕:它们犯下前后不一致的错误,而且推理过程往往是荒谬的。近日发表在《皇家学会开放科学》杂志上的一项研究表明,大语言模型所依赖的语料库往往反...……更多
奥林匹克竞赛里选最聪明的AI:Claude-3.5-Sonnet vs. GPT-4o?
...异,近来Anthropic公司最新发布的Claude-3.5-Sonnet因在知识型推理、数学推理、编程任务及视觉推理等任务上设立新行业基准而引发广泛讨论:Claude-3.5-Sonnet 已经取代OpenAI的GPT4o成为世界上”最聪明的AI“(Most Intelligent AI)了……更多
科学家竞相破解大型语言模型背后的谜团
...复杂行为。面对复杂问题,人类在潜意识里会进行分步骤推理。受此启发,谷歌团队2022年引入了“思维链提示”,以描述一种让LLM展示其“思维”的方法。简单来说,思维链提示是一种特殊的上下文学习。不同于标准提示只给...……更多
谷歌最新自然语言推理算法
谷歌发布全新反向推理算法LAMBADA,无惧搜索空间爆炸!自动推理绝对算是自然语言处理领域的一大难题,模型需要根据给定的前提和知识推导出有效且正确的结论。尽管近年来NLP领域借着大规模预训练语言模型在各种「自然语...……更多
谷歌大模型推理范式,主要分为两个阶段
...新研究“自我发现”(Self-Discover),重新定义了大模型推理范式。与已成行业标准的思维链(CoT)相比,新方法不仅让模型在面对复杂任务时表现更佳,还把同等效果下的推理成本压缩至1/40。核心策略其实很简单:千人千面。...……更多
商汤科技与金山办公达成商业合作,“日日新”大模型补强办公软件理科大脑
...直是大模型的痛点,理科领域需要高度的抽象思维和逻辑推理能力,并且要求非常精准的答案,作为计算机科学和信息技术领域的重要工具,代码能力被视作衡量大模型智慧的关键维度。事实上,在过去一年国产大模型如火如荼...……更多
知乎 AI 革命:智能搜索与实时问答的融合
...生成,将这些答案里的有价值信息提炼出来,进行有效的推理,就能为一个 \" 新鲜出炉 \" 的专业问题提供一个立等可取的答案,提问的用户就可以能为快,然后再等其它的专业答主陆续赶到,下场答题。 在灰度测试这个功能...……更多
昆仑万维:“天工大模型3.0”将于4月17日正式发布 同步开源4000亿参数MoE超级模型
...“天工2.0”MoE大模型,“天工3.0”在模型语义理解、逻辑推理、以及通用性、泛化性、不确定性知识、学习能力等领域拥有惊人的性能提升,其模型技术知识能力提升超过20%,数学/推理/代码/文创能力提升超过30%。同时,“天工...……更多
...的32项学术基准中,从自然图像、音频和视频理解到数学推理,“双子座”Ultra的性能有30项超过了当前先进水平。谷歌公司称,在图像识别领域的测试结果显示,“双子座”Ultra性能优于迄今最先进的人工智能模型,具有天然多...……更多
...AI)系统在编码、战略规划和机器人科学三个领域执行复杂推理任务。聊天生成预训练转换器(ChatGPT)和“克劳德3-奥普斯”(Claude 3 Opus)等大语言模型(LLM),根据人类输入“提示词”处理和生成文本。研究人员说,过去18个月,这些技...……更多
国内创业者和投资人如何看待 Figure 01 机器人:距离具身智能还有多远?
...完成上面说的第二个步骤,模型中没有思维链,也不具备推理能力。PaLM-E 让机器人有了聪明的大脑,可以将复杂自然语言指令分解为简单指令,完成上面说的第一个步骤,然后再去调用 RT-1 执行动作。所以,PaLM-E 所做的只是自...……更多
苹果发布 OpenELM,基于开源训练和推理框架的高效语言模型
...,苹果在 Hugging Face 平台上发布了一个“具有开源训练和推理框架的高效语言模型”,名为 OpenELM。当然,这是一项开源语言模型,其源码及预训练的模型权重和训练配方可在苹果 Github 库中获取。IT之家将官方简介翻译如下:参...……更多
什么是AGI?人工智能的未来
...Artificial Intelligence)指的是能够像人类一样思考、学习和推理的机器或计算机程序 – 其能够具备人类的普遍智慧,即能够学习各领域知识,并能将知识输出在各个领域。当时,约翰·麦卡锡预计人工智能将在几个月内实现。约翰...……更多
...思维搜索的领域知识。策略和价值网络指导搜索过程。在推理过程中,预训练的MCTS模块使用策略网络来探索LLM的思想轨迹。随后,LLM审查MCTS的思想并识别任何错误,然后进行额外的MCTS模拟以生成修改后的想法。最后,将修改后...……更多
2023IDEA大会:让大模型更好应对复杂问题
...本正经的胡说八道”怎么解?众所周之,大模型存在深度推理能力差、知识不可追溯、实时更新代价高等局限性,这也成为其在许多严肃领域落地的主要瓶颈。如何弥补大模型的这部分缺陷,是当下AI应用的重要课题。为此,IDEA...……更多
探索终端操作系统领域AI大模型创新趋势 OpenHarmony技术大会OS原生智能分论坛召开
...发展带来了崭新的机遇,有望通过强大的语义理解和常识推理能力大大提升智能个人代理支持功能的广度和深度。”清华大学助理研究员李元春主题分享中软国际有限公司智能物联网军团产品研发管理部总经理、OpenHarmony项目群技...……更多
北大推出全新机器人多模态大模型!面向通用和机器人场景的高效推理和操作
...码仓库 Trending Research 第一位。为了赋予机器人端到端的推理和操纵能力,本文创新性地将视觉编码器与高效的状态空间语言模型集成,构建了全新的 RoboMamba 多模态大模型,使其具备视觉常识任务和机器人相关任务的推理能力,...……更多
AI表现直逼国际奥数优秀选手, 它要 “征服”数学了吗?
...同步揭晓。这项赛事的目的是推动发展大语言模型的数学推理能力,训练出更高数学水平的新AI模型。纯数学领域中的重大发现是推理和创造力的灵感结晶,往往意味着人类智慧极限的突破。迄今为止,解决或协助解决高等级数...……更多
...,目前已初具“近似人类”的自我认知、情感体验、思维推理能力,能够“听”懂人类语言、“理解”人的情绪和意图,并能较为逼真地呈现出来。基于此,随着脑机接口技术的发展,Sora或可成为连接人脑与人脑、人脑与机脑...……更多
谷歌王者归来?最新推出的大模型到底有多强,能否挑战GPT-4
...问题,这就使其尤其擅长解释数学和物理等复杂科目中的推理。Gemini能够根据照片按步骤讲题。来源:官方视频谷歌还发布了一个时长六分钟的视频,展现了测试员和Gemini的一些有趣互动,其中包括让Gemini识别图片并用多种语言...……更多
数字员工、超级个体、具身智能,AI Agent未来发展十大研究方向
...侧大模型加速部署,或将成为未来交互新入口。AI在数学推理、新药研发、材料发现、蛋白质合成等领域大显身手, \"AI科学家\"有望加速问世。这三个报告,一方面预测了AI Agent的未来发展趋势,另一方面也同时提及了多模态大...……更多
微软发布旗下最小语言模型phi-2
...写电子邮件和故事,以及总结文本。在常识、语言理解和推理的基准测试中,该模型在某些领域能够跟上多达100亿个参数的模型。微软现在更新发布的Phi-2拥有27亿参数,规模虽然比此前版本翻番,但相比较其它主流语言模型,...……更多
百川智能发布baichuan3稳定语言模型
...处理和代码生成领域的强大实力。不仅如此,其在对逻辑推理能力及专业性要求极高的MCMLE、MedExam、CMExam等权威医疗评测上的中文效果同样超过了GPT-4,是中文医疗任务表现最佳的大模型。Baichuan3还突破“迭代式强化学习”技术...……更多
对话王田苗:万亿市场之下,大模型 + 机器人还有四大问题未解决
...务设定多个小模型,并提供不同的参数训练,端到端减少推理成本。另外,将专用小 GPU 芯片置入到机器人中,也可提高任务实时性,目前特斯拉已在自动驾驶中尝试了这种做法。硬氪:今年有哪些细分场景的模型值得关注?王...……更多
16家头部大模型公司上海神秘碰头,现场人挤人人人
...最为关键的三大层面,即:算力层:用于基础模型训练和推理的基础设施 模型层:使用基础模型加速生成式AI应用构建 应用层:开箱即用的生成式AI应用至于能力如何,我们直接来看下最为直观的效果。在生成式AI应用方面,...……更多
苹果的封闭生态为大模型打开!发布开源多模态大模型、每天为 AI 烧百万美元,零碎的 Android 生态打得过吗?
...布了两篇新的研究论文,介绍了 3D 头像和高效语言模型推理的新技术,被认为可能带来更身临其境的视觉体验,并允许复杂的人工智能系统在 iPhone 和 iPad 等消费设备上运行。 AI 社区中的许多人后来才注意到 Ferret 的发布,他...……更多
开源社区分水岭:Meta大模型Llama 3发布,参数最高或达4000亿
...行业基准测试上展现了最先进的性能,提供了包括改进的推理能力在内的新功能,是目前市场上最好的开源大模型。在架构层面,Llama3选择了标准的仅解码(decoder-only)式Transformer架构,采用包含128K token词汇表的分词器。Llama 3...……更多
ASC24超算大赛启动会在京举行,大模型推理等成为赛题
...在上海大学举行的总决赛。据悉,今年的赛题包括大模型推理优化、渗流数值模拟,以及国际通行基准测试HPL和HPCG等。来自高性能计算和人工智能领域的中国科学院院士、中国工程院院士、专家学者及参赛师生代表等参加了启...……更多
llava-1.6与gpt-4vmp面硬刚的性能,一起来看看
...率基础上,并通过改进视觉指令数据集和SGLang,提升了“推理、OCR等方面的性能”,意味着人类向AGI(通用人工智能)探索的道路上又迈进了一步。LLaVA-1.6的研发团队成员Haotian Liu在X平台发文原文 二、更适合中国人体质的GPT-4V...……更多
更多关于科技的资讯:
男子打车8公里被收229元 还跨楼越湖了!滴滴回应:司机用了作弊器
快科技7月20日消息,据报道,一男子在上海打网约车乘坐了8公里,结果订单却显示去了趟苏州,且车费花了两百多元。据当事人张先生介绍
2024-07-20 11:52:00
Redmi K70至尊冠军版外观设计公布 与兰博基尼联名
【CNMO科技消息】7月18日,CNMO注意到,即将于7月19日晚间发布的RedmiK70至尊版其实有第二个版本——RedmiK70至尊冠军版
2024-07-20 11:59:00
小米新品发布会汇总 多款新机亮相 最后还有大惊喜
【CNMO科技】7月19日晚,小米召开了新品发布会,小米集团创始人雷军再度出山,带来了包括小米MIXFlip、小米MIXFold4等在内的一系列新品
2024-07-20 12:00:00
小米MIX Flip首发评测:超大外屏 让你从此爱不释手
【CNMO科技】相较于小米MIXFold系列的大折叠产品来说,小米的MIXFlip系列到来似乎显得有些“姗姗来迟”。但实际上小米早在五年前就开始规划小折叠系列产品
2024-07-20 12:00:00
索尼电子产品在日本将上调价格约10% 索尼微单在列
【CNMO科技消息】7月18日消息,索尼宣布了一项重要决定,将从8月1日起在日本市场调整一系列消费电子产品价格,平均涨幅预计将达到10%
2024-07-20 12:00:00
教育优惠活动开启 华为平板2024选购全攻略
【CNMO科技消息】随着暑假的到来,尤其是高考结束之后,很多学生准备购买一套全新的数码装备,以期在学术探索与知识汲取上获得更强大的支持与便利
2024-07-20 12:00:00
小米手环9评测:活力时尚 让佩戴手环拥有仪式感
【CNMO科技】在当下追求大屏的时代,其实已经很少有厂商愿意去做小屏手环了,前几年手环风靡一时的时候,小屏手环随处可见
2024-07-20 12:01:00
米家净化器Ultra正式发布 全效空净专为易过敏人群定制
米家净化器Ultra,作为一款全效空气净化器,其核心优势在于配备的5组专业滤芯,以及多达10层的复合净化技术。这一设计不仅涵盖了基础的空气净化需求
2024-07-20 12:01:00
小米buds 5发布 可独立录音 雷军推荐给iPhone用户
【CNMO科技消息】7月19日晚,在2024雷军演讲和小米新品发布会上,小米buds5耳机正式上市,售价699元,声音由哈曼卡顿团队调校
2024-07-20 12:01:00
Redmi K70至尊版/至尊冠军版发布!价格太惊喜
【CNMO科技消息】7月19日晚,小米举行2024雷军年度演讲和新品发布会,RedmiK70至尊版正式与消费者见面,售价2599元起
2024-07-20 12:01:00
小米首款小折叠MIX Flip发布 不到6000元配备大外屏
【CNMO科技消息】7月19日晚,雷军带来了个人的第五次年度演讲,而在此次演讲上,雷军不光介绍了自己当初选择造车背后的心路历程
2024-07-20 12:01:00
官方提醒!三星Galaxy Ring计步功能或受到磁铁干扰
【CNMO科技消息】三星的智能戒指GalaxyRing已经在Unpacked2024上登场。对于三星和粉丝们来说,这是一片未被探索的领域
2024-07-20 12:01:00
iPad mini 7爆料汇总:无缘高刷屏幕
【CNMO科技】在苹果庞大的产品矩阵中,iPadmini以其独特的定位——小巧的机身与强大的性能完美结合,赢得了众多用户的青睐
2024-07-20 12:02:00
洗净比并非发展唯一主线,海尔引领洗衣机“创新换代”
今年以来,洗衣机市场延续了此前良好的走势。根据奥维云网(AVC)的推总数据显示,2024年Q1洗衣机市场全渠道零售额规模约204亿元
2024-07-20 12:02:00
小米发布会新品前瞻:雷军“一拖九” 今晚亲自带飞
【CNMO科技】一年一度的“科技春晚”就要来了。注意,这里我们说的不是苹果,而是小米。小米将于本周五(7月19日),也就是今晚7点
2024-07-20 12:02:00