• 我的订阅
  • 头条热搜
语言≠思维,大模型学不了推理:一篇Nature让AI社区炸锅了
...到,人类大脑生成和解析语言的神经网络并不负责形式化推理,而且提出推理并不需要语言作为媒介。这篇论文声称「语言主要是用于交流的工具,而不是思考的工具,对于任何经过测试的思维形式都不是必需的」,引发了科技...……更多
...智能的旗舰产品GPT-4为代表的大语言模型在逻辑测试中的推理表现很糟糕:它们犯下前后不一致的错误,而且推理过程往往是荒谬的。近日发表在《皇家学会开放科学》杂志上的一项研究表明,大语言模型所依赖的语料库往往反...……更多
奥林匹克竞赛里选最聪明的AI:Claude-3.5-Sonnet vs. GPT-4o?
...异,近来Anthropic公司最新发布的Claude-3.5-Sonnet因在知识型推理、数学推理、编程任务及视觉推理等任务上设立新行业基准而引发广泛讨论:Claude-3.5-Sonnet 已经取代OpenAI的GPT4o成为世界上”最聪明的AI“(Most Intelligent AI)了……更多
科学家竞相破解大型语言模型背后的谜团
...复杂行为。面对复杂问题,人类在潜意识里会进行分步骤推理。受此启发,谷歌团队2022年引入了“思维链提示”,以描述一种让LLM展示其“思维”的方法。简单来说,思维链提示是一种特殊的上下文学习。不同于标准提示只给...……更多
谷歌最新自然语言推理算法
谷歌发布全新反向推理算法LAMBADA,无惧搜索空间爆炸!自动推理绝对算是自然语言处理领域的一大难题,模型需要根据给定的前提和知识推导出有效且正确的结论。尽管近年来NLP领域借着大规模预训练语言模型在各种「自然语...……更多
谷歌大模型推理范式,主要分为两个阶段
...新研究“自我发现”(Self-Discover),重新定义了大模型推理范式。与已成行业标准的思维链(CoT)相比,新方法不仅让模型在面对复杂任务时表现更佳,还把同等效果下的推理成本压缩至1/40。核心策略其实很简单:千人千面。...……更多
商汤科技与金山办公达成商业合作,“日日新”大模型补强办公软件理科大脑
...直是大模型的痛点,理科领域需要高度的抽象思维和逻辑推理能力,并且要求非常精准的答案,作为计算机科学和信息技术领域的重要工具,代码能力被视作衡量大模型智慧的关键维度。事实上,在过去一年国产大模型如火如荼...……更多
知乎 AI 革命:智能搜索与实时问答的融合
...生成,将这些答案里的有价值信息提炼出来,进行有效的推理,就能为一个 \" 新鲜出炉 \" 的专业问题提供一个立等可取的答案,提问的用户就可以能为快,然后再等其它的专业答主陆续赶到,下场答题。 在灰度测试这个功能...……更多
昆仑万维:“天工大模型3.0”将于4月17日正式发布 同步开源4000亿参数MoE超级模型
...“天工2.0”MoE大模型,“天工3.0”在模型语义理解、逻辑推理、以及通用性、泛化性、不确定性知识、学习能力等领域拥有惊人的性能提升,其模型技术知识能力提升超过20%,数学/推理/代码/文创能力提升超过30%。同时,“天工...……更多
...的32项学术基准中,从自然图像、音频和视频理解到数学推理,“双子座”Ultra的性能有30项超过了当前先进水平。谷歌公司称,在图像识别领域的测试结果显示,“双子座”Ultra性能优于迄今最先进的人工智能模型,具有天然多...……更多
...AI)系统在编码、战略规划和机器人科学三个领域执行复杂推理任务。聊天生成预训练转换器(ChatGPT)和“克劳德3-奥普斯”(Claude 3 Opus)等大语言模型(LLM),根据人类输入“提示词”处理和生成文本。研究人员说,过去18个月,这些技...……更多
国内创业者和投资人如何看待 Figure 01 机器人:距离具身智能还有多远?
...完成上面说的第二个步骤,模型中没有思维链,也不具备推理能力。PaLM-E 让机器人有了聪明的大脑,可以将复杂自然语言指令分解为简单指令,完成上面说的第一个步骤,然后再去调用 RT-1 执行动作。所以,PaLM-E 所做的只是自...……更多
苹果发布 OpenELM,基于开源训练和推理框架的高效语言模型
...,苹果在 Hugging Face 平台上发布了一个“具有开源训练和推理框架的高效语言模型”,名为 OpenELM。当然,这是一项开源语言模型,其源码及预训练的模型权重和训练配方可在苹果 Github 库中获取。IT之家将官方简介翻译如下:参...……更多
什么是AGI?人工智能的未来
...Artificial Intelligence)指的是能够像人类一样思考、学习和推理的机器或计算机程序 – 其能够具备人类的普遍智慧,即能够学习各领域知识,并能将知识输出在各个领域。当时,约翰·麦卡锡预计人工智能将在几个月内实现。约翰...……更多
...思维搜索的领域知识。策略和价值网络指导搜索过程。在推理过程中,预训练的MCTS模块使用策略网络来探索LLM的思想轨迹。随后,LLM审查MCTS的思想并识别任何错误,然后进行额外的MCTS模拟以生成修改后的想法。最后,将修改后...……更多
2023IDEA大会:让大模型更好应对复杂问题
...本正经的胡说八道”怎么解?众所周之,大模型存在深度推理能力差、知识不可追溯、实时更新代价高等局限性,这也成为其在许多严肃领域落地的主要瓶颈。如何弥补大模型的这部分缺陷,是当下AI应用的重要课题。为此,IDEA...……更多
探索终端操作系统领域AI大模型创新趋势 OpenHarmony技术大会OS原生智能分论坛召开
...发展带来了崭新的机遇,有望通过强大的语义理解和常识推理能力大大提升智能个人代理支持功能的广度和深度。”清华大学助理研究员李元春主题分享中软国际有限公司智能物联网军团产品研发管理部总经理、OpenHarmony项目群技...……更多
北大推出全新机器人多模态大模型!面向通用和机器人场景的高效推理和操作
...码仓库 Trending Research 第一位。为了赋予机器人端到端的推理和操纵能力,本文创新性地将视觉编码器与高效的状态空间语言模型集成,构建了全新的 RoboMamba 多模态大模型,使其具备视觉常识任务和机器人相关任务的推理能力,...……更多
AI表现直逼国际奥数优秀选手, 它要 “征服”数学了吗?
...同步揭晓。这项赛事的目的是推动发展大语言模型的数学推理能力,训练出更高数学水平的新AI模型。纯数学领域中的重大发现是推理和创造力的灵感结晶,往往意味着人类智慧极限的突破。迄今为止,解决或协助解决高等级数...……更多
...,目前已初具“近似人类”的自我认知、情感体验、思维推理能力,能够“听”懂人类语言、“理解”人的情绪和意图,并能较为逼真地呈现出来。基于此,随着脑机接口技术的发展,Sora或可成为连接人脑与人脑、人脑与机脑...……更多
谷歌王者归来?最新推出的大模型到底有多强,能否挑战GPT-4
...问题,这就使其尤其擅长解释数学和物理等复杂科目中的推理。Gemini能够根据照片按步骤讲题。来源:官方视频谷歌还发布了一个时长六分钟的视频,展现了测试员和Gemini的一些有趣互动,其中包括让Gemini识别图片并用多种语言...……更多
数字员工、超级个体、具身智能,AI Agent未来发展十大研究方向
...侧大模型加速部署,或将成为未来交互新入口。AI在数学推理、新药研发、材料发现、蛋白质合成等领域大显身手, \"AI科学家\"有望加速问世。这三个报告,一方面预测了AI Agent的未来发展趋势,另一方面也同时提及了多模态大...……更多
微软发布旗下最小语言模型phi-2
...写电子邮件和故事,以及总结文本。在常识、语言理解和推理的基准测试中,该模型在某些领域能够跟上多达100亿个参数的模型。微软现在更新发布的Phi-2拥有27亿参数,规模虽然比此前版本翻番,但相比较其它主流语言模型,...……更多
百川智能发布baichuan3稳定语言模型
...处理和代码生成领域的强大实力。不仅如此,其在对逻辑推理能力及专业性要求极高的MCMLE、MedExam、CMExam等权威医疗评测上的中文效果同样超过了GPT-4,是中文医疗任务表现最佳的大模型。Baichuan3还突破“迭代式强化学习”技术...……更多
对话王田苗:万亿市场之下,大模型 + 机器人还有四大问题未解决
...务设定多个小模型,并提供不同的参数训练,端到端减少推理成本。另外,将专用小 GPU 芯片置入到机器人中,也可提高任务实时性,目前特斯拉已在自动驾驶中尝试了这种做法。硬氪:今年有哪些细分场景的模型值得关注?王...……更多
16家头部大模型公司上海神秘碰头,现场人挤人人人
...最为关键的三大层面,即:算力层:用于基础模型训练和推理的基础设施 模型层:使用基础模型加速生成式AI应用构建 应用层:开箱即用的生成式AI应用至于能力如何,我们直接来看下最为直观的效果。在生成式AI应用方面,...……更多
苹果的封闭生态为大模型打开!发布开源多模态大模型、每天为 AI 烧百万美元,零碎的 Android 生态打得过吗?
...布了两篇新的研究论文,介绍了 3D 头像和高效语言模型推理的新技术,被认为可能带来更身临其境的视觉体验,并允许复杂的人工智能系统在 iPhone 和 iPad 等消费设备上运行。 AI 社区中的许多人后来才注意到 Ferret 的发布,他...……更多
ASC24超算大赛启动会在京举行,大模型推理等成为赛题
...在上海大学举行的总决赛。据悉,今年的赛题包括大模型推理优化、渗流数值模拟,以及国际通行基准测试HPL和HPCG等。来自高性能计算和人工智能领域的中国科学院院士、中国工程院院士、专家学者及参赛师生代表等参加了启...……更多
开源社区分水岭:Meta大模型Llama 3发布,参数最高或达4000亿
...行业基准测试上展现了最先进的性能,提供了包括改进的推理能力在内的新功能,是目前市场上最好的开源大模型。在架构层面,Llama3选择了标准的仅解码(decoder-only)式Transformer架构,采用包含128K token词汇表的分词器。Llama 3...……更多
llava-1.6与gpt-4vmp面硬刚的性能,一起来看看
...率基础上,并通过改进视觉指令数据集和SGLang,提升了“推理、OCR等方面的性能”,意味着人类向AGI(通用人工智能)探索的道路上又迈进了一步。LLaVA-1.6的研发团队成员Haotian Liu在X平台发文原文 二、更适合中国人体质的GPT-4V...……更多
更多关于科技的资讯:
中国小女孩向马斯克报BUG成功:后者一个单词回应
快科技7月1日消息,近日,一位名叫茉莉的中国小女孩录制了一段视频隔空喊话马斯克,向其报了一个特斯拉的Bug,获得了马斯克的回复
2024-07-01 22:12:00
细菌鞭毛马达:最不寻常的生物结构 质子动力每分钟10万转
如果您问什么生物结构最不像自然进化的,那应该就是细菌的鞭毛马达。大部分细菌都可以在需要的时候长出鞭毛,然后通过旋转鞭毛来移动自己
2024-07-01 22:12:00
“学界牵手业界” 以赛为媒共育医疗人才供应链
南海网7月1日消息(记者 符彩云) 第九届全国大学生生物医学工程创新设计竞赛将于7月22日至26日在海南三亚崖州湾科技城举办
2024-07-01 23:30:00
汽车界的小米 零跑汽车6月交付20116台 创历史新高
快科技7月1日消息,今天零跑汽车公布了2024年6月销售数据,6月交付达20116台,创历史新高!同比增长52.3%, 环比增长10
2024-07-01 22:42:00
2024过半!新造车KPI达成率出炉:全指望下半年了
卷营销、卷价格,甚至卷老板,今年上半年车企在内卷的赛道风驰电掣,市场的惨烈程度,我们历历在目:比亚迪开年“电比油低”,五菱吉利等纷纷跟进降价
2024-07-01 22:42:00
一次加氢可行驶200多公里!国内首列氢能源智轨电车装配下线
快科技7月1日消息,据央视新闻报道,今天国内首列氢能源智轨电车在宜宾智轨产业园装配下线。氢能源智轨电车由中车株洲所自主研制
2024-07-01 22:12:00
韩妹《妮姬:胜利女神》COS图赏:身材优势尽显
《NIKKE:胜利女神》这款游戏中,桃乐丝、苏打和毒蛇是备受玩家喜爱的角色。近日,一位韩国Coser“siru_0207”分享了她的最新作品
2024-07-01 22:42:00
迪士尼《白雪公主》真人电影终于拍完:黑雪公主自豪
迪士尼《白雪公主》真人电影现已结束拍摄工作,近日瑞秋·泽格勒分享了这一消息。她表示:“《白雪公主》已杀青,我感到非常自豪和激动
2024-07-01 22:42:00
路特斯CEO称绝不会加入价格战:会增加用户持有焦虑和购买顾虑
快科技7月1日消息,日前路特斯集团CEO冯擎峰近日在微博明确表示,作为定位百万级豪华纯电汽车品牌,路特斯不会参与价格战
2024-07-01 23:12:00
对话领袖 | 廖顺喜先生:企业家精神与慈善公益的践行者
为赋能全球杰出企业品牌,深入探索服务需求,助力企业解决发展中的挑战与难题,特推出【对话领袖】专访系列,邀请优秀创业领袖
2024-07-01 22:55:00
火锅店必点菜品:小酥肉一年卖出100亿元
快科技7月1日消息,去火锅店你必点的菜品是什么?很多网友给的答案不一,比如牛羊卷、虾滑、毛肚、土豆片、豆腐等,但可能你想到不到的是
2024-07-01 23:12:00
创菱科技电暖桌:引领智能健康取暖新时代
位于贵州省毕节市七星关区小坝镇新鑫科技产业园的创菱科技实业有限公司,自成立以来,专注于电暖桌的研发、制造和销售,是一家致力于科技创新与品质卓越的领先企业
2024-07-01 22:46:00
伊刻活泉现泡茶亮相FBIF2024,以科技创新重塑茶饮新体验
6月25日至27日,备受瞩目的FBIF 2024食品饮料创新论坛及FBIF食品创新展在国家会展中心(上海)举行。本次展会汇聚了全球食品饮料行业的嘉宾展商
2024-07-01 23:03:00
半年销售额达6亿余元,昌乐县借电商平台打造珠宝销售的黄金时代
王佳潼潍坊报道“我们抖音运营中心落户昌乐主要是因为当地有庞大的货源。”抖音运营中心总经理薛婷说,昌乐县的珠宝电商产业基础非常好
2024-07-01 23:05:00
虽然如今的智能手机都有原生的骚扰屏蔽功能,第三方应用也不少,但运营商所采用的云端拦截技术依然有其独特的作用。7月1日,北京商报记者注意到
2024-07-02 00:14:00