• 我的订阅
  • 头条热搜
AI新时代揭幕!会“思考解题逻辑”的OpenAI推理大模型登场
财联社9月13日讯北京时间周五凌晨1时许,AI时代迎来崭新的起点——能够进行通用复杂推理的大模型终于走到台前。OpenAI在官网发布公告称,开始向全体订阅用户开始推送OpenAI o1预览模型——也就是此前被广泛期待的“草莓”...……更多
国产大模型首发中文逻辑推理,「天工大模型4.0」o1版来了
...去,如此自信的原因可能在于最近人们让大模型学会了「推理」的方法。就在 9 月份,OpenAI 正式公开前所未有的复杂推理大模型 o1,这是一个重大突破,新模型既具有通用的能力,也可以解决比此前的科学、代码和数学模型能...……更多
...自动化科研和开放式发现的综合AI系统,标志着科学发现新时代的开始。尽管它展现出非凡的潜力,但目前并不完美,应警惕“AI科学家”被滥用的风险。推进流程行云流水AI技术不断进步,让科学家能借助一些模型来集思广益或...……更多
重磅!OpenAI o1模型还没有实现真正的逻辑推理能力
...-preview和o1-mini模型已经可以使用。OpenAI宣布,“新模型在推理能力上代表了人工智能能力的新水平,因此,计数器将重置为1”。根据OpenAI的自测,o1在竞赛编程问题(Codeforces)中排名第89个百分点,在美国数学奥林匹克竞赛(AIM...……更多
...智能的旗舰产品GPT-4为代表的大语言模型在逻辑测试中的推理表现很糟糕:它们犯下前后不一致的错误,而且推理过程往往是荒谬的。近日发表在《皇家学会开放科学》杂志上的一项研究表明,大语言模型所依赖的语料库往往反...……更多
苹果新论文证明LLM大模型存在缺陷!没有进行真正的逻辑推理
...tical Reasoning”的论文,揭示了大型语言模型(LLM)在数学推理方面的显著局限性。尽管这些模型在生成人类水平的文本方面表现出色,但当处理简单的数学问题时,即使问题仅进行了微小的改动,如添加无关信息,模型的表现也...……更多
罗格斯大学团队提出思想链概念,提高大模型的算数推理能力
...概念,提高了大语言模型(LLM,large language models)在复杂推理任务上的性能,例如算术推理、常识推理和符号推理等。图 | 金明宇(来源:金明宇)CoT 的原理是通过提供推理过程的示例,来教会模型处理推理,详细说明导致最...……更多
姚期智院士大模型新研究:思维图DoT,用数学理论确保AI逻辑一致
姚期智院士领衔,推出大模型新推理框架,CoT“王冠”戴不住了。提出思维图(DiagramofThought),让大模型思考更像人类。团队更是为这种推理过程提供了数学基础,通过拓扑斯理论(Topos Theory)正式化(formalize)DoT,确保其逻...……更多
奥林匹克竞赛里选最聪明的AI:Claude-3.5-Sonnet vs. GPT-4o?
...异,近来Anthropic公司最新发布的Claude-3.5-Sonnet因在知识型推理、数学推理、编程任务及视觉推理等任务上设立新行业基准而引发广泛讨论:Claude-3.5-Sonnet 已经取代OpenAI的GPT4o成为世界上”最聪明的AI“(Most Intelligent AI)了……更多
影响英伟达根本逻辑的大争论:OpenAI改变策略意味着什么?谁在撒谎?
大模型预训练“缩放定律”定律失效?模型推理成“解药”,英伟达一家独大格局要变天?“缩放定律”指导下,AI大模型预训练目前遭遇瓶颈。据路透12日报道,硅谷主要AI实验室的新模型训练计划目前普遍进展不顺,新模型...……更多
商汤又“夺金”!SuperCLUE-V多模态大模型基准发布10月榜单
...73.56的高分,并在数理逻辑维度取得第一,体现其强大的推理能力。 SenseChat-Vision5.5基础能力突出,数理逻辑维度超越GPT-4o本次SuperCLUE-V涵盖了国内外最具代表性的11个开源/闭源多模态理解大模型,聚焦多维度能力评估,包括基...……更多
科学家推出大模型数据集,涵盖奥赛数学题,有望让AI辅导数学课程
...解决复杂数学问题的能力。通过此,他们不仅提高了算法推理速度,还提高了算法搜索中间结果的质量。所新推出的数据集 TriMaster100,也更加符合算法在复杂数学问题下的评价场景。目前,赵子龙的合作者正在基于本次成果开...……更多
蚂蚁自研知识增强大模型服务框架KAG,可显著提升知识推理准确率
...地,也一定要对时间、数字和逻辑敏感,无论让它做多跳推理,还是逻辑规则数字计算,而这些恰好是大语言模型所不擅长的,包括前一段时间热议的 9.9 和 9.12 比大小的例子。基于此,我们认为在垂直领域落地的时候,大语言...……更多
ChatGPT 火爆,程序员会不会被取代?答案都在这里!
...伴生一系列 AI 相关的职业,催生 AI 程序员。ChatGPT 就是新时代的 OS,现在每个人都可以尝试把专业领域的知识以用户体验的方式传达出去,ChatGPT 可以观察到每一个问题的深度,准确地满足用户的需求。从人机交互的角度,王千...……更多
...过程中,其范围、种类和功能也需要客观考量。从而催生新时代的数字法理。其二,数字法律关系。随着数字时代的到来,人类进入了不依赖于时间、地点的数字化生存模式,每个人都会在数字交往中形成碎片化的、多处“流动...……更多
2023-11-06 05:06:00数字法理的根基与面向
超星未来梁爽:软硬件协同优化,赋能AI 2.0新时代
...爽博士出席并发表主题演讲《软硬件协同优化,赋能AI2.0新时代》。 大模型是AI2.0时代的“蒸汽机” AI+X应用落地及边缘计算将成为关键 自ChatGPT发布以来,大模型引爆“第四次工业革命”,成为AI2.0时代的“蒸汽机”,驱动着...……更多
谷歌最新自然语言推理算法
谷歌发布全新反向推理算法LAMBADA,无惧搜索空间爆炸!自动推理绝对算是自然语言处理领域的一大难题,模型需要根据给定的前提和知识推导出有效且正确的结论。尽管近年来NLP领域借着大规模预训练语言模型在各种「自然语...……更多
人类和AI在推理任务中的表现相似,Google DeepMind研究揭示AI局限性
...人工智能(AI),特别是大型Transformer语言模型(LMs)在推理任务中的表现及其局限性。研究结果显示,尽管这些模型在处理自然语言方面表现卓越,但在复杂逻辑推理任务中,人类和语言模型都会受到语义内容合理性和可信度...……更多
给小学数学题加句废话,OpenAI o1就翻车了,苹果论文质疑AI推理
苹果新论文:AI 大模型可能不会推理。AI 大模型(LLM)真的像我们理解的那样能「思考」或「推理」吗?最近,苹果的一篇论文探讨了这个问题,并且给出了一个倾向于「否」的答案。相关帖子被很多人围观。这篇题为「GSM-Symb...……更多
百川智能发布baichuan3稳定语言模型
...处理和代码生成领域的强大实力。不仅如此,其在对逻辑推理能力及专业性要求极高的MCMLE、MedExam、CMExam等权威医疗评测上的中文效果同样超过了GPT-4,是中文医疗任务表现最佳的大模型。Baichuan3还突破“迭代式强化学习”技术...……更多
上海AI实验室版o1已上线!数学题、Leetcode全拿下,还会玩24点
...编程、数字游戏等任务。这就是上海AI实验室版o1——强推理模型书生InternThinker,刚刚正式开放试用!新模型不仅在长思维能力方面有了很大提升,而且还能在推理过程中进行自我反思和纠正。先来一起看两个例子感受一下:比...……更多
昆仑万维:“天工大模型3.0”将于4月17日正式发布 同步开源4000亿参数MoE超级模型
...“天工2.0”MoE大模型,“天工3.0”在模型语义理解、逻辑推理、以及通用性、泛化性、不确定性知识、学习能力等领域拥有惊人的性能提升,其模型技术知识能力提升超过20%,数学/推理/代码/文创能力提升超过30%。同时,“天工...……更多
号称博士生水准!OpenAI最新模型仍分不出9.11和9.8哪个大
...科技9月14日消息,OpenAI推出了OpenAI o1预览模型,官方宣称推理能力更强,可达理科博士生水准。按照官方技术博客说法,o1在推理能力上代表了人工智能最强的水平。同时官方放出了更多OpenAI o1的更多演示视频。比如使用OpenAI o1...……更多
大模型降价背后,国产大模型的竞争逻辑变了
...市场拱手让人。另一方面,随着大模型产业的快速发展,推理成本飞速下降,也成为终端降价的基础。据百度官方透露,相比一年前,文心大模型的算法训练效率提升到了原来的5.1倍,周均训练有效率达到98.8%,推理性能提升了1...……更多
Anthropic再反击!发布Claude 3.5吊打GPT-4o,视觉、逻辑推理等方面表现更强
...本Claude 3.5 Sonnet。从官方披露的测试数据来看,其在逻辑推理、编程、数学等方面中的表现性能均超越GPT-4o。网友直言,“太卷了,现在AI竞争是要以周为单位了吗?” 从官方介绍来看,Claude 3.5全家桶仍会有3款系列模型,分别...……更多
让OpenAI o1逆天的慢思考,360两月前就做出来了?周鸿祎CoE媲美CoT,应用太前瞻
...读】o1大火背后,最关键的技术是CoT。模型通过一步一步推理,恰恰是「慢思考」的核心要义。而这一观点,其实这家国内大厂早就率先实现了。OpenAI的理念,居然被国内公司抢先践行了?比起OpenAI,这家公司的idea提出得更早,...……更多
ChatGPT一周年,机会在大厂还是小公司?
...人生轨迹的海量创业者们。目前来看,Open AI很可能成为新时代里的苹果公司——就连创始人被驱逐出董事会再回归的桥段,都如此相似。就算它无法复制苹果的成功,微软和谷歌也足够有野心。在中国创业圈,AI狂飙的剧情正在...……更多
港中文团队提出大模型元推理范式,革新大模型的评价体系
...一定启示。日前,相关论文以《大型语言模型评价中的元推理革命》(MR-GSM8K: A Meta-Reasoning Revolution in Large Language Model Evaluation)为题发在 arXiv,曾忠燊是第一作者,香港中文大学教授贾佳亚担任通讯作者 [1]。图……更多
9.11和9.9哪个大?实测12个大模型8个都答错,ChatGPT也翻车了
...模型的短板,此前行业也多次讨论过大模型的数学和复杂推理能力较差,即便是目前最好的大模型GPT-4也仍然有很大进步空间。最近的一次,第一财经曾在6月报道过,根据司南评测体系OpenCompass的高考全卷测试,包括GPT-4在内,7...……更多
能看风水 夸我有情趣 Kimi现在都这么野了吗
...何题,多少差了点意思。 但这次的 k1 就有说法了,既有推理能力又有视觉能力,意思就是可以直接拍照上传解题,还号称能在数理化上打平甚至超越 Open AI 的 o1 。那要是这么比的话,咱可就来劲了。正好, k1 新模型现在也不...……更多
更多关于科技的资讯:
00后整顿不了的职场 它能
人类正在通过 AI 重塑文明。或许很多人还不大认可这个说法,但在前两天,差评君受邀参加了火山引擎 Force 原动力大会之后
2024-12-26 00:06:00
华为:全球首个海拔5000米高原露天矿无人驾驶成果发布
快科技12月25日消息,华为中国发文宣布,与西部矿业、中铁十九局在西藏昌都玉龙铜矿三方共同建设的全球首个5000米高原露天矿无人驾驶项目成果交付
2024-12-26 00:06:00
不能摸也不能烧!这棵树全株有毒太魔性 树下躲雨也会中毒
世界上最倒霉的事情是只在树下躲了个雨,4个学生的皮肤和眼睛就被莫名“灼伤”,出现不同程度的炎症,有的部位甚至还起了水泡
2024-12-26 00:06:00
华为推出FreeBuds Pro 4蛇年典藏版:自带灵动小蛇 云杉绿、曜石黑双色
快科技12月26日消息,华为FreeBuds Pro 4蛇年典藏版已经在京东平台上架,目前尚未公布售价。从目前信息来看
2024-12-26 00:36:00
凯迪拉克女销售涉嫌私收购车款“跑路” 有人转账26万无法提车
快科技12月26日消息,据报道,近日,有不少在江苏南京一凯迪拉克4S店购车的市民在网络上反映,自己购车时被店内一女销售陈某某忽悠
2024-12-26 00:36:00
春节档“神仙打架”!2025年五部大片定档 前作票房一个比一个牛
快科技12月26日消息,今年春节档可谓神仙打架,目前已有5部大片定档2025年春节档上映。分别为《封神第二部:战火西岐》《射雕英雄传
2024-12-26 00:36:00
帝都、魔都双双押宝 年底了AI圈居然还有高手
好好好,本以为 OpenAI 直播已经是 24 年 AI 领域的尾声,没想到还有高手,国内 AI 圈又传出个大新闻。就在前几天
2024-12-26 00:36:00
都别喷萤火虫了 人家可能压根没想卖国内
要说这几天哪台新车心里最难受,那肯定是蔚来的 ET9 。在上周的 Nio Day 2024 上市,定价超过 80 万,身上集合了蔚来迄今为止所有最强的技术
2024-12-26 00:36:00
雷军公布小米su7冬测新成绩:全能之星、智能安全之星
12月25日晚,小米集团CEO雷军公布了小米SU7冬测新成绩。在中国汽研2024极北寒测挑战中,小米SU7被评为全能之星
2024-12-26 01:27:00
联想将推出legiongos掌上游戏机
联想正紧锣密鼓地为2025年国际消费类电子产品展览会(CES2025)做准备,并宣布将推出LegionGoS掌上游戏机
2024-12-26 01:32:00
小米15ultra电池曝光:超级微距、全焦段大光圈
随着2025年的脚步日益临近,各大品牌的Ultra机型也将陆续登场,相关爆料信息也随之涌现。近日,博主“智慧皮卡丘”透露
2024-12-26 01:34:00
特斯拉公布限时员工购车福利,需要在12.31之前提车
2月25日,据汽车博主@胖虎Shawn消息,特斯拉刚刚公布了限时员工购车福利:除了原本的赠送FSD(全自动驾驶)之外,额外增加了赠送两个选配
2024-12-26 01:51:00
一加与redmi又要对上了!新机均将配备1.5koled直屏
OPPO子品牌一加与小米子品牌REDMI算是一对老对手了。2024年,双方就在中高端和旗舰市场展开了多轮交锋,一加Ace3Pro与REDMIK70至尊版
2024-12-26 02:55:00
华为2024年全球文件存储和对象存储报告发布
据@华为数据存储消息,近日,国际权威研究机构ColdagoResearch发布了2024年全球文件存储和对象存储报告。在这两个榜单中
2024-12-26 03:27:00
华为freebudspro4开启年货节活动
最近想入手TWS耳机的同学有福利了,随着新年将至,华为音频也开启了年货节活动,多款华为音频产品开启了不同力度的促销活动
2024-12-26 03:35:00