• 我的订阅
  • 头条热搜
AI新时代揭幕!会“思考解题逻辑”的OpenAI推理大模型登场
财联社9月13日讯北京时间周五凌晨1时许,AI时代迎来崭新的起点——能够进行通用复杂推理的大模型终于走到台前。OpenAI在官网发布公告称,开始向全体订阅用户开始推送OpenAI o1预览模型——也就是此前被广泛期待的“草莓”...……更多
国产大模型首发中文逻辑推理,「天工大模型4.0」o1版来了
...去,如此自信的原因可能在于最近人们让大模型学会了「推理」的方法。就在 9 月份,OpenAI 正式公开前所未有的复杂推理大模型 o1,这是一个重大突破,新模型既具有通用的能力,也可以解决比此前的科学、代码和数学模型能...……更多
...自动化科研和开放式发现的综合AI系统,标志着科学发现新时代的开始。尽管它展现出非凡的潜力,但目前并不完美,应警惕“AI科学家”被滥用的风险。推进流程行云流水AI技术不断进步,让科学家能借助一些模型来集思广益或...……更多
重磅!OpenAI o1模型还没有实现真正的逻辑推理能力
...-preview和o1-mini模型已经可以使用。OpenAI宣布,“新模型在推理能力上代表了人工智能能力的新水平,因此,计数器将重置为1”。根据OpenAI的自测,o1在竞赛编程问题(Codeforces)中排名第89个百分点,在美国数学奥林匹克竞赛(AIM...……更多
...智能的旗舰产品GPT-4为代表的大语言模型在逻辑测试中的推理表现很糟糕:它们犯下前后不一致的错误,而且推理过程往往是荒谬的。近日发表在《皇家学会开放科学》杂志上的一项研究表明,大语言模型所依赖的语料库往往反...……更多
苹果新论文证明LLM大模型存在缺陷!没有进行真正的逻辑推理
...tical Reasoning”的论文,揭示了大型语言模型(LLM)在数学推理方面的显著局限性。尽管这些模型在生成人类水平的文本方面表现出色,但当处理简单的数学问题时,即使问题仅进行了微小的改动,如添加无关信息,模型的表现也...……更多
罗格斯大学团队提出思想链概念,提高大模型的算数推理能力
...概念,提高了大语言模型(LLM,large language models)在复杂推理任务上的性能,例如算术推理、常识推理和符号推理等。图 | 金明宇(来源:金明宇)CoT 的原理是通过提供推理过程的示例,来教会模型处理推理,详细说明导致最...……更多
姚期智院士大模型新研究:思维图DoT,用数学理论确保AI逻辑一致
姚期智院士领衔,推出大模型新推理框架,CoT“王冠”戴不住了。提出思维图(DiagramofThought),让大模型思考更像人类。团队更是为这种推理过程提供了数学基础,通过拓扑斯理论(Topos Theory)正式化(formalize)DoT,确保其逻...……更多
奥林匹克竞赛里选最聪明的AI:Claude-3.5-Sonnet vs. GPT-4o?
...异,近来Anthropic公司最新发布的Claude-3.5-Sonnet因在知识型推理、数学推理、编程任务及视觉推理等任务上设立新行业基准而引发广泛讨论:Claude-3.5-Sonnet 已经取代OpenAI的GPT4o成为世界上”最聪明的AI“(Most Intelligent AI)了……更多
影响英伟达根本逻辑的大争论:OpenAI改变策略意味着什么?谁在撒谎?
大模型预训练“缩放定律”定律失效?模型推理成“解药”,英伟达一家独大格局要变天?“缩放定律”指导下,AI大模型预训练目前遭遇瓶颈。据路透12日报道,硅谷主要AI实验室的新模型训练计划目前普遍进展不顺,新模型...……更多
商汤又“夺金”!SuperCLUE-V多模态大模型基准发布10月榜单
...73.56的高分,并在数理逻辑维度取得第一,体现其强大的推理能力。 SenseChat-Vision5.5基础能力突出,数理逻辑维度超越GPT-4o本次SuperCLUE-V涵盖了国内外最具代表性的11个开源/闭源多模态理解大模型,聚焦多维度能力评估,包括基...……更多
科学家推出大模型数据集,涵盖奥赛数学题,有望让AI辅导数学课程
...解决复杂数学问题的能力。通过此,他们不仅提高了算法推理速度,还提高了算法搜索中间结果的质量。所新推出的数据集 TriMaster100,也更加符合算法在复杂数学问题下的评价场景。目前,赵子龙的合作者正在基于本次成果开...……更多
...科技发布从容大模型 可支持图文理解、文案写作、逻辑推理等功能 【云从科技发布从容大模型 可支持图文理解、文案写作、逻辑推理等功能】《科创板日报》18日讯,云从科技发布从容大模型。在现场演示中,从容大模型可支...……更多
蚂蚁自研知识增强大模型服务框架KAG,可显著提升知识推理准确率
...地,也一定要对时间、数字和逻辑敏感,无论让它做多跳推理,还是逻辑规则数字计算,而这些恰好是大语言模型所不擅长的,包括前一段时间热议的 9.9 和 9.12 比大小的例子。基于此,我们认为在垂直领域落地的时候,大语言...……更多
ChatGPT 火爆,程序员会不会被取代?答案都在这里!
...伴生一系列 AI 相关的职业,催生 AI 程序员。ChatGPT 就是新时代的 OS,现在每个人都可以尝试把专业领域的知识以用户体验的方式传达出去,ChatGPT 可以观察到每一个问题的深度,准确地满足用户的需求。从人机交互的角度,王千...……更多
...过程中,其范围、种类和功能也需要客观考量。从而催生新时代的数字法理。其二,数字法律关系。随着数字时代的到来,人类进入了不依赖于时间、地点的数字化生存模式,每个人都会在数字交往中形成碎片化的、多处“流动...……更多
2023-11-06 05:06:00数字法理的根基与面向
超星未来梁爽:软硬件协同优化,赋能AI 2.0新时代
...爽博士出席并发表主题演讲《软硬件协同优化,赋能AI2.0新时代》。 大模型是AI2.0时代的“蒸汽机” AI+X应用落地及边缘计算将成为关键 自ChatGPT发布以来,大模型引爆“第四次工业革命”,成为AI2.0时代的“蒸汽机”,驱动着...……更多
谷歌最新自然语言推理算法
谷歌发布全新反向推理算法LAMBADA,无惧搜索空间爆炸!自动推理绝对算是自然语言处理领域的一大难题,模型需要根据给定的前提和知识推导出有效且正确的结论。尽管近年来NLP领域借着大规模预训练语言模型在各种「自然语...……更多
人类和AI在推理任务中的表现相似,Google DeepMind研究揭示AI局限性
...人工智能(AI),特别是大型Transformer语言模型(LMs)在推理任务中的表现及其局限性。研究结果显示,尽管这些模型在处理自然语言方面表现卓越,但在复杂逻辑推理任务中,人类和语言模型都会受到语义内容合理性和可信度...……更多
给小学数学题加句废话,OpenAI o1就翻车了,苹果论文质疑AI推理
苹果新论文:AI 大模型可能不会推理。AI 大模型(LLM)真的像我们理解的那样能「思考」或「推理」吗?最近,苹果的一篇论文探讨了这个问题,并且给出了一个倾向于「否」的答案。相关帖子被很多人围观。这篇题为「GSM-Symb...……更多
百川智能发布baichuan3稳定语言模型
...处理和代码生成领域的强大实力。不仅如此,其在对逻辑推理能力及专业性要求极高的MCMLE、MedExam、CMExam等权威医疗评测上的中文效果同样超过了GPT-4,是中文医疗任务表现最佳的大模型。Baichuan3还突破“迭代式强化学习”技术...……更多
科大讯飞刘庆峰:讯飞星火大模型10月底整体赶超ChatGPT
...开放了560项AI能力,并聚集了超过500万生态合作伙伴。在新时代的机遇下,科大讯飞将通过能力开放、插件开放、行业共创,与千行百业共建生态。刘庆峰宣布,首批来自36个行业的3000余家企业开发者将接入星火大模型,联合各...……更多
上海AI实验室版o1已上线!数学题、Leetcode全拿下,还会玩24点
...编程、数字游戏等任务。这就是上海AI实验室版o1——强推理模型书生InternThinker,刚刚正式开放试用!新模型不仅在长思维能力方面有了很大提升,而且还能在推理过程中进行自我反思和纠正。先来一起看两个例子感受一下:比...……更多
昆仑万维:“天工大模型3.0”将于4月17日正式发布 同步开源4000亿参数MoE超级模型
...“天工2.0”MoE大模型,“天工3.0”在模型语义理解、逻辑推理、以及通用性、泛化性、不确定性知识、学习能力等领域拥有惊人的性能提升,其模型技术知识能力提升超过20%,数学/推理/代码/文创能力提升超过30%。同时,“天工...……更多
号称博士生水准!OpenAI最新模型仍分不出9.11和9.8哪个大
...科技9月14日消息,OpenAI推出了OpenAI o1预览模型,官方宣称推理能力更强,可达理科博士生水准。按照官方技术博客说法,o1在推理能力上代表了人工智能最强的水平。同时官方放出了更多OpenAI o1的更多演示视频。比如使用OpenAI o1...……更多
大模型降价背后,国产大模型的竞争逻辑变了
...市场拱手让人。另一方面,随着大模型产业的快速发展,推理成本飞速下降,也成为终端降价的基础。据百度官方透露,相比一年前,文心大模型的算法训练效率提升到了原来的5.1倍,周均训练有效率达到98.8%,推理性能提升了1...……更多
Anthropic再反击!发布Claude 3.5吊打GPT-4o,视觉、逻辑推理等方面表现更强
...本Claude 3.5 Sonnet。从官方披露的测试数据来看,其在逻辑推理、编程、数学等方面中的表现性能均超越GPT-4o。网友直言,“太卷了,现在AI竞争是要以周为单位了吗?” 从官方介绍来看,Claude 3.5全家桶仍会有3款系列模型,分别...……更多
让OpenAI o1逆天的慢思考,360两月前就做出来了?周鸿祎CoE媲美CoT,应用太前瞻
...读】o1大火背后,最关键的技术是CoT。模型通过一步一步推理,恰恰是「慢思考」的核心要义。而这一观点,其实这家国内大厂早就率先实现了。OpenAI的理念,居然被国内公司抢先践行了?比起OpenAI,这家公司的idea提出得更早,...……更多
ChatGPT一周年,机会在大厂还是小公司?
...人生轨迹的海量创业者们。目前来看,Open AI很可能成为新时代里的苹果公司——就连创始人被驱逐出董事会再回归的桥段,都如此相似。就算它无法复制苹果的成功,微软和谷歌也足够有野心。在中国创业圈,AI狂飙的剧情正在...……更多
港中文团队提出大模型元推理范式,革新大模型的评价体系
...一定启示。日前,相关论文以《大型语言模型评价中的元推理革命》(MR-GSM8K: A Meta-Reasoning Revolution in Large Language Model Evaluation)为题发在 arXiv,曾忠燊是第一作者,香港中文大学教授贾佳亚担任通讯作者 [1]。图……更多
更多关于科技的资讯:
智网车路云 创新领未来——2024鄂尔多斯智能网联产业生态大会开幕
本文转自:人民网-内蒙古频道活动现场。实习生 王柯然摄人民网鄂尔多斯12月23日电 (张雪冬、实习生王柯然)12月23日
2024-12-23 22:04:00
乘联会秘书长:不看好日产和本田合并 忘记降油耗的三缸机了吗
快科技12月23日消息,乘联分会秘书长崔东树通过其个人微信公众号发文称,个人不看好日产和本田的合并。在他看来,本田和日产均需要加大中国本土化研发投入和实现依托中国产业链优势的产品创新
2024-12-23 22:04:00
《王者荣耀》梦幻联动:QQ飞车女主小橘子开到王者峡谷
快科技12月23日消息,《王者荣耀》宣布联动《QQ飞车》,女主小橘子来到王者峡谷。设计团队采用运动机能与现代时尚风格进行设计
2024-12-23 22:04:00
快递包裹飞起来!山东移动临沂分公司5G-A赋能现代物流城发展
齐鲁晚报·齐鲁壹点 主余凤近日,在临沂市新明辉智慧仓储物流园,一个快递包裹正等待着它的特殊旅程。与往常不同,这个包裹不是通过传统的货车运输
2024-12-23 22:25:00
美团“团买买”突然停止运营!可退款
快科技12月23日消息,美团旗下微信社群团购业务“团买买”发布公告称,由于平台业务调整,团买买将于2024年12月31日24时起停止运营
2024-12-23 22:34:00
新一代核心系统全面上线!中华财险与阿里云达成数智化升级新合作
中国网讯(记者 胡俊)12月23日,中华财险新一代分布式核心系统全面上线,其建设规模和复杂度在业内均为罕见,成效也殊为显著
2024-12-23 22:55:00
蚂蚁集团大动作!成立新的支付宝事业群 实施轮值总裁制度
快科技12月23日消息,蚂蚁集团发布全员信,进行新一轮组织架构调整。在新的组织架构调整中,蚂蚁集团将新成立数字支付事业群和支付宝事业群两大事业群
2024-12-23 23:04:00
EA否决《死亡空间4》
格兰·斯科菲尔德开创了《死亡空间》系列,在离开EA Visceral后又与他人创立了Sledgehammer工作室,动视收购了该工作室并将其升格为年货供应商
2024-12-23 23:04:00
【评论员观察】抓首发经济抢市场机遇
“察势者明,趋势者智。”中央经济工作会议后,“首发经济”成为热门话题。简单而言,首发经济是企业一系列开创性经济活动的集合
2024-12-23 23:25:00
男子9年前买199元“恋爱险”结婚后兑付:到账1万元
快科技12月23日消息,据报道,近期有多位网友发帖称,自己多年前购买的“恋爱保险”,最近在保险公司的要求下赔付1999元
2024-12-23 23:34:00
2025开年首款新机!REDMI Turbo 4开启预约:首发天玑8400-Ultra
快科技12月23日消息,REDMI Turbo 4目前已经正式开启预约,该机将于2025年1月发布,是2025开年首款新机
2024-12-23 18:33:00
韩国学术界呼吁效仿台积电成立KSMC:维持半导体领导地位
快科技12月23日消息,据媒体报道,韩国国家工程院(NAEK)近日在首尔举行的研讨会上,讨论了效仿台积电成立韩国半导体制造公司(KSMC)的计划
2024-12-23 18:33:00
央视曝光智能门锁突然自燃失火原因!看完速转发给家人
快科技12月23日消息,据央视报道,日前,贵州贵阳一小区位于13层的住宅发生火情,消防员到场后发现,房屋门锁紧闭,无人员在内
2024-12-23 18:33:00
小米SU7最新版本OTA推送:正式接入VLM视觉语言大模型
快科技12月23日消息,小米汽车官方宣布,小米SU7汽车已接收到Xiaomi HyperOS 1.4.5版本的OTA更新
2024-12-23 18:33:00
近日,中新经纬小编跟随搬家师傅体验了“搬家小哥”的一天。曹师傅表示:“老手平均一个月挣一万四五没问题,单王也能到两万。也有挣几千的
2024-12-23 18:47:00