见解,模型,语言,数学,问题,数学头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

LLM群体智能崛起，数学性能暴增11.6%！谷歌DeepMi

...是指，人类对自己思维、推理过程的直观认识。那么，大模型也具备「元认知」的能力吗？研究人员对此，提出了一种假设，并设想是否可以通过知识引导，进一步提高LLM的能力。其实，此前的研究已经表明，大模型表现出一...……更多

2024-09-23 09:50:00新作,群体,性能,数学,机构,智能

星火大模型数学能力遥遥领先已领先ChatGPT

举办的讯飞星火认知大模型成果发布会上，科大讯飞宣布推出“讯飞星火认知大模型”，并在现场进行了实机演示。据介绍，星火认知大模型具备以下能力：多风格多任务长文本生成、多层次跨语种语言理解，泛领域开放式知...……更多

2023-05-07 19:50:00星火,领先,模型,能力,数学,多语

苹果新论文证明LLM大模型存在缺陷！没有进行真正的逻辑推理

...nguage Models in Mathematical Reasoning”的论文，揭示了大型语言模型（LLM）在数学推理方面的显著局限性。尽管这些模型在生成人类水平的文本方面表现出色，但当处理简单的数学问题时，即使问题仅进行了微小的改动，如添加无关信...……更多

2024-10-13 14:15:00逻辑推理,新论,推理,缺陷,逻辑,模型

o1带火的CoT到底行不行？新论文引发了论战

...任务，至于其它任务，CoT 的效果并不显著甚至可能有损模型性能。另一个发现是 CoT 能帮助提升执行计算和符号操作的执行步骤，但却比不上能使用外部工具的 LLM。这是什么意思呢？该团队发现，相比于使用直接回答方法，使...……更多

2024-09-21 09:37:00新论,推理,符号,性能,任务,数据

首个AI高考全卷评测结果发布：最高分303，数学全不及格

...设计的高难度综合性测试，目前普遍被研究者用于考察大模型的智能水平。在前不久高考结束后，上海人工智能实验室旗下司南评测体系OpenCompass选取了7个大模型进行高考“语数外”全卷能力测试。6月19日， OpenCompass发布了首个...……更多

2024-06-24 09:22:00评测结果,最高分,评测,数学,高考,结果

马斯克 xAI 推出 Grok-1.5 大语言模型

...公司 xAI 今天在官方博客中宣布，正式推出 Grok-1.5 大语言模型。Grok-1.5 具有改进的推理能力和 128k 的上下文长度，其中最显著的改进之一是其在编码和数学相关任务中的表现。Grok-1.5 将在未来几天内在平台上向早期测试人员和...……更多

2024-03-29 14:00:00马斯,马斯克,模型,语言,基准,上下文

从个性化到情绪智能，揭秘美国AI教育产品的市场霸主之路

...式也融入了 AI。它引入了 AI 技术后打造了公司的重点 AI 模型 Birdbrain，能够自动从专家编写、审核和翻译的内容中自动抽取适合用户的题目，确保用户遇到的闯关题目难度适中，不会因为太简单而枯燥乏味。从 Duolingo 的例子中...……更多

2024-06-29 09:29:00之路,美国,霸主,情绪,智能,个性

曝Bengio新动向：世界模型+数学证明，确保AI系统正常运

...学总监。据介绍，Safeguarded AI旨在：通过结合科学的世界模型和数学证明，构建一个负责理解和降低其它AI Agent风险的AI系统。主打的就是一个量化安全保障。该项目由英国高级研究与发明局（ARIA）提供支持，据说未来ARIA将投入...……更多

2024-08-09 09:39:00动向,模型,运作,数学,系统,世界

CMU清华教LLM练成数学高手，LeanSTaR训练模型边思

...学生怎么办？CMU清华团队提出了Lean-STaR训练框架，在语言模型进行推理的每一步中都植入CoT，提升了模型的定理证明能力，成为miniF2F上的新SOTA。如果想训练LLM证明定理的能力，你会怎么做？既然模型可以通过海量语料学会生成...……更多

2024-08-10 09:47:00顶新,成数,清华,模型,训练,高手

以图灵机为师：通过微调训练让大语言模型懂执行计算过程

...议，其中多篇文章获得相应会议的最佳论文奖。大型语言模型（LLM）在各种自然语言处理和推理任务中表现出卓越的能力，某些应用场景甚至超越了人类的表现。然而，这类模型在最基础的算术问题的表现上却不尽如人意。当...……更多

2024-10-21 09:54:00灵机,模型,训练,过程,语言,运算符

菲尔兹奖得主亲测GPT-4o，经典过河难题破解失败！最强Cl

...最近，菲尔兹奖得主Timothy Gowers分享了实测GPT-4o的过程，模型在最简单的题目上竟然做错了，甚至网友们发现，就连Claude 3.5也无法幸免。在经典的「狼-山羊-卷心菜」过河问题上，如今所有的LLM都失败了！几天前，菲尔兹奖得主...……更多

2024-07-01 08:58:00菲尔,得主,难题,经典,农夫,模型

联通元景大模型亮相2024年中国品牌日打造产业智能化新范式

...参与中国品牌日活动,并在联通展馆精彩亮相联通元景大模型,充分展示大模型的核心能力及对各行业的颠覆性影响。能说、擅听、会看的联通元景大模型联通展台前热闹非凡,参观者络绎不绝。联通一位工作人员以实操+讲解的方...……更多

2024-05-13 15:00:00范式,中国,模型,智能,产业,品牌

AI发展变慢了？几位AI头部创业者并不赞同

...AI发展速度非常快。从数量角度看，现在每个月都有新的模型、新的产品、新的应用涌现出来。从质量角度看，OpenAI（美国头部AI公司）今年2月份发布的Sora（视频大模型），5月份发布的GPT-4o（多模态语言大模型），9月份发布的o...……更多

2024-09-21 13:52:00创业者,头部,创业,发展,模型,大昕

科大讯飞刘庆峰：讯飞星火大模型10月底整体赶超ChatGPT

星星之火，可以燎原。5月6日，讯飞星火认知大模型成果发布会在安徽合肥如期举行。科大讯飞董事长刘庆峰、研究院院长刘聪发布讯飞星火认知大模型，现场实测大模型七大核心能力，并发布教育、办公、汽车、数字员工四大...……更多

2023-05-08 13:43:00讯飞,星火,模型,整体,讯飞,星火

OpenAI o1太贵？那就自己做一个！纯提示方法让普通LL

...系列专注于复杂的推理任务，一经推出也是直接屠榜了大模型竞技场。在下面这些难度较大的数学、编码、科学等任务中，o1不仅比GPT-4o强上一大截，甚至比人类专家还要凶猛。OpenAI对此曾表示：通往AGI的路上，已经没有任何阻...……更多

2024-11-08 09:43:00太贵,推理,进化,提示,能力,方法

学而思携九章大模型、学而思学习机亮相世界人工智能大会

...赋能和带来的行业机遇已经成为共识，教育也已经成为大模型技术产品级落地的代表性行业。“教育与人才”位列本届大会行业论坛的十大重点议题，学而思、网易有道、猿力科技等教育企业纷纷携旗下人工智能产品亮相，成为...……更多

2024-07-04 23:00:00学习机,人工智能,人工,模型,大会,智能

名师引领共成长城乡交流促提升

...题和困惑。针对这些问题，4位授课老师也分享了自己的见解，精彩的思维碰撞赢得阵阵掌声。 ……更多

2023-12-27 07:20:00名师,城乡,交流,示范课,商丘,商丘市

不止反击，谷歌在AI群隔空@所有人

...歌2023年的I/O开发者大会上，其发布了全新一代的大语言模型PaLM 2以及生成式AI能力的“试验版”谷歌搜索和智能云等产品。这堪称一次相当惊艳的“组合炸弹”式轰炸，被很多媒体和网友吹爆了。很快，资本市场也快速响应，截...……更多

2023-05-11 23:00:00所有人,模型,语言,训练,能力,搜索

科大讯飞入局大模型混战，刘庆峰：10月底将赶超ChatGPT

出品 | 搜狐科技作者 | 梁昌均国内大模型混战之下，科大讯飞成为最新的入局者。自去年12月15日，科大讯飞启动1+N的大模型专项攻关后，历时近半年终于发布了最新技术成果。5月6日，科大讯飞正式对外发布讯飞星火认知大模...……更多

2023-05-07 03:00:00模型,讯飞,模型,星火,能力,认知

数学因不严格的论证而得到丰富，很多命题建立在尚未证明的猜想上

...后面的著名论证作一个粗糙的描述。在统计物理中有一个模型，称为n 向量模型，它与临界现象的概率模型中的伊辛（Ising）模型和Potts模型有密切的关系。在Z^d的每一点上都给定一个R^n单位向量。这就给出了一个单位向量的随机...……更多

2023-01-23 10:00:00命题,猜想,尚未,数学,素数,猜想

地球本该不存在：太阳系的混沌与稳定，背后隐藏的神奇数学规律

...为我们太阳系的表面和谐提供数学解释外，这项新研究的见解可能有助于科学家了解其他恒星周围系外行星的轨迹。行星不断地相互施加引力——这些小拖船不断对行星的轨道进行微小的调整。外行星要大得多，对小拖船的抵抗...……更多

2024-01-22 10:44:00太阳系,本该,规律,神奇,地球,背后

OpenAI超级对齐团队遗作：两个大模型博弈一番，输出更好懂

如果 AI 模型给的答案一点也看不懂，你敢用吗？随着机器学习系统在更重要的领域得到应用，证明为什么我们可以信任它们的输出，并明确何时不应信任它们，变得越来越重要。获得对复杂系统输出结果信任的一个可行方法是...……更多

2024-07-19 09:45:00遗作,输出,模型,团队,两个,模型

开源大模型杀疯了！Mistral新模型三分之一参数卷爆Lla

Llama 3.1 405B“最强模型”宝座还没捂热乎，就被砸场子了——Mistral AI发布最新模型Mistral Large 2，参数123B，用不到三分之一的参数量性能比肩Llama 3.1 405B，也不逊于GPT-4o、Claude 3 Opus等闭源模型。主打的就是一个高性价比。用官……更多

2024-07-26 09:39:00模型,参数,模型,基准,问题,推理

浅谈陶行知理论在数学课堂教学中的应用

...作者、参与者。课堂以学生为主，给学生提供阐述自己的见解，进行多向交流、争论，互疑互答的时间和机会；遇到思维障碍时，能够在教师的指导下进行观察、操作、实验等活动，不断分析、整理和归纳完成学习过程。因此，...……更多

2023-04-22 11:17:00陶行知,陶行,课堂教学,课堂,理论,数学

大语言模型逻辑推理“很糟糕”

...6月4日报道，以人工智能的旗舰产品GPT-4为代表的大语言模型在逻辑测试中的推理表现很糟糕：它们犯下前后不一致的错误，而且推理过程往往是荒谬的。近日发表在《皇家学会开放科学》杂志上的一项研究表明，大语言模型所...……更多

2024-06-12 18:15:00逻辑推理,推理,逻辑,模型,语言,模型

数学不是创造力的反面

...，他“总是记不住那些看似毫无意义的事情”，但是“对见解形成的过程有良好的记忆力”。抽象数学就是见解形成的过程，但可惜的是，太多的孩子把乘法表当成只需要死记硬背的无意义的工具。真理本身固然重要，但更重要...……更多

2024-04-27 05:56:00反面,创造力,数学,数学,剑桥大学,逻辑

“AI科学家”登场科研自动化时代来了？

...公司和加拿大、英国科学家携手，创建了一种基于大语言模型的“人工智能(AI)科学家”。从阅读文献到提出新假设，再到尝试各种解决方案并撰写论文，整个研究周期，“AI科学家”能一气呵成。Sakana公司在其官网表示，这位科...……更多