• 我的订阅
  • 头条热搜
LLM群体智能崛起,数学性能暴增11.6%!谷歌DeepMind四大机构联手新作
...是指,人类对自己思维、推理过程的直观认识。那么,大模型也具备「元认知」的能力吗?研究人员对此,提出了一种假设,并设想是否可以通过知识引导,进一步提高LLM的能力。 其实,此前的研究已经表明,大模型表现出一...……更多
星火大模型数学能力遥遥领先已领先ChatGPT
举办的讯飞星火认知大模型成果发布会上,科大讯飞宣布推出“讯飞星火认知大模型”,并在现场进行了实机演示。据介绍,星火认知大模型具备以下能力:多风格多任务长文本生成、多层次跨语种语言理解,泛领域开放式知...……更多
苹果新论文证明LLM大模型存在缺陷!没有进行真正的逻辑推理
...nguage Models in Mathematical Reasoning”的论文,揭示了大型语言模型(LLM)在数学推理方面的显著局限性。尽管这些模型在生成人类水平的文本方面表现出色,但当处理简单的数学问题时,即使问题仅进行了微小的改动,如添加无关信...……更多
o1带火的CoT到底行不行?新论文引发了论战
...任务,至于其它任务,CoT 的效果并不显著甚至可能有损模型性能。另一个发现是 CoT 能帮助提升执行计算和符号操作的执行步骤,但却比不上能使用外部工具的 LLM。这是什么意思呢?该团队发现,相比于使用直接回答方法,使...……更多
首个AI高考全卷评测结果发布:最高分303,数学全不及格
...设计的高难度综合性测试,目前普遍被研究者用于考察大模型的智能水平。在前不久高考结束后,上海人工智能实验室旗下司南评测体系OpenCompass选取了7个大模型进行高考“语数外”全卷能力测试。6月19日, OpenCompass发布了首个...……更多
马斯克 xAI 推出 Grok-1.5 大语言模型
...公司 xAI 今天在官方博客中宣布,正式推出 Grok-1.5 大语言模型。Grok-1.5 具有改进的推理能力和 128k 的上下文长度,其中最显著的改进之一是其在编码和数学相关任务中的表现。Grok-1.5 将在未来几天内在 平台上向早期测试人员和...……更多
从个性化到情绪智能,揭秘美国AI教育产品的市场霸主之路
...式也融入了 AI。它引入了 AI 技术后打造了公司的重点 AI 模型 Birdbrain,能够自动从专家编写、审核和翻译的内容中自动抽取适合用户的题目,确保用户遇到的闯关题目难度适中,不会因为太简单而枯燥乏味。从 Duolingo 的例子中...……更多
曝Bengio新动向:世界模型+数学证明,确保AI系统正常运作
...学总监。据介绍,Safeguarded AI旨在:通过结合科学的世界模型和数学证明,构建一个负责理解和降低其它AI Agent风险的AI系统。主打的就是一个量化安全保障。该项目由英国高级研究与发明局(ARIA)提供支持,据说未来ARIA将投入...……更多
CMU清华教LLM练成数学高手,LeanSTaR训练模型边思考边证明,登顶新SOTA
...学生怎么办?CMU清华团队提出了Lean-STaR训练框架,在语言模型进行推理的每一步中都植入CoT,提升了模型的定理证明能力,成为miniF2F上的新SOTA。如果想训练LLM证明定理的能力,你会怎么做?既然模型可以通过海量语料学会生成...……更多
以图灵机为师:通过微调训练让大语言模型懂执行计算过程
...议,其中多篇文章获得相应会议的最佳论文奖。大型语言模型 (LLM) 在各种自然语言处理和推理任务中表现出卓越的能力,某些应用场景甚至超越了人类的表现。然而,这类模型在最基础的算术问题的表现上却不尽如人意。当...……更多
菲尔兹奖得主亲测GPT-4o,经典过河难题破解失败!最强Claude 3.5回答离谱,LeCun嘲讽LLM
...最近,菲尔兹奖得主Timothy Gowers分享了实测GPT-4o的过程,模型在最简单的题目上竟然做错了,甚至网友们发现,就连Claude 3.5也无法幸免。在经典的「狼-山羊-卷心菜」过河问题上,如今所有的LLM都失败了!几天前,菲尔兹奖得主...……更多
联通元景大模型亮相2024年中国品牌日 打造产业智能化新范式
...参与中国品牌日活动,并在联通展馆精彩亮相联通元景大模型,充分展示大模型的核心能力及对各行业的颠覆性影响。能说、擅听、会看的联通元景大模型联通展台前热闹非凡,参观者络绎不绝。联通一位工作人员以实操+讲解的方...……更多
AI发展变慢了?几位AI头部创业者并不赞同
...AI发展速度非常快。从数量角度看,现在每个月都有新的模型、新的产品、新的应用涌现出来。从质量角度看,OpenAI(美国头部AI公司)今年2月份发布的Sora(视频大模型),5月份发布的GPT-4o(多模态语言大模型),9月份发布的o...……更多
科大讯飞刘庆峰:讯飞星火大模型10月底整体赶超ChatGPT
星星之火,可以燎原。5月6日,讯飞星火认知大模型成果发布会在安徽合肥如期举行。科大讯飞董事长刘庆峰、研究院院长刘聪发布讯飞星火认知大模型,现场实测大模型七大核心能力,并发布教育、办公、汽车、数字员工四大...……更多
OpenAI o1太贵?那就自己做一个!纯提示方法让普通LLM进化出复杂推理能力
...系列专注于复杂的推理任务,一经推出也是直接屠榜了大模型竞技场。在下面这些难度较大的数学、编码、科学等任务中,o1不仅比GPT-4o强上一大截,甚至比人类专家还要凶猛。OpenAI对此曾表示:通往AGI的路上,已经没有任何阻...……更多
学而思携九章大模型、学而思学习机亮相世界人工智能大会
...赋能和带来的行业机遇已经成为共识,教育也已经成为大模型技术产品级落地的代表性行业。“教育与人才”位列本届大会行业论坛的十大重点议题,学而思、网易有道、猿力科技等教育企业纷纷携旗下人工智能产品亮相,成为...……更多
...题和困惑。针对这些问题,4位授课老师也分享了自己的见解,精彩的思维碰撞赢得阵阵掌声。 ……更多
不止反击,谷歌在AI群隔空@所有人
...歌2023年的I/O开发者大会上,其发布了全新一代的大语言模型PaLM 2以及生成式AI能力的“试验版”谷歌搜索和智能云等产品。这堪称一次相当惊艳的“组合炸弹”式轰炸,被很多媒体和网友吹爆了。很快,资本市场也快速响应,截...……更多
科大讯飞入局大模型混战,刘庆峰:10月底将赶超ChatGPT
出品 | 搜狐科技作者 | 梁昌均国内大模型混战之下,科大讯飞成为最新的入局者。自去年12月15日,科大讯飞启动1+N的大模型专项攻关后,历时近半年终于发布了最新技术成果。5月6日,科大讯飞正式对外发布讯飞星火认知大模...……更多
数学因不严格的论证而得到丰富,很多命题建立在尚未证明的猜想上
...后面的著名论证作一个粗糙的描述。在统计物理中有一个模型,称为n 向量模型,它与临界现象的概率模型中的伊辛(Ising)模型和Potts模型有密切的关系。在Z^d的每一点上都给定一个R^n单位向量。这就给出了一个单位向量的随机...……更多
地球本该不存在:太阳系的混沌与稳定,背后隐藏的神奇数学规律
...为我们太阳系的表面和谐提供数学解释外,这项新研究的见解可能有助于科学家了解其他恒星周围系外行星的轨迹。行星不断地相互施加引力——这些小拖船不断对行星的轨道进行微小的调整。外行星要大得多,对小拖船的抵抗...……更多
OpenAI超级对齐团队遗作:两个大模型博弈一番,输出更好懂了
如果 AI 模型给的答案一点也看不懂,你敢用吗?随着机器学习系统在更重要的领域得到应用,证明为什么我们可以信任它们的输出,并明确何时不应信任它们,变得越来越重要。获得对复杂系统输出结果信任的一个可行方法是...……更多
开源大模型杀疯了!Mistral新模型三分之一参数卷爆Llama 3.1
Llama 3.1 405B“最强模型”宝座还没捂热乎,就被砸场子了——Mistral AI发布最新模型Mistral Large 2,参数123B,用不到三分之一的参数量性能比肩Llama 3.1 405B,也不逊于GPT-4o、Claude 3 Opus等闭源模型。主打的就是一个高性价比。用官……更多
...作者、参与者。课堂以学生为主,给学生提供阐述自己的见解,进行多向交流、争论,互疑互答的时间和机会;遇到思维障碍时,能够在教师的指导下进行观察、操作、实验等活动,不断分析、整理和归纳完成学习过程。因此,...……更多
...6月4日报道,以人工智能的旗舰产品GPT-4为代表的大语言模型在逻辑测试中的推理表现很糟糕:它们犯下前后不一致的错误,而且推理过程往往是荒谬的。近日发表在《皇家学会开放科学》杂志上的一项研究表明,大语言模型所...……更多
...,他“总是记不住那些看似毫无意义的事情”,但是“对见解形成的过程有良好的记忆力”。抽象数学就是见解形成的过程,但可惜的是,太多的孩子把乘法表当成只需要死记硬背的无意义的工具。真理本身固然重要,但更重要...……更多
...公司和加拿大、英国科学家携手,创建了一种基于大语言模型的“人工智能(AI)科学家”。从阅读文献到提出新假设,再到尝试各种解决方案并撰写论文,整个研究周期,“AI科学家”能一气呵成。Sakana公司在其官网表示,这位科...……更多
...网高考不仅仅是检测国内莘莘学子的一项重要考试,在大模型“百家争鸣”的今天,也是对国内AI大模型的一次考验。如果让大模型和国内学子同台竞技,做同一套高考真题试卷,结果会是怎样?大模型考上文科本科,豆包获国...……更多
2022生成模型进展有多快,新论文盘点9类生成模型代表作
ChatGPT的出现,彻底将生成AI推向爆发。但别忘了,AI生成模型可不止ChatGPT一个,光是基于文本输入的就有7种——图像、视频、代码、3D模型、音频、文本、科学知识……尤其2022年,效果好的AI生成模型层出不穷,又以OpenAI、Meta...……更多
科大讯飞大模型新升级:20秒制作PPT,拟人语音能力超越ChatGPT|最前线
...编辑|邓咏仪1月30日,科大讯飞发布新升级的讯飞认知大模型星火V3.5,并发布了自研的语音大模型,以及星火开源大模型——星火开源-13B。过去一年,科大讯飞的重点都在大模型方向上,临近岁末放出大量更新,某种程度也展...……更多
更多关于科技的资讯:
避免苹果存储税!大神成功将M4 Mac mini改装扩容到1TB
快科技11月10日消息,苹果前不久推出了M4 Mac mini,最低仅提供256GB的存储空间,且苹果官方升级存储的费用昂贵
2024-11-10 16:15:00
一周新增24座!乐道换电网络加速扩展 年内冲刺千座目标
快科技11月10日消息,乐道汽车官方宣布,在11月4日至11月10日期间,NIO Power新增了24座乐道可用站,其中包括15座4
2024-11-10 16:15:00
AMD Zen6锐龙还是AM5接口!Intel LGA1851沉默不语
快科技11月10日消息,AM4接口至今都还在发新品,AM5接口也将同样长寿,官方称至少延续到2027+年,目测Zen6
2024-11-10 16:45:00
史上最大规模!2024广州车展展位图公布:1171台车辆参展
快科技11月10日消息,第二十二届广州国际汽车展览会将于2024年11月15日至24日在中国进出口商品交易会展馆举行,展会规模预计将创下历史新高
2024-11-10 16:45:00
本文转自:人民网人民网上海11月10日电 (欧阳易佳)第七届中国国际进口博览会期间,欧姆龙以数智化赋能慢病管理,将进一步服务消费者需求的新产品、新技术、新理念带入了进博会展厅。
2024-11-10 17:23:00
本文转自:人民网人民网记者 车柯蒙 王天乐2023年,优衣库PUFFTECH空气棉服首次在进博会展出,时隔一年,该产品成为秋冬热销人气“爆品”
2024-11-10 17:24:00
本文转自:人民网人民网上海11月10日电 (欧阳易佳)近日,第七届中国国际进口博览会在上海举办。凭借创新的活力、庞大的市场潜力和高效的产业联动效应
2024-11-10 17:25:00
应县木塔有了数字孪生,AI助力文化遗产保护
中国青年报客户端讯(中青报·中青网记者 张均斌)当AI技术应用于文化遗产保护,两者会碰撞出怎样的火花?11月9日,在第十五届财新峰会ESG(环境
2024-11-10 17:40:00
乐道L60守卫模式引发异常报警 官方回应:敏感度较高 正积极优化
快科技11月10日消息,乐道汽车在最新一期的《乐道问必答》中回应了车主关于“守卫模式异常报警”的问题。官方解释称,由于当前守卫模式的敏感度设置较高
2024-11-10 17:45:00
马斯克:特斯拉正改进Optimus机器人设计 将大规模生产
快科技11月10日消息,据报道,马斯克透露,特斯拉正在改进Optimus机器人的设计,以解决生产过程中的关键瓶颈问题。马斯克此前已多次表达了对Optimus机器人的高度信心
2024-11-10 17:45:00
中国祝融号新发现:37亿年前的火星上存在海洋
快科技11月10日消息,如今的火星看上去一片荒凉,但是有理论认为,在几十亿年前,火星也和地球一样是生物乐园,广阔的海洋可能覆盖了1/3的星球表面
2024-11-10 17:45:00
比亚迪智能手表车控功能11日上线:华为、苹果、OPPO等品牌均可使用
快科技11月10日消息,比亚迪汽车宣布,其智能手表车控功能将于11月11日正式上线,覆盖王朝、海洋、方程豹、腾势、仰望五大网络
2024-11-10 17:45:00
实至名归!特斯拉Cybertruck获得2024年度“最酷车型”奖项
快科技11月10日消息,特斯拉Cybertruck在2024年度金方向盘奖中荣获“最酷车型”奖项。尽管Cybertruck尚未在欧洲市场销售
2024-11-10 18:15:00
“货物出口像寄快递一样简单!”跨境电商让临沂商品“扬帆出海”
境内的消费者在短视频平台观看直播,动动手指后,2-3天就能收到来自法国的化妆品;境外的消费者在电商平台上轻点鼠标,只需1-3天
2024-11-10 18:25:00
宝骏首款中高级轿车预热:车长超5米 提供纯电插混可供选择
快科技11月10日消息,上汽通用五菱品牌与传播总经理周钘在其个人微博透露,宝骏云光可能更名为享境,目前正处于意见收集阶段
2024-11-10 18:45:00