• 我的订阅
  • 头条热搜
LLM群体智能崛起,数学性能暴增11.6%!谷歌DeepMind四大机构联手新作
...认知,数学最考验元认知,原本是指,人类对自己思维、推理过程的直观认识。那么,大模型也具备「元认知」的能力吗?研究人员对此,提出了一种假设,并设想是否可以通过知识引导,进一步提高LLM的能力。 其实,此前的...……更多
Transformer推理天花板被谷歌打破?DeepMind首席科学家亮出84页PPT,却遭LeCun反对
...科学家Denny Zhou拿出一篇ICLR 2024论文称:CoT可以让Transformer推理无极限。但随即他就遭到了田渊栋和LeCun等的质疑。最终,CoT会是通往AGI的正确路径吗?随着OpenAI o1的爆火,最近CoT也成了圈内热议的高频词。靠着CoT的强力加持,o1...……更多
...生猜想,再提出理论猜想,继而经过数理或通过猜想建立推理范式,对其推理体系中具有共性的问题进行实验检验,并可结合数理模型和实际观察进行检验,以矫正理论猜想。在多次检验的基础上形成更加完善并经地起实践检验...……更多
...的32项学术基准中,从自然图像、音频和视频理解到数学推理,“双子座”Ultra的性能有30项超过了当前先进水平。谷歌公司称,在图像识别领域的测试结果显示,“双子座”Ultra性能优于迄今最先进的人工智能模型,具有天然多...……更多
商汤生成式AI业务飙涨256%,成为中国大模型、智算服务市场占有率领头羊
...劲需求、“日日新SenseNova”大模型能力的飞跃式提升以及推理成本的快速下降,带动模型调用量增长迅速。报告期内,“绝影”智能汽车业务的表现也极为亮眼。其业务收入达1.7亿元,同比增长100%。上半年新增交付70.5万辆车,...……更多
华为harmonyosnext重塑全新“星盾”安全架构
...应用设计;PanguP系列,百亿级参数,为低时延、低成本的推理场景提供支持;PanguU系列,千亿级参数,适用于处理复杂任务,成为企业通用大模型的坚实基础;PanguS系列,万亿级参数,作为超级大模型,能够处理跨领域多任务,...……更多
菲尔兹奖得主亲测GPT-4o,经典过河难题破解失败!最强Claude 3.5回答离谱,LeCun嘲讽LLM
... 3.5依旧答错了。LeCun在此嘲讽大模型一番,大模型竟可以推理...?问题在于,LLM没有常识,不理解现实世界,也不会规划和推理。LLM行不行,就看提示了一位网友分析总结了,以上LLM失败的原因。他表示,LLM本身就是个「哑巴」...……更多
GPT-4o的识图能力有多牛?四大维度深度体验
...,准确率高达100%。图片来源:GPT-4o四、手写指令和逻辑推理最后,记者上了点难度,用手写的逻辑推理题来测试了GPT-4o的识图和逻辑推理能力。GPT-4o的回答堪称完美,不仅准确识别了手写体文字并遵照指示,且答题逻辑完全合...……更多
倒计时10天!百度世界2023五大亮点全剧透
...以来,文心一言在一个月内即完成四次升级,让大模型的推理成本降低至原来的十分之一;文心大模型升级至3.5版本后,训练速度提升到原来的3倍,推理速度达到原本的30多倍。它是否还能更进一步,追超GPT-4,在生活生产中扮...……更多
对标GPT-4o!商汤发布两大国内首个大模型 入局价格战
...短两个月,综合性能较“日日新5.0”平均提升30%,在数学推理、英文能力和指令跟随等能力明显增强,交互效果和多项核心指标实现对标GPT-4o。据了解,“日日新5.5”模型训练是基于超10TB tokens高质量数据,包括大量合成的思维...……更多
MMMU华人团队更新Pro版!多模态基准升至史诗级难度:过滤纯文本问题、引入纯视觉问答
...不断提升,例如GPT-4o在大学水平上的多学科多模态理解和推理(MMMU)基准测试中取得了69.1%的准确率。不过,基准测试结果是否真的能反映模型对多样化主题的深入理解,仍然有争议,或者说模型是否只是利用了统计模式,而非...……更多
中国首个音乐SOTA模型「天工音乐大模型」今日公测
...全球最大的开源MoE大模型。「天工3.0」在语义理解、逻辑推理、通用性、泛化性、不确定性知识、学习能力等领域拥有突破性的性能提升,数学/推理/代码/文创能力提升超过30%。 (天工3.0模型参数超越Grok-1,成全球最大开源MoE...……更多
马斯克官宣Grok-2测试版!xAI将继续拥抱开源路线吗?
...据具体询问的内容,模型只会激活不同的专家子模块进行推理,在吞吐量一定的情况下,可以更快地完成推理、给出回答。这让Grok-1拥有了更快的生成速度和更低的推理成本,简而言之就是更好的使用体验和性价比。根据xAI公布...……更多
罗格斯大学团队提出思想链概念,提高大模型的算数推理能力
...概念,提高了大语言模型(LLM,large language models)在复杂推理任务上的性能,例如算术推理、常识推理和符号推理等。图 | 金明宇(来源:金明宇)CoT 的原理是通过提供推理过程的示例,来教会模型处理推理,详细说明导致最...……更多
o1突发内幕曝光?谷歌更早揭示原理 大模型光有软件不存在护城河
...果比较有限。因此该研究想要探明,在使用比较少的额外推理计算时,就能能让模型性能提升多少?他们设计了一组实验,使用PaLM2-S*在MATH数据集上测试。主要分析了两种方法:(1)迭代自我修订:让模型多次尝试回答一个问...……更多
邬贺铨院士:金融大模型改变了金融科技范式
...思维链的模式,通过专家介入诱导它一步一步地进行思维推理。中国工程院院士邬贺铨(左)与度小满CEO朱光(右)交流“此外,还需要建立专门的监控系统,例如微软专门构建内容管理系统,它与语言模型协同工作,并使用特...……更多
阿里巴巴“AI驱动”战略提速 夸克发布自研大模型
...、智能检索的专业服务。性能方面,凭借语义理解、逻辑推理、内容生成等技术优势,夸克大模型在CMMLU权威榜单的最新评测结果中,取得优异成绩。同时,夸克大模型具备了对不良、虚假信息识别、回答和指引的出色能力。知...……更多
CPU,正在被AI时代抛弃?
...以通过语音识别技术被录入到病例系统中,随后大模型AI推理技术辅助进行智能总结和诊断,医生们撰写病例的效率显著提高。AI推理的应用不仅节省了时间,也保护了患者隐私;在法院、律所等业务场景中,律师通过大模型对...……更多
21.5万张X光,78万个问题!德州大学NIH等联合发布医学视觉问答数据集Medical-CXR-VQA
...规模较小,仅包含相当于分类任务的简单问题,缺乏语义推理和临床知识。如图1所示,现有的ImageCLF VQA-MED数据集仅包含「这张图像里主要异常是什么?」和「这张图片里看到了什么?」这两种完全相当于分类任务的问题。较小...……更多
openaio1系列模型开放访问权限
9月22日消息,OpenAI公司旗下首款具备“推理”能力的模型o1和o1-mini现已向企业版(Enterprise)和教育版(Edu)用户开放访问权限,用户每周最多可输入50条消息。据介绍,OpenAIo1系列模型具有更高的理解能力,与传统模型不同,o1...……更多
...需要结合快思考的‘黑盒’预测和慢思考的‘白盒’逻辑推理,打造‘灰盒’可信大模型。具体而言,通过融合科学规律、观测数据和合成数据,开发理解物理世界的垂直领域科学大模型。”作为本届大赛评委会主席,上智院院...……更多
OpenAI商用订阅用户数突破100万 新模型传出惊人涨价传言
...援引知情人士称,OpenAI在内部商讨中,考虑给即将推出的推理专长“草莓”大模型,或下一代旗舰模型Orion订一个更高的价格。而且在“早起内部讨论”中,订阅价格甚至能达到每月2000美元之多!当然,写那篇文章的记者也强调...……更多
Google 创始人谢尔盖·布林回归,直面 Gemini、Google、AGI 若干问题
...。就我个人而言,我不知道研究人员在做这种事情上走了多远,但需要大量的时间和研究才能真正剖析为什么一个模型能够做到一些事。我认为我们可以理解它,也许已经有人正在理解它,但大部分的精力都在寻找模型的错误之...……更多
深植互联网基因 加速数智化变革 长城汽车与抖音集团达成战略合作
...车自主可控的下一代智能助手,利用大模型强大的理解、推理、创造能力,让座舱具备强大的问题解决能力和自学习能力,提升用户体验;在企业端,双方将基于火山引擎大模型技术共同探索企业知识库的搭建,助力长城汽车在...……更多
...思维链的模式,通过专家介入诱导它一步一步地进行思维推理。邬贺铨以度小满为例,称其选择金融大模型切入是一个很好的基础,是大模型跟行业大模型相结合的好机会。“当然,这里边有很大的创新要求,在金融上对可信度...……更多
从空间智能到具身智能,跨维践行Sim2Real AI最高效路径
....9% 以上的任务成功率。 通用空间与具身智能离终局还有多远?问:您刚刚谈及以 Scaling Law 范式实现空间与具身智能,可以再详细说说它的具体含义吗?实现通用空间与具身智能会比实现大语言模型的通用性更难吗,难在哪里...……更多
大模型“翻车”小学题?
...相关性,使得AI在文字创作上达到人类平均水平,而数学推理更需要的是因果性,数学是高度抽象和逻辑驱动的,与语言模型处理的语言数据在本质上有所不同。这意味着大模型要学好数学,除了学习世界知识外,还应该有思维...……更多
人类和AI在推理任务中的表现相似,Google DeepMind研究揭示AI局限性
...人工智能(AI),特别是大型Transformer语言模型(LMs)在推理任务中的表现及其局限性。研究结果显示,尽管这些模型在处理自然语言方面表现卓越,但在复杂逻辑推理任务中,人类和语言模型都会受到语义内容合理性和可信度...……更多
顶流大模型应用!天工AI不炫技,实测真正的生产力工具
...多模态搜索体验毫不逊色,可以在搜索结果中做到多步骤推理、图文并茂、图表生成以及非常精准的时效性,让我可以直接使用在内容创作中。 同时,天工AI还支持AI视频转绘、AI音乐等多模态能力,大大提升了我的短视频创作...……更多
...化角色大模型在角色知识、对话能力、情节演绎以及逻辑推理等方面的专项知识,公司收集了海量行业网站、高质量书籍、优质剧本数据,对Baichuan-NPC进行领域知识预训练。据悉,通用语言模型在角色“演绎”过程中非常容易跳...……更多
更多关于科技的资讯:
风暴降临!阿迪达斯轻机甲老爹鞋XLG STORM「机甲风暴」迭代登场!
在adidas Sportswear未来实验室的能量风暴场,轻机甲老爹鞋XLG STORM「机甲风暴」破界诞生。作为初代轻机甲鞋XLG RUNNER的全新迭代之作
2025-08-04 20:40:00
日丰管:以标杆品质与全球视野,铸就中国家装管道领军品牌
近日,由范志毅演绎的“日丰管,管用五十年”巨幅广告,在全国数个高铁站亮相,引得不少旅客驻足。此次携手合作,是两位同样以专业立身的行业领军者的强强联合
2025-08-04 20:45:00
近期,易观发布《中国第三方支付行业年度分析报告2025》(以下简称“报告),报告对中国第三方支付行业当前的发展现状及趋势进行了分析及洞察
2025-08-04 20:45:00
京东再迎国际品牌入驻 IKEA宜家家居京东官方旗舰店开业
8月4日,京东与全球知名家具及家居用品品牌宜家家居达成合作,正式开启IKEA宜家家居京东官方旗舰店,并将于8月8日盛大开业
2025-08-04 11:14:00
考拉悠然:以多模态大模型为基 深耕工业检测赋能产业升级
消费日报网讯(记者 冯举)在人工智能技术加速渗透实体经济的浪潮中,四川省的成都考拉悠然科技有限公司(简称“考拉悠然”)正以“技术突破+行业落地”的双轮驱动模式
2025-08-04 14:04:00
天津市优秀基层理论宣讲员风采展示
2025-08-04 14:31:00
天津市优秀基层理论宣讲员风采展示
2025-08-04 14:34:00
国网济宁供电公司:率先实现小型无人机可靠安装配电线路故障指示器
鲁网8月4日讯近日,国网济宁供电公司工作人员在10千伏塔安I线服装城分支1号杆塔开展无人机安装配电线路故障指示器实验,取得圆满成功
2025-08-04 14:41:00
Arduino AI助手中国首秀!欧时RS创客沙龙开启开源智能未来
近日,电子元件和工业品数字化全球供应商欧时RS联合四方维(Supplyframe)创新中心成功举办 "欧时RS创客沙龙——Arduino主题开放日"
2025-08-04 14:59:00
槐荫首家苏宁易购Pro超级旗舰国融大厦店8月8日盛大开业
坐镇济南城市西兴战略核心,城投重点打造的商业标杆项目——槐荫首家苏宁易购Pro超级旗舰国融大厦店,将于8月8日盛大开业
2025-08-04 15:01:00
“沪企通”政策大模型亮相2025世界人工智能大会,数喆数据联合上海数据集团打造AI政务新标杆
7月26日,2025世界人工智能大会暨人工智能全球治理高级别会议在上海开幕。大会期间,由上海数喆数据科技股份有限公司与上海数据集团联合打造的“沪企通”政策大模型正式发布
2025-08-04 15:17:00
在当今经济环境中,贷款已成为企业和个人解决资金周转问题的重要手段。无论是企业扩大经营规模,还是个人应对突发状况,贷款都能提供有力支持
2025-08-04 15:17:00
润人生荣膺多项殊荣!凭科技创新开启健康饮酒新风尚
在全民健康意识全面觉醒的当下,养生消费市场正迎来爆发式增长。其中,人参酒凭借其独特的滋补价值与饮酒体验的完美融合,正成为中产家庭酒柜中的新宠
2025-08-04 15:20:00
镜合设计创始人、设计总监朱云锋人物访谈
[导读]朱老师认为,设计师需要不断提升自己,才能适应时代,给予客户优质的设计方案。随着经济的发展、网络的普及,人们对装修的认知越来越深入
2025-08-04 15:29:00
当深圳某跨境电商企业财务总监李女士按下回车键,一笔涉及3个币种、5家银行的跨境支付指令瞬间发出,系统显示“交易完成”时
2025-08-04 15:34:00