• 我的订阅
  • 头条热搜
LLM群体智能崛起,数学性能暴增11.6%!谷歌DeepMind四大机构联手新作
...认知,数学最考验元认知,原本是指,人类对自己思维、推理过程的直观认识。那么,大模型也具备「元认知」的能力吗?研究人员对此,提出了一种假设,并设想是否可以通过知识引导,进一步提高LLM的能力。 其实,此前的...……更多
英伟达没有慌,黄仁勋再谈DeepSeek:“推理”的计算需求可能增加上百万倍
...于DeepSeek、Grok、OpenAl等冲击,AI正在从感知和生成式AI向推理和逻辑推理领域发展。而推理AI又增加了一条扩展规律——增加训练的计算能力能让模型变得更智能,而增加深度思考的计算能力则能让答案更精准,与一次性推理相比...……更多
把AI视为人?错了!DeepMind研究科学家:“模型即计算机”才是未来新范式
...何利用它进行有用的工作?我们用什么隐喻(metaphor)来推理它?第一个方向受到广泛关注和大量投资,这是有道理的:技术能力的进步是一切可能应用的基础。但是,第二个方向对该领域同样至关重要,而且存在着巨大的未知...……更多
深夜登顶,全网刷屏!来自杭州的DeepSeek震惊硅谷
...上。”不到一个月之后,今年1月20日,DeepSeek正式开源R1推理模型。据DeepSeek介绍,其最新发布的模型DeepSeek-R1在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、...……更多
全新开源王者!NVIDIA悄然推出70B AI模型:力压GPT-4o、仅次于OpenAI o1
...,Nemotron-70B基于Llama-3.1-70B开发,在没有专门提示和额外推理token的情况下,Nemotron-70B也能答对复杂的推理问题,如“草莓有几个r”的经典难题。业内人士评价,NVIDIA在Llama 3.1基础上训练出的这个不太大模型,能够超越GPT-4o和Claud.……更多
OpenAI押宝的最强机器人,能打败特斯拉擎天柱吗?
...新。画面中展示的就是Figure机器人引以为傲的语音到语音推理功能。而这一功能在Figure02身上得到全面升级。Figure02搭载了麦克风和扬声器,借助OpenAI的力量,实现了语音对话和推理。在创始人BrettAdcock发布的技术文章中,介绍了...……更多
全自动组装家具! 斯坦福发布IKEA Video Manuals数据集:首次实现「组装指令」真实场景4D对齐
...任务来评估当前AI系统在理解和执行家具组装,以及空间推理(spatial reasoning)方面的能力:1. 在基于3D模型的分割(Segmentation)与姿态估计 (Pose Estimation)输入3D模型和视频帧,要求AI完成两个任务:准确分割出特定部件区域,并估计...……更多
Meta AI首席科学家杨立昆谈DeepSeek:不是中国AI超越美国 而是开源模型超越专有模型
...就是开放研究和开源的力量。”1月20日,DeepSeek正式发布推理大模型DeepSeek-R1。24日,在国外大模型排名Arena上,DeepSeek-R1基准测试已经升至全类别大模型第三,其中在风格控制类模型(StyleCtrl)分类中与OpenAI o1并列第一,其竞技...……更多
...好的建模方法;通过加大模型参数增强AI能力,其训练和推理成本高昂,需要探索更经济、有效的性能改进途径。此外,隐私保护问题备受关注。王金桥认为,目前相关应用的隐私保护还未设立清晰边界,相关法律也需进一步厘...……更多
清华大学教授李宗鹏:大模型消除不了幻觉,大语言模型注定没有希望
...和创造。这和传统计算机科学里面离散的数据结构、逻辑推理等完全不一样。非常离经叛道,但是在实际应用中爆发了强大的冲击力。但是,从计算复杂度和可计算性的层面看,大语言模型注定是没有希望的。计算机专业本科都...……更多
首席连线丨中欧基金宋巍巍:2024年是AI应用元年,投资机会在三个核心行业
...础设施。三是能源。在对算力的大幅需求下,模型训练、推理所依靠的数据中心、算力中心会消耗大量的电力,人类的用电场景和电力需求会被本轮人工智能革命重构。宋巍巍指出,在当下的科技革命中,科技巨头相互“军备”...……更多
...。在谈到“感知”时,赵天成展示了他们团队开发的视觉推理智能体算法。“我们通过模拟人类处理高清图像的方式,让AI能够像人类一样‘拉近拉远’进行推理。”他一边说,一边在大屏幕上展示了智能体如何从一张高分辨率...……更多
智能产业探新记丨AI赋能,大模型的下一个“风口”在哪?
...,这一大模型具备文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力、多模态能力等核心功能,已在教育、医疗、金融、工业等领域落地。近年来,人工智能引领的新一轮技术革命加速演进,科大讯飞股份有限公...……更多
百度文心大模型4.0技术进展
...3.5,在基础模型升级、精调技术创新、知识点增强、逻辑推理增强、插件机制等方面创新突破,取得效果和效率的提升。今天发布的文心大模型4.0,相比3.5版本,理解、生成、逻辑、记忆四大能力都有显著提升。其中理解和生成...……更多
清华教授唐杰:Scaling Laws虽被质疑,但至今仍是提高大模型性能的重要方法
...代模型在技术上可能解决目前ChatGPT中存在的事实性以及推理能力的缺陷,实现更精细的语义理解、多模态(文本、图像、语音、视频等)输入和输出,具备更强的个性化能力。”“人工智能的发展会更多瞄向通用人工智能,实...……更多
...生猜想,再提出理论猜想,继而经过数理或通过猜想建立推理范式,对其推理体系中具有共性的问题进行实验检验,并可结合数理模型和实际观察进行检验,以矫正理论猜想。在多次检验的基础上形成更加完善并经地起实践检验...……更多
...语言模型之外的其他技术。例如,解决数学问题需要逻辑推理,而目前大多数AI模型都不擅长逻辑推理。鉴于此,谷歌深度思维公司开发出AlphaGeometr,将语言模型与符号引擎(使用符号和逻辑规则进行推理)相结合,构建出一种神...……更多
中兴通讯引领算力时代:投资智能计算基础设施与大模型训练推理
...于算力领域,并致力于智能计算基础设施、大模型的训练推理算法以及工程优化的研究和开发。#中兴通讯绿色算力主力军#在算力领域,大模型的技术和应用已经成为一个趋势。大模型是一种基于深度学习技术的自然语言处理模...……更多
是个车企都要蹭DeepSeek 属实有点幽默了
...使用了强化学习 + 奖励模型的方式,最终涌现出了超强的推理能力,非常适合解决困难的逻辑问题。打个比方啊,高中班里有俩同学 A 和 B ,面对同一道数学题, A 的做法是循规蹈矩的用各种公式,一步步按部就班的解题。而 B ...……更多
谷歌世界模型:单张图生成可玩3D世界,还要和马斯克一起做AI游戏
...该模型使用与大型语言模型类似的因果掩码进行训练。在推理时,Genie 2 能够以自回归方式进行采样,逐帧采取单个动作和过去的潜在帧。谷歌使用无分类器指导(classifier-free guidance)来提高动作可控性。 本文的示例由未蒸馏...……更多
加码“AI+编程教育”!商汤科技与编程猫达成战略合作
...、强化学习等技术突破,商汤“日日新V6”在长思维链、推理、数理、全局记忆方面拥有显著优势,多模态推理能力国内第一,对标GPT-o1,数据分析能力大幅领先GPT-4o,将为编程猫的课程体系和教育方案的开发,提供强大支持。...……更多
4090笔记本0.37秒直出大片!英伟达联手MIT清华祭出Sana架构,性能秒杀FLUX
...仅解码器LLM)作为文本编码器,以增强对提示词的理解和推理能力。尽管T2I生成模型多年来取得了显著进展,但大多数现有模型仍依赖CLIP或T5进行文本编码,这些模型往往缺乏强大的文本理解和指令跟随能力。与CLIP或T5不同,Gem...……更多
APUS带你穿越千载重回故里,看AI眼中的《轩辕大帝》
...州智算中心、新加坡智算中心并不断扩容,为APUS大模型推理及行业应用搭建起了扎实的算力基础,进而为中国打造AI大模型。 不仅如此,APUS还凝练出适应中国AI发展的关键“六要素”,助力中国把握AI大模型发展主动权,引领...……更多
87.8%准确率赶超GPT-4o登顶!谷歌DeepMind发布自动评估模型FLAMe
...其基础,看模型提出的声明是否有源文档作为依据- 数学推理:区分LLM生成数学解题方案的正确或错误- 编码:涵盖Python、JavaScript、Java、C++、Go和Rus等流行编程语言,训练FLAMe从备选答案中选出正确程序或修复程序- 安全性:为了...……更多
Sam Altman或筹数十亿美元自造AI芯片,DeepMind首席科学家或将辞职创业
...比的G42和软银集团。2.能力达到奥数金牌级,DeepMind几何推理模型登上Nature,这个叫AlphaGeometry的模型在国际数学奥林匹克(IMO)的30道几何题中做出了25道,这一成就标志着AI在数学领域推理能力的史诗级升级。3.DeepMind首席科学家...……更多
张云泉:集中力量,促进国产AI大模型发展
...法成为新时代的关键资源。大模型的开发、训练、微调及推理各个环节均离不开算力,且算力成本占据整体开销的大头。可以说,算力成为支撑大模型发展的关键因素,也是科技竞争的战略高地。在大规模的前端产品落地后,算...……更多
3天把Llama训成Mamba,性能不降,推理更快!
...Mamba模型,并且设计了新的推测解码算法,加速了模型的推理。先来看一张其乐融融的图片(一眼AI):右边的小羊驼代表Llama,而左边的蛇(Mamba)也是我们的老熟人了。至于到底能不能其乐融融,咱就不管了,之所以有此场景...……更多
...方案规划、目标拆解能力;判别中枢具有信息抽取、逻辑推理、是非判断、研判检测能力;道德中枢具有情感分析、道德法律能力;记忆中枢具有信息记忆能力。此外,360以安全大模型为“大脑”,构建出智能体框架,通过任务...……更多
通义千问升级旗舰模型Qwen-Max,性能接近GPT-4o
...数学能力、代码能力则超越了GPT-4o。数学和代码所代表的推理能力是大模型智能水平的最重要体现。相比2023年4月的初代通义千问大模型,Qwen-Max的理解能力提升46%、数学能力提升75%、代码能力提升102%、幻觉抵御能力提升35%、指...……更多
被认可的大模型价格战
...要减少幻觉,同时需要有强大的记忆能力、查文献能力、推理能力,如果把行业上能共识的能力都投射到做医生的标准中,那么这便可以成为一个指标——“人造医生”就是AGI。 李大海则尝试从经济学的角度定义AGI。在他看来...……更多
更多关于科技的资讯:
杭州商业航天产业迎来重磅落子。近日,箭元科技与钱塘(新)区签署协议,其“元行者一号”液体运载火箭回收复用基地正式落地钱塘(新)区前进智造园
2025-12-07 08:23:00
近日,一项重要国家标准——《电磁兼容 电磁兼容标准起草导则》工作会议在云栖小镇召开。这份由上海机器人产业技术研究院牵头起草的文件
2025-12-07 08:53:00
湖北农发旗下米来生物荣获2025欧洲食品配料展食品与饮料技术创新大奖
12月2日,法国巴黎,在欧洲食品科技领域最具影响力的盛会——欧洲食品配料展(Food Ingredients Europe
2025-12-07 16:44:00
当城市核心区的物理空间增长几近饱和,未来的竞争力新高地何在?12月5日,一场发布会以别开生面的“数字气味”体验开场,为上城区加快建设中央创新区(CID)的战略发布
2025-12-07 07:21:00
日前,山西转型综改示范区入区企业山西恒真真空玻璃科技有限公司自主研发的新产品——“真空发热玻璃”上市。这一产品将高效真空玻璃技术与新型半导体制热技术深度融合
2025-12-07 07:32:00
生产设备共享给清河羊绒带来什么——河北特色产业集群共享智造故事(四)纱线在电脑横机上来回穿梭、电商平台的提示音此起彼伏……随着冬季来临
2025-12-06 08:04:00
厦门移动智慧康养产品亮相首届海峡两岸(厦门)银发博览会
市民现场体验移动随心屏(闺蜜机)的AI舌象问诊功能。厦门网讯 (文/厦门日报记者 许晓婷 王玉婷 通讯员 陈奕珣 图/厦门移动 提供)伸出舌头拍一拍
2025-12-06 08:26:00
厦门网讯 (厦门日报记者 林露虹)刷到一部微短剧,不知不觉被剧情吸引,回过神来看介绍,发现竟是AI参与制作的。类似经历
2025-12-06 08:26:00
从“手搓”到“智造” 厦门跑步机“跑”向全球
厦门网讯 (厦门日报记者 詹文 林健华)在位于同安工业集中区的生产车间里,一节一节钢板正传送上激光切割台,自动切割、打孔
2025-12-06 08:26:00
共建共享破局资源瓶颈:临沂联通与电信合作以5G RedCap创新实现业务与服务双突破
鲁网12月5日讯近日,临沂联通与临沂电信深度践行国家共建共享战略,成功完成全省首个基于电信800M频段的5G RedCap技术承载联通物联网专网业务的商用落地
2025-12-06 13:44:00
中国青年报客户端讯(中青报·中青网记者张均斌)近日,“中央引导地方”专项科技赋能文化方向立项课题——“面向文博场景的智能伴游导览系统研发及示范应用”启动会
2025-12-06 15:25:00
2025教室节能照明标杆盘点 四大品牌绿色护眼解决方案解析
在“双碳”目标引领下,校园节能改造成为教育领域绿色发展的重要方向。据住建部统计,商业建筑能耗中照明系统占比高达35%,学校作为人员密集
2025-12-06 16:09:00
海尔智慧家电亮相迪拜
11月26日至28日,中东地区极具影响力的家电电子展在迪拜世贸中心举办。展会中,海尔智家针对当地高温、多尘等特点,集中展示了洗衣机
2025-12-06 16:10:00
12月1日,豆包手机助手技术预览版正式发布,首发搭载于中兴Nubia工程样机。豆包手机助手是以豆包APP为基础,与手机厂商在操作系统层面合作开发的AI助手软件
2025-12-06 17:41:00
文化中国行|全场听觉无死角 吉林省音乐厅声学揭秘
历经修缮重生的丰乐剧场,以“吉林省音乐厅”之名即将绽放春城。这座历史建筑,从伪满时期影剧院到音乐剧场的跨越,背后藏着一套极致考究的声学设计方案
2025-12-06 18:41:00