• 我的订阅
  • 头条热搜
大模型不会推理,为什么也能有思路?有人把原理搞明白了
大模型不会照搬训练数据中的数学推理,回答事实问题和推理问题的「思路」也不一样。大语言模型的「推理」能力应该不是推理,在今年 6 月,一篇 Nature 论文《Language is primarily a tool for communication rather than thought》曾引发……更多
架构优先、先易后难,华为的制造业生成式AI方法论
...量检测、先导药物筛选、智能排产调度等。郭振兴认为,下一代大模型生产方式应该是“授人以渔”,让行业客户“自己做大厨”。即基于厂商的基础大模型能力和构建工具,行业客户对自身的AI应用做到全面掌控。在云平台基...……更多
2024惠普商用ai战略暨aipc新品发布会在京举行
...站搭载包括英特尔酷睿Ultra5、7和9处理器或配备专用NPU的下一代AMD锐龙PRO处理器,结合NVIDIARTXAda系列显卡。▲ 惠普Z系列移动工作站ZBookStudioG11AI小惠: AI小惠是基于预训练过的智谱开源大语言模型,采用中国惠普数据知识库和真...……更多
人工智能应用场景不断拓展
...还有一定距离。吴泳铭说,要实现真正的通用人工智能,下一代的模型须具备更大规模、更复杂、更多层次的逻辑推理能力,全世界先进模型的投入门槛将达到数十亿、数百亿美元的级别。清华大学人工智能研究院副院长朱军说...……更多
谷歌世界模型:单张图生成可玩3D世界,还要和马斯克一起做AI游戏
...该模型使用与大型语言模型类似的因果掩码进行训练。在推理时,Genie 2 能够以自回归方式进行采样,逐帧采取单个动作和过去的潜在帧。谷歌使用无分类器指导(classifier-free guidance)来提高动作可控性。 本文的示例由未蒸馏...……更多
百度“砍价”收购YY直播,超110亿回笼资金将用于AI研发
...年能降低90%以上,并表示将持续投入AI基础设施,以打造下一代大模型。在财报会上,李彦宏进一步表示,开源的决策源自对技术领先地位的坚定信心,开源将进一步促进文心大模型的广泛应用,并在更多场景中扩大其影响力,...……更多
OpenAI迄今最大、最贵模型!GPT-4.5正式发布
...题方面发挥更大作用,并且模型的幻觉现象更少,但数学推理能力仍逊于o3-mini等推理模型。GPT-4.5是OpenAI最后一个“非思维链模型”,通过扩大预训练和后训练规模,提升了非监督学习能力,未来将作为推理模型的基础。不过目...……更多
官方公布第五代至强Emerald Rapids性能
...推出的第五代至强EmeraldRapids的内部性能测试结果,以及下一代至强GraniteRapids的性能预测,这些结果既有与自己第四代至强SapphireRapids的对比,还展示了至强Max处理器与对手AMDEPYCGenoa96核处理器的HPC指标对比。第五代至强EmeraldRapi……更多
...发布了相关信息。国元证券表示,基于DeepSeek最新发布的推理大模型DeepSeek-R1,该公司近日已完成该模型在金融场景的本地化部署及适配性测试,计划将其深度整合至自主研发的智能服务平台“燎元智能助手”中。DeepSeek-R1将赋能...……更多
...络感知算法,提升了环境建模的效率,成为目前主流车企下一代智能化的主要架构。通过这套感知架构能够减少对于激光雷达等高成本传感器的依赖,有效降低系统成本,减轻车企及消费者的负担。新挑战显现,真正落地仍需时...……更多
国内团队新发大模型:ceo上阵写代码
...术驱动的公司”,专注于NLP技术的应用落地,愿景是打造下一代智能且简单的搜索体验。具体实现路径上,他们选择了对数据信息最为敏感的领域之一——金融。自研了垂直领域内智能搜索、智能推荐、机器阅读理解、总结、翻...……更多
Cerebras 推出全球最快AI推理解决方案,速度是英伟达方案的20倍
...更高的性价比。该方案将允许 AI 应用程序开发人员构建下一代 AI 应用程序,而不会影响速度或成本。该方案使用了 Cerebras CS-3 系统及其 Wafer Scale Engine 3(WSE-3)AI 处理器,其中 CS-3 的内存带宽是 Nvidia H100 的 7000 倍,解……更多
风从云端吹向终端:混合AI未来可期
...处理和实时语义分割滤镜的认知ISP和高通AI引擎势必开启下一代专业品质影像体验。正如高通技术公司产品管理副总裁Judd Heape所言,“实时语义分割技术具有开创性意义,这意味着摄像头能够真正实现对捕捉画面的情景感知。...……更多
谷歌推出第五代AI芯片:训练和运行AI模型的速度提高5倍
...五代定制张量处理器(TPU)芯片TPU v5e用于大模型训练和推理,训练和运行AI模型的速度提高了5倍。与上一代芯片相比,TPU v5e每一美元的训练性能提高2倍,每一美元的推理性能提高2.5倍。谷歌第五代定制张量处理器(TPU)芯片TPU...……更多
大模型下探音视频AI市场,战争才刚刚开始 | ToB产业观察
...用层面解决了端到端识别效果与效率兼顾的难题。配合GPU推理,不同版本的Paraformer可将推理效率提升5~10倍,同时,Paraformer使用了6倍下采样的低帧率建模方案,可将计算量降低近6倍,支持大模型的高效推理。说话人识别模型CA...……更多
腾讯企点智能客服、营销分析全新升级,助力企业实现智慧客户管理和营销分析
...讯企点全新一代智能客服引入了大模型能力,具备强大的推理和自然语言处理能力,针对对话交互、人工辅助和知识构建三个层面进行有效提升。在对话交互层面,智能客服不仅可以结合上下文进行推理,理解复杂的口语化问题...……更多
英伟达发布GB200计算卡:2080亿个晶体管,AI性能提升5倍
...卡的算力提出了更高的要求,于是英伟达也适时地推出了下一代GPU,在AI性能上有着突飞猛进的进步,可以说拉了竞争对手整整一代。英伟达在今天凌晨举办GTC技术大会,在大会上, 英伟达正式宣布了Blackwell架构,同时也表示B20...……更多
CMU清华教LLM练成数学高手,LeanSTaR训练模型边思考边证明,登顶新SOTA
...办?CMU清华团队提出了Lean-STaR训练框架,在语言模型进行推理的每一步中都植入CoT,提升了模型的定理证明能力,成为miniF2F上的新SOTA。如果想训练LLM证明定理的能力,你会怎么做?既然模型可以通过海量语料学会生成文本,那...……更多
科学家提出情景学习新范式,让学霸大模型向学弱大模型输送能力
...十亿左右。“做大”,能让大模型具备更强的涌现能力和推理能力,从而适用于难度更高的任务。“做小”,能让大模型获得更优秀的推理能力,从而能被部署到手机、手表、耳机、录音笔等各类小微终端之中。情景学习(ICL,...……更多
全模态对齐框架align-anything来啦:实现跨模态指令跟随
...-Vision-11B 既准确地识别出了餐厅,还提供了细致的思考与推理过程。 在 Meta 并未披露 Llama-3.2-11B-Vision-Instruct 对齐技术细节情况下,北大对齐小组愿开源数据、训练、模型、评估的全流程,为全模态对齐研究贡献力量。对齐框架...……更多
英伟达推出新一代芯片,“AI+”产业有望加速发展
...缺品质。这也意味着,数字化不仅能够推动中国经济进入下一代增长奇迹的轨道,也将为投资者带来新时代的发展红利。面对这样前程远大、短期路径又带有未知色彩的领域,数字经济ETF(159658)提供了很好的投资工具。这只产...……更多
...推理能力的边界、探索感知能力的边界、探索软硬一体的下一代模型设计、探索下一代AI学习范式、探索下一个scaling方向。尽管业界不少团队在讨论是否应对AI预训练和基础研究继续投入,字节仍在以前所未有的战略决心加码大...……更多
李飞飞团队“50美元”复现DeepSeek R1?真相是…
...0美元的云计算费用,成功训练出了一个名为s1的人工智能推理模型。该模型在数学和编码能力测试中的表现,据称与OpenAI的O1和DeepSeek的R1等尖端推理模型不相上下。这一消息无疑在AI界投下了一颗重磅炸弹,真相究竟如何?《科...……更多
开源版OpenAI再出「神作」,小模型吊打Llama 3!Ministral系列问世,边缘AI革命开启
...持高达128k上下文(目前在vLLM上为32k)。在知识、常识、推理、函数调用、效率等方面,为低于10B参数模型设立了新标杆。而且,Ministral 8B还有配备了滑动窗口注意机制(sliding-window attention),以实现更快和内存高效的推理。不...……更多
AMD跑大模型终于Yes!MI300X对比NVIDIA H100/200毫不逊色
...根据The Information发布的评测报告,AMD的Instinct MI300X GPU在AI推理基准测试中的表现与NVIDIA的H100 GPU相当,显示出AMD在高性能AI计算领域的进步。这份评测报告由MLCommons提供数据,在测试中,AMD的MI300X GPU以及NVIDI……更多
AI算力大战开启:英特尔AI芯片性能超越H100,谷歌云推出最强ARM芯片|钛媒体AGI
...el)发布性能最强的新一代Gaudi3 AI 加速芯片,以及全新的下一代英特尔至强6处理器等产品。其中,英特尔Gaudi 3 AI芯片采用台积电5nm工艺,支持128GB HBMe2内存。相比上代产品,英特尔Gaudi 3带来4倍(400%)的BF16 AI计算能力提升,1.5 ...……更多
王小川新公司「百川智能」发布首个开源中英文大模型,开源免费可商用 | 最前线
...用协议,只需进行简单登记即可免费商用。开源内容包含推理代码、INT4量化实现、微调代码,以及预训练模型的权重。其中,微调代码方便用户对模型进行调整和优化;推理代码与INT4量化实现则有助于开发者低成本地进行模型...……更多
摩尔线程与360达成战略合作,将共同打造“360智脑大模型一体机”
...模型一体机”集成了 360 智脑大模型,具备大模型管理、推理部署等功能,摩尔线程全功能 GPU 将为其提供底层算力,“以高性价比硬件方案确保大模型推理效率和成本的平衡”。双方还将共同研发和优化推理框架,在软件层面...……更多
解读大模型赋能自动驾驶各个环节及相关产业链玩家的投资机会
...平线认为算法终将走向端到端的形式,因此公司也在构建下一代的面向Transformer的统一计算架构,而其下一代BPU纳什架构将专为大参数Transformer模型设计。地平线在CVPR中提出基于Transformer的端到端的自动驾驶算法框架,该文章首...……更多
谷歌王者归来?最新推出的大模型到底有多强,能否挑战GPT-4
...问题,这就使其尤其擅长解释数学和物理等复杂科目中的推理。Gemini能够根据照片按步骤讲题。来源:官方视频谷歌还发布了一个时长六分钟的视频,展现了测试员和Gemini的一些有趣互动,其中包括让Gemini识别图片并用多种语言...……更多
更多关于科技的资讯:
烈日炎炎!防晒美白需注意哪些关键因素?近日,护肤品牌谷雨研发负责人李安章从专业角度支招,向中新经纬产业一线栏目讲述防晒美白背后的研发与创新。来源:中新经纬编辑:熊思怡广告等商务合
2025-08-24 17:25:00
能感知环境,还能响应用户需求!全球首款人形机器人头部模组在贵安新区诞生
日前,贵安新区威迈尔科技有限公司(以下简称:威迈尔)正式推出全球首款人形机器人头部模组OmniHead(奥视知脑),为具身智能领域带来关键技术突破
2025-08-24 22:22:00
流量经济赋能长春农博会成果显著,线上销售额突破5200万元
第24届中国长春国际农业食品博览(交易)会胜利闭幕,在为期十天的展会上,流量经济赋能专区成为亮点。通过多平台联动、达人矩阵直播
2025-08-24 21:36:00
“车BA” 南京争霸
8月23日,“车BA”小米集团汽车部跨区域篮球争霸赛决赛在南京举行,来自北京、上海、武汉等地的7支参赛队伍齐聚古都南京,角逐冠军。 南京日报/紫金山新闻记者 段仁虎 摄
2025-08-24 09:50:00
“关不掉”的免密支付,肥了平台的钱包?
原标题| “关不掉”的免密支付,肥了平台的钱包?近日,话题“一定要关闭免密支付和自动扣款”冲上社交平台热搜,关于免密支付功能相关的讨论再次进入大众视野
2025-08-24 05:43:00
美国医疗巨头瞄准聚焦超声无创治疗赛道
近日,由美国医疗巨头强生等十余家机构组成财团,以22.5亿美元(约人民币161亿元)闪电收购了一家专注于“无创”超声波组织碎化技术(Histotripsy)的美国医疗科技公司HistoSonics多数股权
2025-08-24 07:02:00
家电业均价下滑!三翼鸟上海体验中心九成用户选高端
中国家电市场正经历均价下行的趋势。奥维云网数据显示,2025年第1周到第11周,空调、冰箱、洗衣机线上渠道均价同比分别下滑3
2025-08-23 08:20:00
在意大利:海尔空调销量TOP1
今夏,欧洲人经历了严酷“烤”验。八月初,受罕见热浪侵袭,意大利、法国等多国发布高温红色预警,西班牙南部气候飙升至46℃
2025-08-23 08:21:00
2025年,中国新材料产业总产值预计突破10万亿元,但在被列为“卡脖子”的多项关键材料中,国产化率不足30%。铝,作为全球产量第一
2025-08-23 08:22:00
单店年入过亿!三翼鸟上海体验中心是如何做到的?
当前,实体零售业正面临着变革与挑战,一方面,线上浪潮带来的冲击清晰可见:传统卖场客流锐减、部分门店面临关停挑战,《2025到店零售3
2025-08-23 08:22:00
省心比省钱重要!三翼鸟上海体验中心8成用户定制场景
当前,消费者在居家领域的决策逻辑正经历深刻变革。过往,性价比常是左右消费者选购家电、家居产品的核心要素,而如今,“省心”已逐渐攀升至决策考量的优先位置
2025-08-23 08:23:00
8月23日19:00,“河北五超”承德vs保定,最硬核的主场,承德“硬核宠粉”现场抽奖送钻石!
2025-08-23 08:53:00
厦门网讯(厦门日报记者 李晓平)日前,《财富》中国科技50强榜单出炉,华为投资控股有限公司、DeepSeek(深度求索)
2025-08-23 09:00:00
厦门网讯(厦门日报记者 李晓平)昨日下午,“智汇鹭岛,AI赋能总部经济新生态”对接会在九牧创新中心举行,聚焦鞋服、卫浴等我市优势产业
2025-08-23 09:00:00
南京火车站网约车候客区升级后,“人车互找”成过往超省心!一屏锁定车在哪,网约乘车更“丝滑”□南京日报/紫金山新闻记者吴春霞 通讯员宁交宣“家人们
2025-08-23 09:52:00