透明度,推理,模型,思维,过程,升级头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

...开源模型具有巨大的潜力，SearchLVLMs在性能、可定制性和透明度上具有显著的优势。参考文献[1] Yu et al. Generate rather than retrieve: Large language models are strong context generators……更多

2024-11-11 13:34:00模态,接入,框架,模型,效果,互联网

科大讯飞：2025打响讯飞星火大模型的5场“必赢之战”

...首发国内首个基于全国产算力平台训练的具备深度思考和推理能力的大模型——讯飞星火深度推理模型X1，解决了国产算力大规模集群训练在深度思考和长思维链推理方面面临的全新挑战，用更少的算力，更小的尺寸，达到业界...……更多

2025-01-25 22:05:00讯飞,星火,模型,讯飞,星火,模型

中小机构弯道超车窗口来临？DeepSeek开源提供加速度

...DeepSeek的发布则证明了不一定依赖于高端GPU就能进行顶级推理，促使这类公司思考AI基建的投资逻辑和发展模式应如何调整。”王俊坦言。不过值得注意的是，通用人工智能大模型在解决数字化风控问题上面临挑战。卫浩表示，...……更多

2025-02-17 11:16:00弯道,加速度,机构,中小,模型,银行

无一大模型及格！北大/通研院提出超难基准，评估长文本理解生

...的长依赖任务中的多信息检索、时间重排序、计算、理解推理能力表现均不乐观。比如像Claude3-200k，GPT4-32k、GPT4-8k、GPT3.5-turbo-6k、LlamaIndex这种商业模型，平均只有40%的准确率。而像开源模型表现就更不理想了…ChatGLM2-6B、LongLL……更多

2024-08-08 09:39:00基准,北大,生成,模型,文本,评估

$IDC：中国大模型推理市场爆发，九章云极以\\\$

IDC：中国大模型推理市场爆发，九章云极以\"普惠算力\"领

近日，IDC发布《2025中国大模型推理算力市场分析报告》指出，大模型与生成式AI的推理算力建设已成为当前产业发展的关键环节。报告预测，2024年中国生成式AI基础设施市场规模将达到2091.9亿元。九章云极凭借在AI基础设施市场...……更多

2025-08-08 20:05:00普惠,赛道,中国,推理,基础设施,模型

【浪潮星锐】商广勇：关于我职业生涯关键词的三次进化

...月的艰苦努力，终于成功研发了面向工业场景的智能协同推理引擎。该引擎能够实现大模型与企业业务系统、知识库、算法模型等多知识源之间的高效协同与知识融合，显著提升大模型在复杂工业任务中的推理能力与决策效率。...……更多

2025-03-06 23:27:00浪潮,职业生涯,进化,关键词,生涯,关键

ChatGPT o1满血版上线！实测中它竟然败给了国产AI？

...特曼用一个简单的柱状图给出了对比：可以看到o1在数学推理和编程领域的表现要明显优于o1-preview，提升幅度在50%左右，而在科研领域的测试里，o1相对于o1-preview的表现就提升有限了。图源：OpenAI考虑到o1模型不需要额外加钱就...……更多

2024-12-11 20:12:00实测,国产,模型,推理,文心,答案

潮声丨全国首上线的这个AI神器，如何让浙江新生儿赢在起点

...息，能实时检索最新的医学文献，生成诊断建议，并通过推理过程展示，帮助医生验证诊断的可靠性。作为“侦探”，它能实时检索最新的医学文献，生成诊断建议，并通过推理过程展示，抽丝剥茧地分析疾病在孩子身上留下的...……更多

2025-03-11 08:46:00潮声,神器,浙江,新生儿,新生,起点

突破时间序列组合推理难题！南加大发布一站式多步推理框架TS-

【新智元导读】TS-Reasoner是一个创新的多步推理框架，结合了大型语言模型的上下文学习和推理能力，通过程序化多步推理、模块化设计、自定义模块生成和多领域数据集评估，有效提高了复杂时间序列任务的推理能力和准确性...……更多

2024-10-29 09:55:00推理,时间序列,序列,框架,难题,突破

ChatGPT这一波更新让我在网上不敢发照片了

...考能力。就是说，它们可以把图像整合到思维链中，作为推理的一部分。听起来咋咋呼呼的，实际如何？世超把一张 3 年前的照片发给 o3。结果它只用了 7 分钟，就分析出我是在哪个城市哪个园区甚至哪条河旁边拍摄的。。。不...……更多

2025-04-18 00:25:00一波,照片,更新,照片,拍摄,推理

9.11比9.9大？多个大模型翻车！业内人士：就是偏科，文科

...文认为，模型产生幻觉的三大来源：数据源、训练过程和推理。大模型可能会过度依赖训练数据中的一些模式，如位置接近性、共现统计数据和相关文档计数，从而导致幻觉。此外，大模型还可能会出现长尾知识回忆不足、难以...……更多

2024-07-17 20:56:00理科,文科,业内人士,模型,业内,多个

商汤升级“日日新5.0”大模型，对标GPT-4Turbo

...用混合专家架构，超10TB tokens训练，覆盖大量合成数据，推理时上下文窗口达200K左右。云、端、边全栈大模型产品矩阵中，用于终端设备的“商汤端侧大模型”可满足各类终端用户对大模型技术的应用需求。“日日新5.0”和GPT-4...……更多

2024-04-24 09:32:00商汤,模型,升级,商汤,模型,推理

科大讯飞：2025年1月15日首发国内首个具备深度思考和推理

...年科大讯飞了。最近作为股东有了危机感，请问贵公司的推理模型如何科大讯飞董秘：您好，2025年1月15日，科大讯飞首发国内首个基于全国产算力平台训练的具备深度思考和推理能力的大模型——讯飞星火深度推理模型X1，解决...……更多

2025-02-15 16:31:00讯飞,推理,深度,模型,能力,讯飞

模型即服务，卓世科技MaaS平台 2.0 正式上线

...。本次新上线了包括：模型训练新基座，支持模型训练、推理、量化、评测等功能。卓世科技MaaS平台是一款基于知识增强大模型的一站式行业模型训练开发平台。面向开发者和企业提供从基础算力服务、数据服务、模型训练服...……更多

2024-08-07 09:45:00模型,服务,平台,科技,模型,数据

直面大模型“大成本”挑战，如何提高算力效率？

...算效率和算力开销两大问题成为新的行业焦点。对大模型推理成本的优化，可通过很多技术手段实现。首先是模型本身，模型结构、训练方法都可以持续改进，包括业界很关注的MoE(混合专家模型)，就是优化推理成本很好的解决...……更多

2024-06-03 14:07:00模型,效率,成本,模型,推理,成本

华为预测大模型首次投入钢铁实时生产控制，宝钢：将继续场景拓展

...优于目前现场使用的控制“小模型”？基于大数据分析的推理计算时延性是否能满足现场高速、实时的生产控制要求？诸如此类的问题团队此前一直在思考。团队决定率先选择控制精度要求高、生产节奏快的场景，也就是热轧自...……更多

2024-09-15 17:01:00华为,宝钢,实时,钢铁,模型,场景

英伟达没有慌，黄仁勋再谈DeepSeek：“推理”的计算需求

...于DeepSeek、Grok、OpenAl等冲击，AI正在从感知和生成式AI向推理和逻辑推理领域发展。而推理AI又增加了一条扩展规律——增加训练的计算能力能让模型变得更智能，而增加深度思考的计算能力则能让答案更精准，与一次性推理相比...……更多

2025-02-27 11:55:00英伟,推理,需求,英伟,增长,推理

昆仑万维重磅发布天工AI高级搜索功能，做最懂金融投资、科研学

...AI高级搜索功能，具备四大亮点：·全面升级多层次分析推理能力·升级的金融投资专业AI搜索·升级的科研学术专业AI搜索·针对文档AI阅读分析的智能优化「天工AI高级搜索」不仅能提供精准的结果，更能通过多角度的专业优化，...……更多

2024-11-05 14:56:00天工,万维,昆仑,科研学术,搜索,重磅

推理成本直降99%！百川智能「1+3」矩阵揭秘，两张4090

...」。模型升级：Baichuan4-Turbo两张4090即可部署，Baichuan4-Air推理成本下降99%接下来，如何将Baichuan4-Turbo、Baichuan4-Air应用在实际场景中？从名字中不难看出，它们都是Baichuan 4系列基础模型的升级。对于企业来说，在不同场景阶段……更多

2024-11-04 09:50:00百川,矩阵,旗舰,推理,模型,成本

会见企业家｜周鸿祎：开源才是真正难以逾越的壁垒，中美AI技术

...力，云服务商通过算力需求激增获益，国产芯片厂商则借推理算力优化实现弯道超车，对于英伟达而言，也是好事，英伟达服务器需求随着使用算力的人数增加而增加。“很多人老是津津乐道具体技术细节，但技术并不是别人不...……更多

2025-03-04 09:41:00周鸿,中美,壁垒,企业家,领先,技术

Transformer推理天花板被谷歌打破？DeepMind

...科学家Denny Zhou拿出一篇ICLR 2024论文称：CoT可以让Transformer推理无极限。但随即他就遭到了田渊栋和LeCun等的质疑。最终，CoT会是通往AGI的正确路径吗？随着OpenAI o1的爆火，最近CoT也成了圈内热议的高频词。靠着CoT的强力加持，o1...……更多

2024-09-21 09:43:00天花,天花板,推理,首席,科学家,科学

阿里巴巴“AI驱动”战略提速夸克发布自研大模型

...、智能检索的专业服务。性能方面，凭借语义理解、逻辑推理、内容生成等技术优势，夸克大模型在CMMLU权威榜单的最新评测结果中，取得优异成绩。同时，夸克大模型具备了对不良、虚假信息识别、回答和指引的出色能力。知...……更多

2023-11-14 16:05:00夸克,阿里巴巴,阿里,提速,模型,驱动

文心大模型4.0 Turbo来了！百度推出文心快码2.5，已

...考虑到大模型和异构多芯发展趋势，为了保障大模型训练推理性能、简化大模型开发调优过程以及更好地适配各种芯片，飞桨与文心联合，在训练、推理两个方面定向优化。▲飞桨框架设计理念具体来说，动静统一的自动并行能...……更多

2024-07-01 09:21:00文心,快码,程序员,模型,程序,文心

o1带火的CoT到底行不行？新论文引发了论战

...To CoT or not to CoT？OpenAI ο1 的诞生极大地提升了人们对 LLM 推理能力和思维链（CoT）的兴趣。一时之间，似乎思维链很快就会成为所有 LLM 的标配，但思维链并非万能，就连 OpenAI 自己也提到 o1 在某些任务上的表现并不比 GPT-4o 强...……更多

2024-09-21 09:37:00新论,推理,符号,性能,任务,数据