推理,模型,思维,语言,社区,语言头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

大模型到了该「验收」的时候

...万亿级分层异构MoE结构，不仅模型效果大幅提升，其训练推理效率也提升了超过100%，并带来了50%的推理部署成本下降。而Turbo版本的混元大模型，定价仅为前一代Pro版本的一半。性能更强、价格更低，这是大模型是深入落地场景...……更多

2024-09-19 10:07:00验收,模型,时候,模型,腾讯,知识

科学家提出情景学习新范式，让学霸大模型向学弱大模型输送能力

...十亿左右。“做大”，能让大模型具备更强的涌现能力和推理能力，从而适用于难度更高的任务。“做小”，能让大模型获得更优秀的推理能力，从而能被部署到手机、手表、耳机、录音笔等各类小微终端之中。情景学习（ICL，...……更多

2024-03-01 09:36:00模型,范式,科学家,情景,能力,科学

阿里推出全新推理模型：仅1/21参数媲美DeepSeek R

...况下，用强化学习实现了性能上的跨越。此外，阿里还在推理模型中集成了与Agent相关的能力，使其能够在使用工具的同时进行批判性思考，并根据环境反馈调整推理过程。QwQ-32B 在一系列基准测试中进行了评估，测试了数学推...……更多

2025-03-06 07:42:00阿里,推理,模型,参数,全新,能力

估值一年翻17倍，巨头创企疯狂涌入，AI搜索火爆了

...hGPT、纳米搜索（原360 AI搜索）已采用了CoT思维链的AI深度推理模式，天工AI搜索可支持多轮连续提问检索，再比如查询高考报名信息时，夸克AI搜索会一并前置官方报名入口、志愿填报建议等关联信息。为了进一步打开AI搜索引...……更多

2024-12-03 12:04:00估值,巨头,火爆,疯狂,搜索,搜索

苹果取得技术突破：可在 iPhone 上运行大型语言模型

...为“闪存中的LLM：利用有限内存实现高效的大型语言模型推理（LLMinaflash:EfficientLargeLanguageModelInferencewithLimitedMemory）”的论文中，研究人员提出了一种巧妙的闪存利用技术，将LLM模型的数据存储在闪存中。作者指出，与传统用于……更多

2023-12-21 22:47:00可在,模型,苹果,运行,突破,语言

AIGC落地应用：腾讯云如何助力产业智能化升级？

...同的模型形态，采用混合专家模型(MoE)结构，提高训练和推理效率及专业领域适应性，具备强大的中文创作能力。腾讯混元大模型构建三层自主可控的国产大模型全栈技术架构：上层为自研高速网络互联来支撑模型训练，预计20...……更多

2024-06-26 12:45:00腾讯,落地,升级,智能,产业,应用

模型即服务，卓世科技MaaS平台 2.0 正式上线

...。本次新上线了包括：模型训练新基座，支持模型训练、推理、量化、评测等功能。卓世科技MaaS平台是一款基于知识增强大模型的一站式行业模型训练开发平台。面向开发者和企业提供从基础算力服务、数据服务、模型训练服...……更多

2024-08-07 09:45:00模型,服务,平台,科技,模型,数据

深夜登顶，全网刷屏！来自杭州的DeepSeek震惊硅谷

...上。”不到一个月之后，今年1月20日，DeepSeek正式开源R1推理模型。据DeepSeek介绍，其最新发布的模型DeepSeek-R1在后训练阶段大规模使用了强化学习技术，在仅有极少标注数据的情况下，极大提升了模型推理能力。在数学、代码、...……更多

2025-01-27 11:33:00硅谷,杭州,全网,模型,中国,美国

消息称OpenAI计划两周内发布新AI模型“草莓” 专注于推

...于之前的预期。根据之前的报道，“草莓”是一款专注于推理的AI产品，预计于今秋发布。但这两位测试过该模型的人士称，OpenAI计划在未来两周内发布“草莓”。当然，最终的日期也可能生变。需要指出的是，虽然“草莓”是C...……更多

2024-09-11 09:50:00推理,草莓,模型,消息,草莓,模型

苹果新论文证明LLM大模型存在缺陷！没有进行真正的逻辑推理

...tical Reasoning”的论文，揭示了大型语言模型（LLM）在数学推理方面的显著局限性。尽管这些模型在生成人类水平的文本方面表现出色，但当处理简单的数学问题时，即使问题仅进行了微小的改动，如添加无关信息，模型的表现也...……更多

2024-10-13 14:15:00逻辑推理,新论,推理,缺陷,逻辑,模型

海南陵水黎安国际教育创新试验区图书馆引入DeepSeek-R

...化。通过多模态LLM构建基础架构，接入DEEPSEEK构建其强大推理能力，并与其他功能无缝对接，拥有了超越同行的强大功能。在语言支持上，“小图图”支持中文、英文、法语等多种语言，远超多数图书馆的语言服务范畴，为国际...……更多

2025-02-28 12:24:00陵水,黎安,图书馆,试验区,图书,海南

公孙龙：名与实的辩论高手，如何在战国时期“唇枪舌战？”

...，名词的定义和使用必须精准，模糊的概念会导致错误的推理和结论。这一思想在今天依然具有重要的现实意义。在现代社会，信息传播迅速，很多人常常因为对名词的模糊理解而产生误解。例如，“自由”这个词在不同的文化...……更多

2024-12-31 09:09:00公孙,辩论,时期,高手,公孙,辩论

英特尔aigc在pc上的应用

...优化，降低了模型对硬件资源的需求，进而提升了模型的推理速度，让社区开源模型能够很好地运行在个人电脑上。以大语言模型为例，英特尔通过第13代英特尔酷睿处理器XPU的加速、low-bit量化以及其它软件层面的优化，让最高...……更多

2023-11-24 09:47:00英特,英特尔,应用,英特,英特尔,模型

DeepSeek是真懂潍坊啊！

...eek不仅率先实现了媲美OpenAI-o1模型的效果，还大幅降低了推理模型的成本。其新模型DeepSeek-R1以十分之一的成本达到了GPT-o1级别的表现，引发海外AI圈的广泛讨论。据报道，DeepSeek开发的模型在多项测试中的表现都优于OpenAI，且设...……更多

2025-02-04 21:18:00潍坊,模型,成本,语言,自然语言,开发

RAG真能提升LLM推理能力？人大最新研究：数据有噪声，RA

...智元导读】RAG通过纳入外部文档可以辅助LLM进行更复杂的推理，降低问题求解所需的推理深度，但由于文档噪声的存在，其提升效果可能会受限。中国人民大学的研究表明，尽管RAG可以提升LLM的推理能力，但这种提升作用并不是...……更多

2024-10-23 13:34:00噪声,推理,性能,能力,数据,研究

李彦宏发布文心大模型4.0工具版，推理成本降到1%

...练效率提升到了原来的5.1倍，周均训练有效率达到98.8%，推理性能提升了105倍，推理的成本降到了原来的1%。“也就是说，客户原来一天调用1万次，同样成本之下，现在一天可以调用100万次。”此外，李彦宏在演讲中分享了百度...……更多

2024-04-16 13:37:00李彦,文心,推理,模型,成本,工具

邬贺铨院士：金融大模型改变了金融科技范式

...思维链的模式，通过专家介入诱导它一步一步地进行思维推理。中国工程院院士邬贺铨（左）与度小满CEO朱光（右）交流“此外，还需要建立专门的监控系统，例如微软专门构建内容管理系统，它与语言模型协同工作，并使用特...……更多

2023-10-17 17:57:00邬贺铨,金融,范式,院士,模型,科技

百融云创高级副总裁陈立宇：大模型AI将在财富管理生态中产生巨

...的时候预训练成本就很高，使用过程中每问一个问题是要推理的，推理是要花钱的，还有知识库的更新，各类场景的内容生产、巡检和标注，也是一个很大的工作量。特别对于中小金融机构来讲，承担这些成本还是有压力的。第...……更多

2024-12-20 15:02:00中产,陈立,副总,模型,生态,价值

腾讯最强！混元自研深度思考模型T1正式发布：吐字快、能秒回

...了自研深度思考模型混元T1正式版，这是腾讯自研的最强推理模型。腾讯表示，T1不仅吐字快、能秒回，还擅长超长文处理。通过大规模强化学习，并结合数学、逻辑推理、科学和代码等理科难题的专项优化，混元T1正式版进一步...……更多

2025-03-22 00:29:00腾讯,深度,模型,推理,腾讯,模型

围绕算力+数据，矩阵起源建设开源 AI 原生软件平台

...供开箱即用的分布式算力池，为数据处理、训练、微调、推理提供快捷、稳定、高效、弹性的分布式支撑环境；面向开发者，提供完备的开发API/SDK，助力企业快速接入MatrixDC平台，实现预期的业务目标。同时，MatrixDC支持与NVIDIAA...……更多

2024-05-22 10:00:00矩阵,起源,数据,建设,平台,软件

RAG没有银弹！四级难度，最新综述覆盖数据集、解决方案，教你

...成到LLMs中的三种主要方式。从简单的事实检索到复杂的推理任务，每个级别都有其独特的难点和解决方案，需要不同的技术和方法来优化性能。受参数量和知识更新的限制，大模型在执行很多真实场景下的任务时，都需要连接...……更多

2024-11-22 09:54:00银弹,数据,姿势,难度,解决方案,方案

微软宣布Team Copilot发布，年内将推出初步预览版

...电脑，二是在信息日益增加的世界，电脑能不能帮助人类推理、规划以及更有效地运用所有的信息。纳德拉认为，现在这波AI浪潮能为微软找到实现这两大梦想的答案。随后，Nadella聚焦Copilot。纳德拉提到了包含随时可用本地API...……更多

2024-05-22 20:01:00微软,微软,纳德拉,纳德,模型,功能

打造数智时代“张仲景”品牌河南中医药大学数智中医药项目成果

...区别与常规大语言模型，本模型融合中医临床的“思辨”推理机制，从四诊信息推理诊断疾病病机与证候，为数智中医提供临床思辨推理能力。模型结果具有可解释性，能对诊断结果和推荐方药进行个性化辨证解释。河南中医药...……更多

2025-01-09 19:47:00智时代,张仲景,中医药大学,中医,成果发布,河南

WRC 2025开普勒K2大黄蜂实力吸睛，商业化进程继续加速

...分层架构的视觉-语言-动作（VLA）模型。在具身决策中，推理层凭借视觉 - 语言模型（VLM）进行深度推理与规划，执行层则基于扩散变换器（DiT）的动作模块快速生成动作指令。K2大黄蜂的\"决策 - 执行\"链路实现了毫秒级响应，...……更多

2025-08-19 10:52:00开普勒,开普,黄蜂,进程,实力,商业

爱尔眼科入选“数字新基建”标志性项目

...人形象。基于大语言模型的动作合成：基于大语言模型的推理能力，实现文本驱动的数字人动作合成，合成动作更加符合文本语义与情感。基于Flow的个性化语音合成：基于Flow网格架构，仅需5—10秒音频的少样本合成个性化语音...……更多

2025-04-25 09:22:00爱尔,基建,眼科,标志性,标志,数字

为什么DeepSeek回答前总先“嗯”一下

...种学习成果在具体场景中尤为明显。当用户提出需要多步推理的问题时，AI语言模型生成填充词的概率会有所提升。这种模式与人类在烧脑对话中的表现完全一致——我们的大脑需要处理信息时，会不自觉地用填充词维持对话的...……更多

2025-04-29 18:36:00人类,语言,对话,模型,自然,数据

真香！智谱大模型，有了首个免费的API

...同时，GLM-4 支持了更长的上下文、更强的多模态、更快的推理速度，以及更多并发请求，大大降低了推理成本。在此基础上发展出的 GLM-4-Flash，则带来了一系列技术优势：数据预训练：引入大语言模型进入数据筛选流程，使用 10...……更多

2024-08-28 09:43:00真香,模型,模型,能力,应用,开发

苹果展示ferret-uiai系统可理解应用程序

...指令来设计的，以便于精确引用和接地。为了增强模型的推理能力，我们进一步编制了高级任务数据集，包括详细描述、感知/交互对话和功能推理。苹果在论文中表示相比较现有的GPT-4V，以及其它MLLMs模型，Ferret-UIAI模型更为优...……更多

2024-04-11 02:30:00应用程序,苹果,程序,应用,系统,模型

推理性能直逼o1，DeepSeek再次出手，重点：即将开源

...出手了，这次又是重磅炸弹。昨晚，DeepSeek 上线了全新的推理模型 DeepSeek-R1-Lite-Preview，直接冲击 OpenAI o1 保持了两个多月的大模型霸主地位。在美国数学竞赛（AMC）中难度等级最高的 AIME 以及全球顶级编程竞赛（codeforces）等权...……更多

2024-11-22 09:50:00推理,性能,再次,重点,模型,推理

DeepSeek首次披露：理论成本利润率545%

...层涟漪。3月1日，DeepSeek在知乎上发表题为《DeepSeek-V3/R1 推理系统概览》的文章，全面揭晓V3/R1 推理系统背后的关键秘密。最为引人注目的是，文章首次披露了DeepSeek的理论成本和利润率等关键信息。据介绍，假定GPU租赁成本为2...……更多

2025-03-01 18:59:00利润率,利润,成本,理论,节点,模型