推理,性能,再次,重点,模型,推理头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

百川智能发布baichuan3稳定语言模型

...处理和代码生成领域的强大实力。不仅如此，其在对逻辑推理能力及专业性要求极高的MCMLE、MedExam、CMExam等权威医疗评测上的中文效果同样超过了GPT-4，是中文医疗任务表现最佳的大模型。Baichuan3还突破“迭代式强化学习”技术...……更多

2024-01-29 19:57:00百川,模型,语言,智能,模型,百川

英伟达开源NVLM 1.0屠榜多模态！纯文本性能不降反升

...例如，OCRBench）的性能，但与低分辨率版本模型相比，在推理相关任务（例如，MMMU）上的准确率却会下降。此外，虽然开源的多模态大模型在视觉-语言任务上取得了非常亮眼的基准测试结果，但在纯文本任务上的性能却有显著...……更多

2024-09-24 13:36:00英伟,模态,文本,性能,模态,模型

昆仑万维宣布开源2千亿稀疏大模型Skywork-MoE

...万维宣布开源2千亿稀疏大模型Skywork-MoE，性能强劲，同时推理成本更低。Skywork-MoE基于之前昆仑万维开源的Skywork-13B模型中间checkpoint扩展而来，是首个完整将MoE Upcycling技术应用并落地的开源千亿MoE大模型，也是首个支持用单台409...……更多

2024-06-03 20:59:00万维,昆仑,模型,模型,万维,昆仑

16家头部大模型公司上海神秘碰头，现场人挤人人人

...最为关键的三大层面，即：算力层：用于基础模型训练和推理的基础设施模型层：使用基础模型加速生成式AI应用构建应用层：开箱即用的生成式AI应用至于能力如何，我们直接来看下最为直观的效果。在生成式AI应用方面，...……更多

2024-05-30 17:18:00上海,头部,模型,人人,公司,亚马

腾讯Angel机器学习平台获世界互联网大会领先科技奖

...腾讯Angel 机器学习平台，突破了万亿级模型分布式训练和推理以及大规模应用部署等难题，率先实现大模型技术从底层硬件到关键软件技术的自主研发，在业务场景广泛应用，显著推动实体产业和数字经济发展，提升社会效率。...……更多

2024-11-21 14:04:00科技奖,腾讯,机器,领先,大会,互联网

图结构转文本序列，大模型直接读懂！图推理性能大涨

...和属性，如节点计数、最大度数计算和图式形状分类等图推理任务都能完成。具体如何实现？机器学习工程师Rohan Paul发帖推荐论文并做了个总结。用多种技术开发了图线性化方法：图中心性（PageRank和度）、图退化（k-core分解）...……更多

2024-12-03 13:33:00序列,推理,模型,文本,性能,结构

智启新元年：PC成为AI落地首选终端

...了具备高性能计算能力的通用加速芯片，是大模型训练、推理的主要算力来源；云计算的发展和普及，则使软硬件充分解耦，大模型开发者可以以相对低的成本调用大规模的算力、存储和网络资源，开发进程大大加快；同时，Tra...……更多

2023-12-22 12:43:00启新,落地,终端,模型,终端,应用

字节猛踩油门

...型3.0、视觉理解模型，并推出OS Agent解决方案及AI云原生推理套件，用于企业客户构建与部署Agent应用。其中，豆包1.5深度思考模型作为字节首款推理模型，具备“边想边搜”能力，同时借助视觉推理能力，可以综合理解图片中的...……更多

2025-04-18 22:26:00油门,字节,模型,火山,引擎,豆包

李彦宏发布文心大模型4.0工具版，推理成本降到1%

...练效率提升到了原来的5.1倍，周均训练有效率达到98.8%，推理性能提升了105倍，推理的成本降到了原来的1%。“也就是说，客户原来一天调用1万次，同样成本之下，现在一天可以调用100万次。”此外，李彦宏在演讲中分享了百度...……更多

2024-04-16 13:37:00李彦,文心,推理,模型,成本,工具

OpenAI 超强 o1 智商超 120 遥遥领先于其他模型

...的 agent，是关键的一步。而这篇论文就重点研究了扩展「推理期计算」（inference-time computation）这个问题。研究团队分析了扩展测试时计算的两种主要机制：（1）针对密集的、基于过程的验证器奖励模型进行搜索；（2）根据测...……更多

2024-09-18 09:49:00智商,选手,模型,博士,领先,年代

昆仑万维：“天工大模型3.0”将于4月17日正式发布同步开

...“天工2.0”MoE大模型，“天工3.0”在模型语义理解、逻辑推理、以及通用性、泛化性、不确定性知识、学习能力等领域拥有惊人的性能提升，其模型技术知识能力提升超过20%，数学/推理/代码/文创能力提升超过30%。同时，“天工...……更多

2024-04-01 19:56:00万维,昆仑,模型,将于,同步,参数

微软连发3款Phi-3.5模型：128K上下文，首用MoE架

...支持128k上下文长度。Phi-3.5-mini-instruct主要面向基础快速推理任务，Phi-3.5-MoE-instruct可胜任复杂推理任务，Phi-3.5-vision-instruct则兼具文本与视觉能力。性能最强大的Phi-3.5-MoE-instruct模型有419亿个参数，……更多

2024-08-22 09:49:00上下文,微软,架构,模型,上下,性能

微软研究院推出orca2llm

...然后生成、回忆-原因-生成、提取-生成和直接回答等各种推理技术，同时还能为不同的任务选择不同的解决方案策略。Orca2模型相比较Llama2和WizardLM等大型语言模型，在痛苦理解、常识推理、多步推理、数学问题解决、阅读理解...……更多

2023-11-22 11:08:00微软,研究院,研究,微软,模型,推理

为AI加速而生英特尔第五代至强CPU带来AI新表现

...来概括它的特点,那就是——AI味道越发得浓厚。以训练、推理大模型为例:• 与第四代相比,训练性能提升多达29%,推理性能提升高达42%;• 与第三代相比,AI训练和推理性能提升高达14倍。什么概念?现在若是将不超过200亿参数的模型...……更多

2023-12-25 19:02:00英特,英特尔,英特,英特尔,处理器,处理

阿里多模态检索智能体，自带o1式思考过程！复杂问题逐步拆解

多模态检索增强生成（mRAG）也有o1思考推理那味儿了！阿里通义实验室新研究推出自适应规划的多模态检索智能体。名叫OmniSearch，它能模拟人类解决问题的思维方式，将复杂问题逐步拆解进行智能检索规划。随便上传一张图，...……更多

2024-12-05 09:45:00模态,拆解,阿里,检索,过程,智能

全球最强开源大模型Llama 3发布：使用15T数据预训练，

...业基准测试中达到了 SOTA，并提供了新的功能，如改进的推理能力。最强开源 LLM 来了Meta 官方博客写道，“得益于预训练和后训练的改进，我们的预训练和指令微调模型是目前 8B 和 70B 参数尺度下最好的模型。”他们表示，后期...……更多

2024-04-20 11:03:00模型,训练,参数,数据,全球,模型

挑战Scaling Law，Meta发布移动端350M小模型

...做个假设，如果把GPT-4（大约有1万亿参数）以50tokens/s的推理速度部署在生活中，你需要什么样的硬件？答案是1亿个H100 GPU。别说是移动设备了，家里都放不下。那如果降低标准，用LLaMA-v2 7B这样的模型，再加上8-bit量化呢？简单...……更多

2024-07-23 09:39:00模型,性能,移动,模型,参数,架构

上海AI实验室版o1已上线！数学题、Leetcode全拿下，

...编程、数字游戏等任务。这就是上海AI实验室版o1——强推理模型书生InternThinker，刚刚正式开放试用！新模型不仅在长思维能力方面有了很大提升，而且还能在推理过程中进行自我反思和纠正。先来一起看两个例子感受一下：比...……更多

2024-11-29 09:27:00数学题,上海,实验室,实验,数学,模型

多模态LLM视觉推理能力堪忧，浙大领衔用GPT-4合成数据构

新智元报道编辑：乔杨【新智元导读】LLM的数学推理能力缺陷得到了很多研究的关注，但最近浙大、中科院等机构的学者们提出，先进模型在视觉推理方面同样不足。为此他们提出了一种多模态的视觉推理基准，并设计了一种...……更多

2024-08-08 16:23:00模态,领衔,基准,推理,视觉,能力

pytorchtorchao正式发布,提供了一系列优化工具集

...将模型训练转换为float8，从而轻松实现模型高效训练。在推理方面，torchao提供多种量化方法，包括权重量化（Weight-OnlyQuantization）和动态激活量化（DynamicActivationQuantization），用户可以自有选择适合的量化策略，以获得最佳的模...……更多

2024-10-03 02:58:00工具集,工具,模型,可将,训练,推理

肖峰：DeepSeek加速AI大时代，哪些领域将迎来新增长点

...算领域也将因DeepSeek的兴起而受益匪浅。AI模型的训练和推理都需要强大的算力支持，随着AI应用的增多和普及，市场整体对于云端推理算力需求或将大幅增加。国内头部云计算公司陆续接入DeepSeek，有望推动云服务商算力租赁及A...……更多

2025-02-11 21:12:00长点,大时代,领域,模型,领域,应用

华为全面启动鲲鹏昇腾原生开发

...现性能同步优化。昇腾原生开发方面，华为准备以CANN和推理引擎MindIE为基础，基于一套开发体系，面向算子、模型和应用三个开发场景，激发开发者的原生创新，IT之家总结如下。面向算子开发，我们进一步开放CANN，全面升级...……更多

2024-05-12 03:14:00华为,鲲鹏,开发,开发,鲲鹏,华为

Meta版慢思考来了！田渊栋团队整合快慢思考，能走迷宫推箱子

...本更低。能解决迷宫、推箱子等复杂问题。通过让模型在推理轨迹和最终答案上进行训练，再基于特定策略丢掉部分轨迹，Dualformer模型可以在模仿慢思考的同时，像快思考一样走捷径。由此能形成更简洁的思维链（CoT）。从结...……更多

2024-10-18 09:51:00推箱子,快慢,迷宫,整合,团队,推理

联发科天玑9400+拿下最强AI手机芯片：端侧推理准确率反超

...是天玑9400的1.25倍，支持最高8B规模的DeepSeek-R1端测部署，推理准确率反超云端大模型。天玑9400+行业首发增强型推理解码技术（SpD+），推理解码能力提升20%，同时集成天玑AI智能体化引擎，可将传统A应用程序升级为更先进的智能...……更多

2025-04-11 10:48:00联发,天玑,准确率,云端,推理,芯片

真香！智谱大模型，有了首个免费的API

...同时，GLM-4 支持了更长的上下文、更强的多模态、更快的推理速度，以及更多并发请求，大大降低了推理成本。在此基础上发展出的 GLM-4-Flash，则带来了一系列技术优势：数据预训练：引入大语言模型进入数据筛选流程，使用 10...……更多

2024-08-28 09:43:00真香,模型,模型,能力,应用,开发

无一大模型及格！北大/通研院提出超难基准，评估长文本理解生

...的长依赖任务中的多信息检索、时间重排序、计算、理解推理能力表现均不乐观。比如像Claude3-200k，GPT4-32k、GPT4-8k、GPT3.5-turbo-6k、LlamaIndex这种商业模型，平均只有40%的准确率。而像开源模型表现就更不理想了…ChatGLM2-6B、LongLL……更多

2024-08-08 09:39:00基准,北大,生成,模型,文本,评估

百度发布深度思考大模型文心X1：性能对标R1，API调用价格

...百度首个原生多模态大模型，其多模态理解、文本和逻辑推理能力显著提升，在多项测试中表现优于GPT4.5，API调用价格仅为GPT4.5的1%；文心大模型X1为深度思考模型，性能对标DeepSeek-R1，调用价格约为R1的一半。百度方面表示，作...……更多

2025-03-16 11:07:00文心,深度,模型,性能,价格,文心

成都人形机器人创新中心全国首发 R-DDIRM 高速推理模型

...现突破，于近日全国首发基于扩散架构的人形机器人高速推理模型 R-DDIRM（Denoising Diffusion Implicit Robot Model）。这是继今年 5 月推出中国首个基于扩散架构人形机器人任务生成式模型 R-DDPRM（Denoising Diffusion Proba……更多

2024-11-25 09:49:00成都,人形,机器人,推理,模型,机器