推理,模型,成本,模型,团队,推理头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

...我进化的方式，解决代码模型在处理复杂问题时缺少中间推理过程。核心观点：自我进化的力量跟随上述自我进化的思想，在 SRA-MCTS（Self-guided MCTS-based data generation for Reasoning Augmentation）方法中，作者无需借助额外的任何监……更多

2024-12-06 09:52:00流星雨,进化,理工,流星,模型,模型

2023IDEA大会：让大模型更好应对复杂问题

...本正经的胡说八道”怎么解？众所周之，大模型存在深度推理能力差、知识不可追溯、实时更新代价高等局限性，这也成为其在许多严肃领域落地的主要瓶颈。如何弥补大模型的这部分缺陷，是当下AI应用的重要课题。为此，IDEA...……更多

2023-11-24 10:53:00模型,大会,问题,模型,研究,能力

开源大模型杀疯了！Mistral新模型三分之一参数卷爆Lla

...设定了一个新的前沿”。Mistral Large 2尤其擅长代码和数学推理，上下文窗口128k，支持数十种自然语言以及80+编程语言。特别在MMLU上，其预训练版本更是达到了84.0%的准确率。消息一出，Mistral AI联创兼首席科学家第一时间转发，...……更多

2024-07-26 09:39:00模型,参数,模型,基准,问题,推理

大语言模型逻辑推理“很糟糕”

...智能的旗舰产品GPT-4为代表的大语言模型在逻辑测试中的推理表现很糟糕：它们犯下前后不一致的错误，而且推理过程往往是荒谬的。近日发表在《皇家学会开放科学》杂志上的一项研究表明，大语言模型所依赖的语料库往往反...……更多

2024-06-12 18:15:00逻辑推理,推理,逻辑,模型,语言,模型

位列第一梯队，腾讯混元再度领跑国内大模型

...维度的综合性测评基准，由十大基础任务组成，包括逻辑推理、代码、语言理解、长文本、角色扮演等。本次报告选取了国内外具有代表性的32个大模型4月份的版本，通过多维度综合性测评，真实准确地反映了国内外大模型在中...……更多

2024-05-06 16:52:00腾讯,梯队,模型,腾讯,模型,能力

OpenAI直播最后一天放出“王炸”：下一代推理模型o3亮相

...术分享直播活动的最后一天！周五，OpenAI发布了下一代的推理模型o3，这是今年早些时候发布的o1推理模型的升级版本。更准确地说，o3是一个模型系列——就像o1一样，同时有o3和o3-mini两个版本，后者是一款更小的精简版模型，...……更多

2024-12-21 17:02:00下一代,推理,模型,直播,模型,推理

联想发布DeepSeek一体机解决方案：支持千亿参数大模型训

...器双产品形态，率先实现从千亿参数大模型训练到场景化推理落地的全链条覆盖。联想创新性推出两大产品：面向敏捷部署的DeepSeek智能体一体机采用ThinkStationPX工作站为载体，搭载沐曦曦思N260 GPU。实测数据显示，在相同并发条...……更多

2025-02-06 15:13:00一体机,模型,一体,解决方案,训练,参数

给小学数学题加句废话，OpenAI o1就翻车了，苹果论文质

苹果新论文：AI 大模型可能不会推理。AI 大模型（LLM）真的像我们理解的那样能「思考」或「推理」吗？最近，苹果的一篇论文探讨了这个问题，并且给出了一个倾向于「否」的答案。相关帖子被很多人围观。这篇题为「GSM-Symb...……更多

2024-10-14 09:55:00数学题,推理,废话,苹果,数学,小学

Dmine币与NVIDIA、Intel生态深度融合，优化GP

...DA加速与InteloneAPI异构计算技术，提升显卡运行效率，让AI推理更快、更节能。Dmine币如何优化NVIDIAGPU算力？1.CUDA加速，提高DeepSeekR1推理性能Dmine币集成CUDA并行计算技术，使RTX4090在DeepSeekR1推理速度提升40%，大幅降低延迟：T……更多

2025-03-19 21:02:00深度,生态,推理,显卡,任务,运行

“智算融合共创未来”——开普云AI战略暨新产品发布会召开

...容生成的一致性和可控性； 5.算力适配通用化，在模型推理运行方面，针对重点行业客户应用，与多家国内外算力厂商的产品适配，形成了算力模型一体化产品； 6.模型进步持续化，为保障技术的持续领先，开普云将不断完善...……更多

2024-04-11 10:30:00新产,开普,共创,共创未来,发布会,新产品

2023内容科技应用典型案例：农业银行大模型ChatABC

...解决模型并行、数据并行等训练难题，提升AI大模型训练推理效率。应用：探索大模型知识融合新架构。构建异构知识库，支持全文检索、知识推理等各类知识检索场景需求。深度定制全文检索框架，支持文档类知识的高性能精...……更多

2024-04-08 17:06:00农业银行,典型案例,模型,典型,案例,银行

李彦宏：大模型场景下开源是最贵的，多模态是通往AGI的必经之

...练效率提升到了原来的5.1倍，周均训练有效率达到98.8%，推理性能提升了105倍，推理的成本降到了原来的1%。会上，百度发布了文心大模型4.0的工具版，该工具版可以让开发者体验代码解释器功能，开发者不仅可以通过自然语言...……更多

2024-04-16 17:57:00李彦,模态,之路,必经,模型,场景

无问芯穹夏立雪：破解算力焦虑，我做了大模型算力领域的“淘宝”

...巨大，英伟达一家又无法满足所有的全球AI大模型训练、推理的需求；另一方面，英伟达以外的多元异构GPU也在快速发展中，AI算力生态分散，难以被整合起来，供应给亟需算力的大模型公司。夏立雪观察到，现下的算力焦虑，...……更多

2024-04-03 18:19:00立雪,淘宝,焦虑,专访,模型,领域

开拓AI“生态圈”，江苏多地宣布DeepSeek正式登陆

...是降低成本，实现效能飙升。DeepSeek通过自研GRPO算法优化推理成本，结合移动云全网算力布局，整体推理成本降低超13%。预搭载的大模型管理平台和预部署的DeepSeek大模型，让企业无需投入大量时间和资源进行技术开发，直接进...……更多

2025-02-17 11:03:00江苏,生态,登陆,模型,汉风,徐州

阿里云全面升级GPU云服务：AI大模型推理性能可提升100%

...云推出全面升级的GPU云服务，通过全新优化GPU套件，多GPU推理服务性能可最大提升100%。针对调用GPU算力最常用的容器技术，阿里云推出ACK云原生AI套件，帮助开发者及企业更高效地开发和部署AI应用，加速大模型应用落地。随着A...……更多

2024-07-19 17:21:00阿里,推理,模型,性能,升级,服务

上海：加速实施“模塑申城”

...品。人民网记者葛俊俊摄“这一波AI浪潮的特点是训练和推理的成本更低、模型能力更强以及多模态融合。其中，随着整体推理成本的降低，我们可以在相同硬件上部署更大、更通用的模型，这也是我们在产业落地上非常重要的...……更多

2025-02-20 15:49:00模塑,申城,上海,模型,人工智能,智能

小米开源首个推理大模型Xiaomi MiMo：7B参数就超越

...快科技4月30日消息，小米官方今天正式宣布，开源首个为推理（Reasoning）而生的大模型——Xiaomi MiMo。据介绍，Xiaomi MiMo在数学推理（AIME 24-25）和代码竞赛（LiveCodeBench v5）公开测评集上，MiMo仅用7B的参数规模，超越了OpenAI的闭……更多

2025-04-30 10:36:00小米,推理,模型,参数,训练,推理

本科生这样“攻克”世界级难题

...科学与工程应用，如国际通行基准测试HPL&HPCG、大模型推理优化、渗流数值模拟、火星大气模拟、新型材料结构计算等，并参加英文答辩。此外，参赛队伍还通过跨团队、跨地域合作，共同挑战地震波模拟赛题。赛题有多难？...……更多

2024-04-18 07:36:00本科生,难题,本科,世界,福州大学,福州

后摩智能“端边大模型AI 芯片”闪耀2025世界人工智能大会

...动终端在脱离了“云端”的情况下，依然具备本地大模型推理能力。在7月26日启幕的2025世界人工智能大会上，这一创新产品正式亮相，瞬间吸引了业内广泛关注，成为AI赋能千行百业的又一次跨越。当前，大模型行业正经历深刻...……更多

2025-07-28 07:27:00智能,人工智能,人工,芯片,模型,大会

专注于推理的OpenAI“草莓”模型两周内发布？是人工智能下

...“秋季发布”（9月至11月）要更早。上述报道称，专注于推理能力的人工智能“草莓”发布前后还有一些亟待解决的问题，但看似“仓促上马”似乎说明OpenAI感受到了大语言模型驱动产品领域的激烈竞争压力，希望通过近几个月...……更多

2024-09-11 09:55:00人工智能,推理,草莓,人工,模型,突破

MMMU华人团队更新Pro版！多模态基准升至史诗级难度：过滤

...不断提升，例如GPT-4o在大学水平上的多学科多模态理解和推理（MMMU）基准测试中取得了69.1%的准确率。不过，基准测试结果是否真的能反映模型对多样化主题的深入理解，仍然有争议，或者说模型是否只是利用了统计模式，而非...……更多

2024-09-18 13:31:00模态,史诗,基准,难度,问答,文本

阿里发布全球最强开源模型千问3 通义App第一时间已上线

...布的千问3开源模型包含8款不同尺寸，均为全新的“混合推理模型”，智能水平大幅提升的同时也更省算力。其中，千问3旗舰模型Qwen3-235B-A22B是一款混合专家（MoE）模型，该模型创下所有国产模型及全球开源模型的性能新高；而...……更多

2025-04-29 11:35:00通义,阿里,模型,全球,通义,模型

“眼里有活”的斯坦福机器人来一个？数十种家务全包成本约3万

...电源和计算，即1.26千瓦时重14公斤的电池，在数据收集和推理过程中的所有计算都在一台消费级笔记本电脑上进行，该笔记本电脑配有英伟达3070ti GPU （8gb VRAM）和英特尔i7-12800H。物料单中高价值量的部件英伟达“网红研究员”...……更多

2024-01-07 11:00:00斯坦,斯坦福,机器人,家务,成本,机器

优刻得首个「国产千卡智算集群」落地，支持智源千亿大模型训练

...环境，可支持超千卡规模、千亿参数级别的大模型训练和推理任务，旨在突破算力瓶颈，加速AI算力的国产化进程。国产千卡智算集群采用软硬件一体化的架构设计，提供低延迟、高吞吐、高可用的IB组网环境，支持GDR技术，使...……更多

2024-06-27 19:01:00集群,落地,模型,国产,训练,支持

o1带火的CoT到底行不行？新论文引发了论战

...To CoT or not to CoT？OpenAI ο1 的诞生极大地提升了人们对 LLM 推理能力和思维链（CoT）的兴趣。一时之间，似乎思维链很快就会成为所有 LLM 的标配，但思维链并非万能，就连 OpenAI 自己也提到 o1 在某些任务上的表现并不比 GPT-4o 强...……更多

2024-09-21 09:37:00新论,推理,符号,性能,任务,数据