小米,推理,模型,参数,训练,推理头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

...比，苹果已用Amazon Graviton、Inferentia等AWS芯片在机器学习推理工作负载方面实现了40%以上的效率提升，并预计在Trainium 2上预训练模型时，效率将提高50%。被亚马逊豪掷80亿美元投资的Anthropic，宣布与AWS共同构建面向机器学习训练...……更多

2024-12-05 09:47:00亚马,亚马逊,芯片,模型,训练,服务器

中国银河证券：Sora将推动推理端算力占比将大幅提升

...。目前OpenAI已加入算力芯片军备竞赛中，根据OpenAI论文，推理阶段算力需求是模型参数数量与训练数据集规模乘积的2倍，Sora将推动推理端算力占比将大幅提升。此外，通信端等配套实施需要全方位升级，网络上行下载速度需大...……更多

2024-02-21 14:22:00银河,中国,推理,证券,推理,文生

大模型“免费”送，厂商们图什么？

...，零一万物CEO李开复接受采访时表示：“未来整个行业的推理成本每年降低10倍是可以期待的，而且这个趋势是必然的。”未来，大模型的成本将呈阶梯状下探，但目前大模型的价格却断崖式下探，甚至部分企业免费送，降价幅...……更多

2024-06-05 10:57:00模型,厂商,模型,企业,成本,商业

推理成本直降99%！百川智能「1+3」矩阵揭秘，两张4090

...」。模型升级：Baichuan4-Turbo两张4090即可部署，Baichuan4-Air推理成本下降99%接下来，如何将Baichuan4-Turbo、Baichuan4-Air应用在实际场景中？从名字中不难看出，它们都是Baichuan 4系列基础模型的升级。对于企业来说，在不同场景阶段……更多

2024-11-04 09:50:00百川,矩阵,旗舰,推理,模型,成本

为AI加速而生英特尔第五代至强CPU带来AI新表现

...来概括它的特点,那就是——AI味道越发得浓厚。以训练、推理大模型为例:• 与第四代相比,训练性能提升多达29%,推理性能提升高达42%;• 与第三代相比,AI训练和推理性能提升高达14倍。什么概念?现在若是将不超过200亿参数的模型...……更多

2023-12-25 19:02:00英特,英特尔,英特,英特尔,处理器,处理

推动大模型自我进化，北理工推出「流星雨计划」

...我进化的方式，解决代码模型在处理复杂问题时缺少中间推理过程。核心观点：自我进化的力量跟随上述自我进化的思想，在 SRA-MCTS（Self-guided MCTS-based data generation for Reasoning Augmentation）方法中，作者无需借助额外的任何监……更多

2024-12-06 09:52:00流星雨,进化,理工,流星,模型,模型

大模型这把大火，烧到了手机领域

...手机圈的大模型大战已经开始了。资料显示，今年8月，小米宣布其已经成功自研了一个13亿参数的端侧模型，并且在手机端实现了运行。同时公布其自研的大规模预训练语言模型MiLM-6B，参数规模达到了64亿，在权威中文评测榜单...……更多

2023-12-15 10:18:00大火,模型,领域,手机,模型,手机

算力直降97%，GPT-3存储只用20MB？！这篇新论文火了

...开始，作者提到前人研究已经表明，大语言模型（LLM）的推理可以在1.58-bit精度下进行，且不会有任何性能损失。比如下面这篇论文，有人引入了1-bit的LLM变体（即BitNet b1.58），其中LLM的每个参数或权重都是三元的{-1, 0, 1}。它在...……更多

2024-12-30 09:11:00文火,新论,存储,训练,小哥,模型

位列第一梯队，腾讯混元再度领跑国内大模型

...维度的综合性测评基准，由十大基础任务组成，包括逻辑推理、代码、语言理解、长文本、角色扮演等。本次报告选取了国内外具有代表性的32个大模型4月份的版本，通过多维度综合性测评，真实准确地反映了国内外大模型在中...……更多

2024-05-06 16:52:00腾讯,梯队,模型,腾讯,模型,能力

DeepSeek/o3的弱点找到了！三心二意明明对了又改错

DeepSeek和o1/o3一类推理大模型持续带来震撼之际，有人开始研究他们的弱点了。最新研究揭示：在遇到高难度问题时，推理大模型可能像“三心二意的学生”一样频繁切换解题思路，却因缺乏深入探索而失败——这种现象被研究...……更多

2025-02-04 19:41:00弱点,模型,推理,答案,思路,准确率

国产大模型加速落地，争夺“中国版ChatGPT”心智定位

...技等也分别推出全新的大模型产品。李开复表示，大模型推理成本的下降会推动中国AI大模型进入”落地为王”的阶段，今年会迎来“大模型应用爆发元年”。他同时预测，明年下半年，随着大模型推理成本的大幅度下降，人们...……更多

2024-05-07 18:33:00心智,中国,落地,模型,定位,国产

「学术版ChatGPT」登场！Ai2打造科研效率神器Open

...78%～90%。检索增强（retrieval-augmented）的语言模型可以在推理时检索并集成外部知识源，从而缓解上述问题。然而，许多此类系统依赖于黑盒API或通用的LLM ，既没有针对文献综合的任务进行优化，也没有搭配适合科研的开放式...……更多

2024-11-27 13:33:00神器,文献,效率,科研,学术,模型

京东云：智能体大规模“上岗”，企业深度应用正当时

...模型一体机软硬协同，支持千人规模企业并发需求，实现推理速度提升50%，满血版、标准版、轻量版为不同规模企业提供灵活选择，助力企业快速构建企业级AI服务能力，极大降低专业技术门槛。今天，京东云正式发布三大垂直...……更多

2025-05-20 14:47:00京东,大规,大规模,深度,智能,应用

精准狙击Llama 3.1？Mistral AI开源Larg

...l Large 2，该模型拥有 1230 亿个参数，在代码生成、数学、推理等方面与 OpenAI 和 Meta 的最新尖端模型不相上下。紧随 Llama 3.1 405B 之后，Mistral Large 2 的发布让开源大模型的赛道一下子热闹起来，而这一模型的特点是 ——「足够大...……更多

2024-07-26 09:36:00模型,基准,多语,测试,性能,生成

重磅！OpenAI o1模型还没有实现真正的逻辑推理能力

...-preview和o1-mini模型已经可以使用。OpenAI宣布，“新模型在推理能力上代表了人工智能能力的新水平，因此，计数器将重置为1”。根据OpenAI的自测，o1在竞赛编程问题（Codeforces）中排名第89个百分点，在美国数学奥林匹克竞赛（AIM...……更多

2024-09-18 15:01:00逻辑推理,重磅,推理,逻辑,模型,能力

Meta发布开源大模型Llama 4：首次采用“混合专家”架

...ma 4的推出将让AI智能体变得更强大，使其具备更高水平的推理和行动能力。据知情人士透露，Llama 3已经推出一年了，而Llama4之所以迟迟未能发布，是因为在开发过程中，该模型在技术基准上没有达到Meta的预期，尤其是在推理和...……更多

2025-04-07 06:44:00架构,混合,模型,专家,模型,人工智能

真香！智谱大模型，有了首个免费的API

...同时，GLM-4 支持了更长的上下文、更强的多模态、更快的推理速度，以及更多并发请求，大大降低了推理成本。在此基础上发展出的 GLM-4-Flash，则带来了一系列技术优势：数据预训练：引入大语言模型进入数据筛选流程，使用 10...……更多

2024-08-28 09:43:00真香,模型,模型,能力,应用,开发

芯片战场丨瞄准大模型摩尔线程首个千卡智算中心落地

...模型智算加速卡MTT S4000，以及专为千亿参数大模型训练和推理提供支持的摩尔线程KUAE平台。近年在AI热潮之下，国内的智算中心不断兴建。根据此前国家信息中心联合浪潮信息发布的《智能计算中心创新发展指南》统计，目前全...……更多

2023-12-20 10:52:00摩尔,线程,落地,战场,芯片,模型

Figure AI发布人形机器人通用大模型：能识别陌生物品，

...的飞跃，就无法进入家庭领域，而Helix模型能像人类一样推理。据Figure AI介绍，Helix不仅实现了对整个机器人的上半身，包括手腕、躯干、头部和单个手指输出高速率连续控制，也可以在两台机器人上同时运行，使它们能够解决...……更多

2025-02-21 12:11:00机器人,机器,人形,模型,运行,物品

权威AI开源标准1.0版发布：Llama也不算开源

...、验证和测试、支持库（如分词器和超参数搜索代码）、推理代码和模型架构。参数：模型参数，例如权重或其他配置。参数应根据 OSI 批准条款提供。例如，训练中间阶段的检查点以及优化器状态。对于机器学习系统，模型...……更多

2024-10-30 09:52:00权威,标准,数据,模型,系统,训练

Meta版慢思考来了！田渊栋团队整合快慢思考，能走迷宫推箱子

...本更低。能解决迷宫、推箱子等复杂问题。通过让模型在推理轨迹和最终答案上进行训练，再基于特定策略丢掉部分轨迹，Dualformer模型可以在模仿慢思考的同时，像快思考一样走捷径。由此能形成更简洁的思维链（CoT）。从结...……更多

2024-10-18 09:51:00推箱子,快慢,迷宫,整合,团队,推理

OpenAI o1模型到博士水平了?复旦教授:没有真正推理能

...小尺寸版o1-mini。OpenAI官方发文称，新模型旨在解决复杂推理问题，训练模型在响应之前花更多时间思考，类似于人类的思考方式。“新模型在推理能力上代表了AI能力的新水平。”OpenAI称，该模型可以解决科学、编程和数学等更...……更多

2024-09-13 16:44:00复旦,相关性,概率,推理,模型,教授

大模型价格战“卷”向何方？｜深度

...千亿参数MoE架构模型。MoE架构中基于多个专家并行机制，推理时只激活部分专家，以稀疏性压缩了参数数量和推理成本。“这就可以极大地节省算力耗费”。而率先掀起价格战的幻方DeepSeek-V2，就是其通过架构创新，实现了大模...……更多

2024-05-25 10:34:00何方,价格战,深度,模型,价格,模型

很强也很贵！OpenAI12天12场直播收官，官宣最新推理模

...，和网友猜测的一样，人工智能（AI）巨头OpenAI发布最新推理模型o3和o3-mini。前一天，OpenAI公司CEO山姆·奥特曼（Sam Altman）就曾发文提到三个“o”暗示了o3的到来。为何新模型跳过了o2直接命名o3？奥特曼表示是为了避免和英国电...……更多

2024-12-21 12:10:00推理,模型,直播,推理,模型,时间

人类和AI在推理任务中的表现相似，Google DeepMi

...人工智能（AI），特别是大型Transformer语言模型（LMs）在推理任务中的表现及其局限性。研究结果显示，尽管这些模型在处理自然语言方面表现卓越，但在复杂逻辑推理任务中，人类和语言模型都会受到语义内容合理性和可信度...……更多

2024-08-19 13:49:00局限性,推理,人类,任务,研究,模型

RAG没有银弹！四级难度，最新综述覆盖数据集、解决方案，教你

...成到LLMs中的三种主要方式。从简单的事实检索到复杂的推理任务，每个级别都有其独特的难点和解决方案，需要不同的技术和方法来优化性能。受参数量和知识更新的限制，大模型在执行很多真实场景下的任务时，都需要连接...……更多

2024-11-22 09:54:00银弹,数据,姿势,难度,解决方案,方案

大模型重构生命科学！最大基础模型面世，解锁DNA超长序列

...，从跨模态预训练、到下游任务的微调都可以完成。而在推理端，他们为该领域量身定制地打造了生物与AI融合的计算引擎。这个值得说道说道。因为在我们日常大模型语境中，可能只需要针对AI模型本身进行推理优化，就能在...……更多

2024-11-07 09:50:00模型,重构,生命科学,序列,生命,基础

奥林匹克竞赛里选最聪明的AI：Claude-3.5-Sonn

...异，近来Anthropic公司最新发布的Claude-3.5-Sonnet因在知识型推理、数学推理、编程任务及视觉推理等任务上设立新行业基准而引发广泛讨论：Claude-3.5-Sonnet 已经取代OpenAI的GPT4o成为世界上”最聪明的AI“（Most Intelligent AI）了……更多

2024-06-25 09:45:00奥林,奥林匹克,竞赛,模型,推理,能力