边界,推理,模型,训练,推理,模型头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

黄仁勋：我从不在乎市场份额、英伟达唯一目标是创造新市场

...英伟达，老黄还讨论了AGI的智能扩展、机器学习的加速、推理与训练的重要性……虽然时长感人（近1个半小时），但一大波网友已经看完并交起了作业（开始卷了是吧！）网友：学起来！学起来！黄仁勋：未来推理的增长将远...……更多

2024-10-23 12:25:00新市,英伟,份额,从不,目标,市场

京东率先推出行业首批高商业可用数字人，618向商家免费开放

...技人工智能业务部总裁何晓冬表示。技术拓宽大模型能力边界，支持企业构建专有模型在AI进化的“马拉松”中，京东大模型展现出了独特的产业基因。目前，京东已经具备全尺寸大模型，满足多样化的产业需求：3B和10B模型可...……更多

2025-05-22 18:51:00京东,商家,开放,数字,商业,行业

百度云升级模型服务，百度版GPTs即日开放 | 最前线

...应用，希望开发者基于咱们大模型去做AI原生应用，它的边界在哪里？能不能介绍一下百度目前跑得最好的AI原生应用有哪些？侯震宇：所谓的边界，我们对于百度来说有自己的To C业务，大家都很熟悉，我们的搜索、信息流，...……更多

2023-12-21 14:31:00模型,升级,开放,服务,模型,应用

全球高校同台PK，齐鲁工业大学斩获一等奖！

...合国际科学前沿问题，以赛促学，拓展学生学识与能力的边界。本次决赛要求各入围队伍在3000瓦功耗约束下设计安装小型超算集群，运行优化国际通行基准测试HPL&HPCG、大模型推理优化、渗流数值模拟、火星大气模拟、新型...……更多

2024-04-22 17:51:00齐鲁,一等奖,工业大学,工业,全球,大学

刚刚，Llama 3.2 来了！支持图像推理，还有可在手机上

... Meta 对 Llama 模型来了一波大更新：不仅推出了支持图像推理任务的新一代 Llama 11B 和 90B 模型，还发布了可在边缘和移动设备上的运行的轻量级模型 Llama 3.2 1B 和 3B。不仅如此，Meta 还正式发布了 Llama Stack Distribution，其可……更多

2024-09-27 13:42:00推理,可在,图像,运行,版本,支持

面壁智能发布2B模型：适配主流手机，推理成本仅为GPT-4的

...在MMLU（多任务语言理解）、Knowledge（知识）、Reasoning（推理）、Comprehension（理解）等关键指标上均超越了Meta Llama 2的13B模型。这一个故事，在2024年2月1日的发布会上，也被AI模型层公司面壁智能的CEO李大海不断提起。对标Mistral..……更多

2024-02-03 16:03:00适配,推理,模型,主流,成本,智能

小模型越级挑战14倍参数大模型，谷歌Test-Time端新的

...发布的新模型草莓所用的方法。研究团队探究了在大模型推理时进行计算优化的方法，根据给定的prompt难度，动态地分配测试时（Test-Time）的计算资源。结果发现这种方法在一些情况下比单纯扩展模型参数更经济有效。换句话说...……更多

2024-09-12 09:58:00模型,参数,模型,训练,测试,时计

美股异动丨金山云一度涨超13% 小米首个推理大模型MiMo开

...收涨14.2%，报7.4港元。消息面上，今天，小米开源首个为推理(Reasoning)而生的大模型“Xiaomi MiMo”，联动预训练到后训练，全面提升推理能力。在数学推理(AIME 24-25)和代码竞赛(LiveCodeBench v5)公开测评集上，MiMo仅用7B的参数规模，...……更多

2025-04-30 23:41:00金山,异动,小米,推理,模型,金山

李飞飞团队“50美元”复现DeepSeek R1？真相是…

...0美元的云计算费用，成功训练出了一个名为s1的人工智能推理模型。该模型在数学和编码能力测试中的表现，据称与OpenAI的O1和DeepSeek的R1等尖端推理模型不相上下。这一消息无疑在AI界投下了一颗重磅炸弹，真相究竟如何？《科...……更多

2025-02-07 06:25:00真相,团队,模型,通义,训练,基座

第一个100%开源的MoE大模型，7B的参数，1B的推理成本

...语言模型 (LM) 在各种任务上取得了重大进展，但在训练和推理方面，性能和成本之间仍然需要权衡。对于许多学者和开发人员来说，高性能的 LM 是无法访问的，因为它们的构建和部署成本过高。改善成本 - 性能的一种方法是使...……更多

2024-09-06 10:01:00推理,模型,成本,参数,模型,训练

多模态LLM视觉推理能力堪忧，浙大领衔用GPT-4合成数据构

新智元报道编辑：乔杨【新智元导读】LLM的数学推理能力缺陷得到了很多研究的关注，但最近浙大、中科院等机构的学者们提出，先进模型在视觉推理方面同样不足。为此他们提出了一种多模态的视觉推理基准，并设计了一种...……更多

2024-08-08 16:23:00模态,领衔,基准,推理,视觉,能力

首个o1复现开源RL框架OpenR来了，UCL、上交等高校联

...湖大学工学院助理教授（研究）杨林易。o1 作为 OpenAI 在推理领域的最新模型，大幅度提升了 GPT-4o 在推理任务上的表现，甚至超过了平均人类水平。o1 背后的技术到底是什么？OpenAI 技术报告中所强调的强化学习和推断阶段的 Sca...……更多

2024-10-15 09:56:00框架,团队,联合,模型,过程,步骤

微软推出14b参数“最先进”小型语言模型

...语言模型的最新成员，官方表示其展示了微软继续探索SLM边界的可能性。官方表示，得益于多方面的技术进步，包括采用高质量的合成数据集、精心挑选的高质量有机数据，以及训练后的创新，Phi-4在数学推理方面超越了同类和...……更多

2024-12-14 00:08:00微软,最先,模型,参数,语言,模型

DeepSeek第二炸：开源首个用于 MoE 模型训练通信库

...码库DeepEP王炸。据了解，DeepEP是首个用于 MoE 模型训练和推理的开源 EP 通信库，它填补了MoE模型专用通信工具的空白，为大规模分布式AI训练和实时推理场景提供了更高效的底层支持。在这里，简单介绍一下DeepEP的技术性能特点...……更多

2025-02-25 11:33:00模型,训练,通信,推理,通信,场景

阿里云重磅升级全栈AI体系，一文看懂云栖大会技术发布

...7连发，在模型智能水平、Agent工具调用和Coding能力、深度推理、多模态等方面实现多项突破。2025云栖大会，阿里云CTO周靖人发布多项重磅技术更新在大语言模型中，阿里通义旗舰模型Qwen3-Max全新亮相，性能超过GPT5、Claude Opus 4等...……更多

2025-09-24 13:30:00一文,阿里,重磅,体系,大会,升级

清华团队提出大模型“密度定律”；足球领域首个视觉语言基础模型

...交视觉-语言-动作建模框架RevThink：使用逆向思维增强 LLM 推理想要第一时间获取每日最新大模型热门论文？点击阅读原文，查看「2024必读大模型论文」合集，以及申请加入「大模型技术分享群」。SwiftEdit：50 倍速文本引导图像...……更多

2024-12-10 09:53:00模型,语言基础,清华,定律,密度,团队

只需这4步华为ModelEngine支持DeepSeek全

快科技2月6日消息，华为ModelEngine是大模型训练、推理和应用开发的AI平台，提供从数据预处理到模型训练、优化及部署的一站式服务。华为官方表示，ModelEngine现已全面支持DeepSeek系列模型R1&V3 671B以及蒸馏系列模型，开发者...……更多

2025-02-06 17:43:00华为,全系列,只需,支持,模型,推理

AI新时代揭幕！会“思考解题逻辑”的OpenAI推理大模型登

...凌晨1时许，AI时代迎来崭新的起点——能够进行通用复杂推理的大模型终于走到台前。OpenAI在官网发布公告称，开始向全体订阅用户开始推送OpenAI o1预览模型——也就是此前被广泛期待的“草莓”大模型。OpenAI表示，对于复杂推...……更多

2024-09-13 13:34:00新时代,推理,逻辑,模型,模型,问题

国产大模型首发中文逻辑推理，「天工大模型4.0」o1版来了

...去，如此自信的原因可能在于最近人们让大模型学会了「推理」的方法。就在 9 月份，OpenAI 正式公开前所未有的复杂推理大模型 o1，这是一个重大突破，新模型既具有通用的能力，也可以解决比此前的科学、代码和数学模型能...……更多

2024-11-28 10:00:00模型,逻辑推理,中文,推理,逻辑,国产

模型即服务，卓世科技MaaS平台 2.0 正式上线

...。本次新上线了包括：模型训练新基座，支持模型训练、推理、量化、评测等功能。卓世科技MaaS平台是一款基于知识增强大模型的一站式行业模型训练开发平台。面向开发者和企业提供从基础算力服务、数据服务、模型训练服...……更多

2024-08-07 09:45:00模型,服务,平台,科技,模型,数据

鄂维南院士领衔新作：大模型不止有RAG、参数存储，还有第3种

...凡的性能而获得了前所未有的关注。然而， LLM 的训练和推理成本高昂，人们一直在尝试通过各种优化方法来降低成本。本文来自上海算法创新研究院、北京大学等机构的研究者受人类大脑记忆层次结构的启发，他们通过为 LLM ...……更多

2024-07-11 09:33:00维南,领衔,院士,新作,模型,存储

腾讯大模型混元Turbo：御气升昺云，梓桐金鼎开

...模型，腾讯混元Turbo性能有显著提升，训练效率提升108%，推理效率提升 100%，推理成本降低 50%，解码速度提升 20%，效果在多个基准测试上对标GPT-4o。最新第三方测评在国内位居第一。腾讯混云大模型已经落地腾讯700+个业务场景...……更多

2024-09-14 14:04:00金鼎,腾讯,模型,腾讯,模型,推理

讯飞星火X1全面升级领跑教育、医疗、司法行业应用

本文转自：人民网-安徽频道4月20日，科大讯飞深度推理大模型——讯飞星火X1迎来全新升级。作为当前业界唯一基于全国产算力训练的深度推理大模型，升级后的星火X1在数学、代码、逻辑推理、文本生成、语言理解、知识问答...……更多

2025-04-22 16:50:00讯飞,星火,行业应用,司法,升级,医疗

DeepSeek V3小版本大升级：推理、前端开发加强这些

...级带来的性能提升却相当显著，特别是在前端开发、数学推理和上下文理解方面有了明显进步。据了解，新版V3模型借鉴DeepSeek-R1模型训练过程中所使用的强化学习技术，大幅提高了在推理类任务上的表现水平，在数学、代码类...……更多

2025-03-25 23:03:00前端,推理,能力,版本,升级,开发

阿里通义实验室黄斐：开源进入千问时代，即将发布的推理模型会更

...开源模型系列，将“很快”放出基于最新模型Qwen2.5-Max的推理模型。2月21日，全球开发者大会（GDC）在上海开幕，在阿里云魔搭社区主办的论坛上，据阿里巴巴通义实验室科学家黄斐介绍，到目前为止，整个通义千问（Qwen）系列...……更多

2025-02-21 23:22:00通义,阿里,推理,实验室,模型,实验

“深思熟虑”的 AI：OpenAI 提出全新安全对齐方法

...方法直接教授模型安全规范，并训练它们在生成响应之前推理这些准则进，将安全原则融入推理过程中。整个过程分为两个阶段，第一阶段，监督微调（SFT）训练模型参考并推理安全规范，使用从基础模型生成的数据集。第二...……更多

2024-12-26 09:29:00深思,全新,方法,安全,模型,安全

o1金牌团队揭秘AI超越人类惊人时刻！22分完整版视频全公开

...共有8点：1 强化学习加持的o1，比人类更善于发现新的CoT推理步骤2 自我批评的涌现，是o1最强有力的时刻3 让o1「超时」前完成回答，然后突然有了「啊哈」时刻 4 scaling参数规模的挑战，以及继续沿着强化学习算法进步之路5 许...……更多

2024-09-23 09:50:00整版,金牌,团队,人类,时刻,视频

$免训练大模型知识编辑，吸收新数据更高效｜EMNLP\'24$

免训练大模型知识编辑，吸收新数据更高效｜EMNLP'24

...的连续提示学习新方法，可以提高知识终身学习的编辑和推理效率。模型编辑旨在纠正大语言模型中过时或错误的知识，同时不需要昂贵的代价进行再训练。终身模型编辑是满足LLM持续编辑要求的最具挑战性的任务。之前的工作...……更多

2024-10-30 09:57:00模型,训练,知识,数据,模型,知识

杨元庆谈AI PC：支持运行个人大模型

...能设备或家庭服务器上，使用存储在本地的个人数据进行推理和学习的人工智能基础模型。它不仅可以像公共大模型那样通过对话提供答案、创作内容，而且更精准、贴切，甚至根据用户的思维模式预测任务，并自主寻找解决方...……更多

2023-11-22 19:04:00杨元庆,模型,运行,支持,个人,模型

对着3个中国AI大模型，两个美国科技界大佬深聊了半小时

...前AI行业快速发展，竞争也越来越激烈，特别是各种高级推理模型之间的竞争。过去一段时间，中国科技公司陆续发布了3款自研的AI模型，分别是DeepSeek（深度求索）的Deepseek R1、阿里巴巴的Marco-1以及香港中文大学与商汤科技的...……更多

2024-12-04 09:48:00大佬,科技界,美国,模型,两个,小时

page 3/1334 首页上一页 1 234 5 6 7 8 下一页末页

更多关于科技的资讯：

具身智能站上“C位” 上城将加快建设CID：打造“创新之心”

当城市核心区的物理空间增长几近饱和，未来的竞争力新高地何在？12月5日，一场发布会以别开生面的“数字气味”体验开场，为上城区加快建设中央创新区（CID）的战略发布

2025-12-07 07:21:00

恒真自主研发“真空发热玻璃”上市

日前，山西转型综改示范区入区企业山西恒真真空玻璃科技有限公司自主研发的新产品——“真空发热玻璃”上市。这一产品将高效真空玻璃技术与新型半导体制热技术深度融合

2025-12-07 07:32:00

坚定信心勇挑大梁·产业新亮点丨河北特色产业集群共享智造故事

生产设备共享给清河羊绒带来什么——河北特色产业集群共享智造故事（四）纱线在电脑横机上来回穿梭、电商平台的提示音此起彼伏……随着冬季来临

2025-12-06 08:04:00

厦门移动智慧康养产品亮相首届海峡两岸（厦门）银发博览会

市民现场体验移动随心屏（闺蜜机）的AI舌象问诊功能。厦门网讯（文/厦门日报记者许晓婷王玉婷通讯员陈奕珣图/厦门移动提供）伸出舌头拍一拍

2025-12-06 08:26:00

AI微短剧站上新风口多家厦企“跑步入场”

厦门网讯（厦门日报记者林露虹）刷到一部微短剧，不知不觉被剧情吸引，回过神来看介绍，发现竟是AI参与制作的。类似经历

2025-12-06 08:26:00

从“手搓”到“智造” 厦门跑步机“跑”向全球

厦门网讯（厦门日报记者詹文林健华）在位于同安工业集中区的生产车间里，一节一节钢板正传送上激光切割台，自动切割、打孔

2025-12-06 08:26:00

共建共享破局资源瓶颈：临沂联通与电信合作以5G RedCap

鲁网12月5日讯近日，临沂联通与临沂电信深度践行国家共建共享战略，成功完成全省首个基于电信800M频段的5G RedCap技术承载联通物联网专网业务的商用落地

2025-12-06 13:44:00

“面向文博场景的智能伴游导览系统研发及示范应用”启动会召开

中国青年报客户端讯（中青报·中青网记者张均斌）近日，“中央引导地方”专项科技赋能文化方向立项课题——“面向文博场景的智能伴游导览系统研发及示范应用”启动会

2025-12-06 15:25:00

2025教室节能照明标杆盘点四大品牌绿色护眼解决方案解析

在“双碳”目标引领下，校园节能改造成为教育领域绿色发展的重要方向。据住建部统计，商业建筑能耗中照明系统占比高达35%，学校作为人员密集

2025-12-06 16:09:00

海尔智慧家电亮相迪拜

11月26日至28日，中东地区极具影响力的家电电子展在迪拜世贸中心举办。展会中，海尔智家针对当地高温、多尘等特点，集中展示了洗衣机

2025-12-06 16:10:00

豆包手机助手惊艳亮相 AI手机概念引关注

12月1日，豆包手机助手技术预览版正式发布，首发搭载于中兴Nubia工程样机。豆包手机助手是以豆包APP为基础，与手机厂商在操作系统层面合作开发的AI助手软件

2025-12-06 17:41:00

文化中国行|全场听觉无死角吉林省音乐厅声学揭秘

历经修缮重生的丰乐剧场，以“吉林省音乐厅”之名即将绽放春城。这座历史建筑，从伪满时期影剧院到音乐剧场的跨越，背后藏着一套极致考究的声学设计方案

2025-12-06 18:41:00

伊贝格：让机床行业不再为“头”烦恼

“关键核心技术与高端装备对外依存度高”一直是制约制造业升级的瓶颈。五轴联动铣头作为五轴机床的核心功能部件，过去很长一段时间被欧洲部分知名厂商垄断

2025-12-06 22:07:00

山东重工潍柴集团2026年商务大会圆满召开

鲁网12月6日讯12月6日，以“乘势向上聚力向新”为主题的山东重工潍柴集团2026年商务大会在潍坊举行。山东重工集团党委书记

2025-12-06 22:43:00

兴业数金打造创新模式，助力“跨境理财通”服务升级

近日，兴业数金上线投产跨境人民币理财项目，建立基于手机银行APP的“跨境理财通”线上功能专区，助力本行成为第二家实现“跨境理财通”业务全线上办理的内地商业银行

2025-12-06 16:08:00

头条订阅服务