边界,推理,模型,训练,推理,模型头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

黄仁勋：我从不在乎市场份额、英伟达唯一目标是创造新市场

...英伟达，老黄还讨论了AGI的智能扩展、机器学习的加速、推理与训练的重要性……虽然时长感人（近1个半小时），但一大波网友已经看完并交起了作业（开始卷了是吧！）网友：学起来！学起来！黄仁勋：未来推理的增长将远...……更多

2024-10-23 12:25:00新市,英伟,份额,从不,目标,市场

京东率先推出行业首批高商业可用数字人，618向商家免费开放

...技人工智能业务部总裁何晓冬表示。技术拓宽大模型能力边界，支持企业构建专有模型在AI进化的“马拉松”中，京东大模型展现出了独特的产业基因。目前，京东已经具备全尺寸大模型，满足多样化的产业需求：3B和10B模型可...……更多

2025-05-22 18:51:00京东,商家,开放,数字,商业,行业

百度云升级模型服务，百度版GPTs即日开放 | 最前线

...应用，希望开发者基于咱们大模型去做AI原生应用，它的边界在哪里？能不能介绍一下百度目前跑得最好的AI原生应用有哪些？侯震宇：所谓的边界，我们对于百度来说有自己的To C业务，大家都很熟悉，我们的搜索、信息流，...……更多

2023-12-21 14:31:00模型,升级,开放,服务,模型,应用

全球高校同台PK，齐鲁工业大学斩获一等奖！

...合国际科学前沿问题，以赛促学，拓展学生学识与能力的边界。本次决赛要求各入围队伍在3000瓦功耗约束下设计安装小型超算集群，运行优化国际通行基准测试HPL&HPCG、大模型推理优化、渗流数值模拟、火星大气模拟、新型...……更多

2024-04-22 17:51:00齐鲁,一等奖,工业大学,工业,全球,大学

刚刚，Llama 3.2 来了！支持图像推理，还有可在手机上

... Meta 对 Llama 模型来了一波大更新：不仅推出了支持图像推理任务的新一代 Llama 11B 和 90B 模型，还发布了可在边缘和移动设备上的运行的轻量级模型 Llama 3.2 1B 和 3B。不仅如此，Meta 还正式发布了 Llama Stack Distribution，其可……更多

2024-09-27 13:42:00推理,可在,图像,运行,版本,支持

面壁智能发布2B模型：适配主流手机，推理成本仅为GPT-4的

...在MMLU（多任务语言理解）、Knowledge（知识）、Reasoning（推理）、Comprehension（理解）等关键指标上均超越了Meta Llama 2的13B模型。这一个故事，在2024年2月1日的发布会上，也被AI模型层公司面壁智能的CEO李大海不断提起。对标Mistral..……更多

2024-02-03 16:03:00适配,推理,模型,主流,成本,智能

小模型越级挑战14倍参数大模型，谷歌Test-Time端新的

...发布的新模型草莓所用的方法。研究团队探究了在大模型推理时进行计算优化的方法，根据给定的prompt难度，动态地分配测试时（Test-Time）的计算资源。结果发现这种方法在一些情况下比单纯扩展模型参数更经济有效。换句话说...……更多

2024-09-12 09:58:00模型,参数,模型,训练,测试,时计

美股异动丨金山云一度涨超13% 小米首个推理大模型MiMo开

...收涨14.2%，报7.4港元。消息面上，今天，小米开源首个为推理(Reasoning)而生的大模型“Xiaomi MiMo”，联动预训练到后训练，全面提升推理能力。在数学推理(AIME 24-25)和代码竞赛(LiveCodeBench v5)公开测评集上，MiMo仅用7B的参数规模，...……更多

2025-04-30 23:41:00金山,异动,小米,推理,模型,金山

李飞飞团队“50美元”复现DeepSeek R1？真相是…

...0美元的云计算费用，成功训练出了一个名为s1的人工智能推理模型。该模型在数学和编码能力测试中的表现，据称与OpenAI的O1和DeepSeek的R1等尖端推理模型不相上下。这一消息无疑在AI界投下了一颗重磅炸弹，真相究竟如何？《科...……更多

2025-02-07 06:25:00真相,团队,模型,通义,训练,基座

第一个100%开源的MoE大模型，7B的参数，1B的推理成本

...语言模型 (LM) 在各种任务上取得了重大进展，但在训练和推理方面，性能和成本之间仍然需要权衡。对于许多学者和开发人员来说，高性能的 LM 是无法访问的，因为它们的构建和部署成本过高。改善成本 - 性能的一种方法是使...……更多

2024-09-06 10:01:00推理,模型,成本,参数,模型,训练

多模态LLM视觉推理能力堪忧，浙大领衔用GPT-4合成数据构

新智元报道编辑：乔杨【新智元导读】LLM的数学推理能力缺陷得到了很多研究的关注，但最近浙大、中科院等机构的学者们提出，先进模型在视觉推理方面同样不足。为此他们提出了一种多模态的视觉推理基准，并设计了一种...……更多

2024-08-08 16:23:00模态,领衔,基准,推理,视觉,能力

首个o1复现开源RL框架OpenR来了，UCL、上交等高校联

...湖大学工学院助理教授（研究）杨林易。o1 作为 OpenAI 在推理领域的最新模型，大幅度提升了 GPT-4o 在推理任务上的表现，甚至超过了平均人类水平。o1 背后的技术到底是什么？OpenAI 技术报告中所强调的强化学习和推断阶段的 Sca...……更多

2024-10-15 09:56:00框架,团队,联合,模型,过程,步骤

微软推出14b参数“最先进”小型语言模型

...语言模型的最新成员，官方表示其展示了微软继续探索SLM边界的可能性。官方表示，得益于多方面的技术进步，包括采用高质量的合成数据集、精心挑选的高质量有机数据，以及训练后的创新，Phi-4在数学推理方面超越了同类和...……更多

2024-12-14 00:08:00微软,最先,模型,参数,语言,模型

DeepSeek第二炸：开源首个用于 MoE 模型训练通信库

...码库DeepEP王炸。据了解，DeepEP是首个用于 MoE 模型训练和推理的开源 EP 通信库，它填补了MoE模型专用通信工具的空白，为大规模分布式AI训练和实时推理场景提供了更高效的底层支持。在这里，简单介绍一下DeepEP的技术性能特点...……更多

2025-02-25 11:33:00模型,训练,通信,推理,通信,场景

阿里云重磅升级全栈AI体系，一文看懂云栖大会技术发布

...7连发，在模型智能水平、Agent工具调用和Coding能力、深度推理、多模态等方面实现多项突破。2025云栖大会，阿里云CTO周靖人发布多项重磅技术更新在大语言模型中，阿里通义旗舰模型Qwen3-Max全新亮相，性能超过GPT5、Claude Opus 4等...……更多

2025-09-24 13:30:00一文,阿里,重磅,体系,大会,升级

清华团队提出大模型“密度定律”；足球领域首个视觉语言基础模型

...交视觉-语言-动作建模框架RevThink：使用逆向思维增强 LLM 推理想要第一时间获取每日最新大模型热门论文？点击阅读原文，查看「2024必读大模型论文」合集，以及申请加入「大模型技术分享群」。SwiftEdit：50 倍速文本引导图像...……更多

2024-12-10 09:53:00模型,语言基础,清华,定律,密度,团队

只需这4步华为ModelEngine支持DeepSeek全

快科技2月6日消息，华为ModelEngine是大模型训练、推理和应用开发的AI平台，提供从数据预处理到模型训练、优化及部署的一站式服务。华为官方表示，ModelEngine现已全面支持DeepSeek系列模型R1&V3 671B以及蒸馏系列模型，开发者...……更多

2025-02-06 17:43:00华为,全系列,只需,支持,模型,推理

AI新时代揭幕！会“思考解题逻辑”的OpenAI推理大模型登

...凌晨1时许，AI时代迎来崭新的起点——能够进行通用复杂推理的大模型终于走到台前。OpenAI在官网发布公告称，开始向全体订阅用户开始推送OpenAI o1预览模型——也就是此前被广泛期待的“草莓”大模型。OpenAI表示，对于复杂推...……更多

2024-09-13 13:34:00新时代,推理,逻辑,模型,模型,问题

国产大模型首发中文逻辑推理，「天工大模型4.0」o1版来了

...去，如此自信的原因可能在于最近人们让大模型学会了「推理」的方法。就在 9 月份，OpenAI 正式公开前所未有的复杂推理大模型 o1，这是一个重大突破，新模型既具有通用的能力，也可以解决比此前的科学、代码和数学模型能...……更多

2024-11-28 10:00:00模型,逻辑推理,中文,推理,逻辑,国产

模型即服务，卓世科技MaaS平台 2.0 正式上线

...。本次新上线了包括：模型训练新基座，支持模型训练、推理、量化、评测等功能。卓世科技MaaS平台是一款基于知识增强大模型的一站式行业模型训练开发平台。面向开发者和企业提供从基础算力服务、数据服务、模型训练服...……更多

2024-08-07 09:45:00模型,服务,平台,科技,模型,数据

鄂维南院士领衔新作：大模型不止有RAG、参数存储，还有第3种

...凡的性能而获得了前所未有的关注。然而， LLM 的训练和推理成本高昂，人们一直在尝试通过各种优化方法来降低成本。本文来自上海算法创新研究院、北京大学等机构的研究者受人类大脑记忆层次结构的启发，他们通过为 LLM ...……更多

2024-07-11 09:33:00维南,领衔,院士,新作,模型,存储

腾讯大模型混元Turbo：御气升昺云，梓桐金鼎开

...模型，腾讯混元Turbo性能有显著提升，训练效率提升108%，推理效率提升 100%，推理成本降低 50%，解码速度提升 20%，效果在多个基准测试上对标GPT-4o。最新第三方测评在国内位居第一。腾讯混云大模型已经落地腾讯700+个业务场景...……更多

2024-09-14 14:04:00金鼎,腾讯,模型,腾讯,模型,推理

讯飞星火X1全面升级领跑教育、医疗、司法行业应用

本文转自：人民网-安徽频道4月20日，科大讯飞深度推理大模型——讯飞星火X1迎来全新升级。作为当前业界唯一基于全国产算力训练的深度推理大模型，升级后的星火X1在数学、代码、逻辑推理、文本生成、语言理解、知识问答...……更多

2025-04-22 16:50:00讯飞,星火,行业应用,司法,升级,医疗

DeepSeek V3小版本大升级：推理、前端开发加强这些

...级带来的性能提升却相当显著，特别是在前端开发、数学推理和上下文理解方面有了明显进步。据了解，新版V3模型借鉴DeepSeek-R1模型训练过程中所使用的强化学习技术，大幅提高了在推理类任务上的表现水平，在数学、代码类...……更多

2025-03-25 23:03:00前端,推理,能力,版本,升级,开发

阿里通义实验室黄斐：开源进入千问时代，即将发布的推理模型会更

...开源模型系列，将“很快”放出基于最新模型Qwen2.5-Max的推理模型。2月21日，全球开发者大会（GDC）在上海开幕，在阿里云魔搭社区主办的论坛上，据阿里巴巴通义实验室科学家黄斐介绍，到目前为止，整个通义千问（Qwen）系列...……更多

2025-02-21 23:22:00通义,阿里,推理,实验室,模型,实验

“深思熟虑”的 AI：OpenAI 提出全新安全对齐方法

...方法直接教授模型安全规范，并训练它们在生成响应之前推理这些准则进，将安全原则融入推理过程中。整个过程分为两个阶段，第一阶段，监督微调（SFT）训练模型参考并推理安全规范，使用从基础模型生成的数据集。第二...……更多

2024-12-26 09:29:00深思,全新,方法,安全,模型,安全

o1金牌团队揭秘AI超越人类惊人时刻！22分完整版视频全公开

...共有8点：1 强化学习加持的o1，比人类更善于发现新的CoT推理步骤2 自我批评的涌现，是o1最强有力的时刻3 让o1「超时」前完成回答，然后突然有了「啊哈」时刻 4 scaling参数规模的挑战，以及继续沿着强化学习算法进步之路5 许...……更多

2024-09-23 09:50:00整版,金牌,团队,人类,时刻,视频

$免训练大模型知识编辑，吸收新数据更高效｜EMNLP\'24$

免训练大模型知识编辑，吸收新数据更高效｜EMNLP'24

...的连续提示学习新方法，可以提高知识终身学习的编辑和推理效率。模型编辑旨在纠正大语言模型中过时或错误的知识，同时不需要昂贵的代价进行再训练。终身模型编辑是满足LLM持续编辑要求的最具挑战性的任务。之前的工作...……更多

2024-10-30 09:57:00模型,训练,知识,数据,模型,知识

杨元庆谈AI PC：支持运行个人大模型

...能设备或家庭服务器上，使用存储在本地的个人数据进行推理和学习的人工智能基础模型。它不仅可以像公共大模型那样通过对话提供答案、创作内容，而且更精准、贴切，甚至根据用户的思维模式预测任务，并自主寻找解决方...……更多

2023-11-22 19:04:00杨元庆,模型,运行,支持,个人,模型

对着3个中国AI大模型，两个美国科技界大佬深聊了半小时

...前AI行业快速发展，竞争也越来越激烈，特别是各种高级推理模型之间的竞争。过去一段时间，中国科技公司陆续发布了3款自研的AI模型，分别是DeepSeek（深度求索）的Deepseek R1、阿里巴巴的Marco-1以及香港中文大学与商汤科技的...……更多

2024-12-04 09:48:00大佬,科技界,美国,模型,两个,小时

page 3/1334 首页上一页 1 234 5 6 7 8 下一页末页

更多关于科技的资讯：

第十届中国设计智造大奖颁奖企业出题高校应题产业转化

12日晚，第十届中国设计智造大奖（DIA）颁奖盛典在中国美术学院良渚校区举行。第十届中国设计智造大奖征集自2024年12月12日启动

2025-12-13 07:36:00

全球首个甲骨文智能体“殷契行止” 上线最懂甲骨文的AI来了

小程序“了不起的甲骨文”，展示甲骨文“其”的不同字形。（本组图/小程序截图）甲骨拓本甲骨文“门”字甲骨文摹本甲骨文“马”字扫码看视频厦门网讯（厦门日报教育工作室首席专家佘峥通讯员王志鹏）你只需往电脑上传一张甲骨图片

2025-12-12 08:28:00

厦门临空经济片区场景创新平台推广暨供需对接活动举行

厦门网讯（厦门日报记者曾嫣艳通讯员曾焕滨）昨日，厦门临空经济片区场景创新平台推广暨供需对接与企业路演活动在翔安创新实验室举办

2025-12-12 08:28:00

从流程到质量：制片人为短剧工业化提供的“52集样本”

在短剧行业从 “流量争夺” 转向 “品质与流程双竞争” 的关键阶段，如何在有限周期内平衡效率、成本与成片质量，成为所有制作机构必须破解的难题

2025-12-12 08:29:00

剧想天开，造梦未来｜一场关于“儿童剧人物造型”的想象力实验

儿童戏剧，是投射在少年儿童心灵舞台上的第一束光。人物造型，作为这束光中最具象、最绚烂的色彩，不仅定义角色的灵魂，更深刻影响着儿童认知世界的方式与审美情感的塑造

2025-12-12 08:29:00

聚焦“中文+职业”融合：星禾星穗在世界中文大会展示校企合作新

在近期举办的2025世界中文大会上，教育企业星禾星穗多维度参与，展现了其在“中文+专业/职业”领域的系统思考与实践成果

2025-12-12 08:30:00

会打拳的机器人带你触摸未来走进国家“芯火”双创基地象屿园区

元启创新的人形机器人正在打拳。（元启创新供图）厦门网讯（厦门日报记者吴晓菁） “灵犀，灵犀，表演一段佛山醒狮。”昨日

2025-12-12 08:59:00

“数字丝路”赋能文化出海，中国数字文化扬帆全球新蓝海

2025年12月9日下午，一场聚焦数字文化出海与青年文化交流的“共建数字丝绸之路”研讨会在上海举行。中国传媒大学经济与管理学院教授方英

2025-12-12 09:00:00

AI眼镜将会取代手机？杭州企业从蛰伏到突起

AI 眼镜似乎成了AI具身智能行业中最“靓”的仔，无论是苹果、谷歌这些大厂，还是国内的科技巨头，纷纷下场。本周二，谷歌在The Android Show活动上宣布

2025-12-12 09:10:00

苏州人保财险：行业唯一反洗钱征文荣获三等奖

近日，中国人民银行苏州市分行反洗钱科公布2025年苏州市反洗钱征文比赛评审结果，苏州人保财险撰写的《破局与重构：保险公司在反洗钱履职的实践困境与创新路径研究》一文凭借深刻的问题剖析

2025-12-12 10:46:00

常熟人保财险：培训赋能促协作沟通提效助发展

为提升员工职场软实力，优化内部沟通效能，12月7日，常熟人保财险琴川学府组织开展了“赋能职场进阶，高情商沟通与协作”专题培训

2025-12-12 10:56:00

“大小字陷阱”丢了信任也失了格局-中国吉林网

长白时评评论员刘颂寒声称“下载App必得大额红包”，旁边又用小字解释“仅限新人或以实际情况为准”；宣称“全场5折”，又在大大的“5折”后面跟个极小的“起”字……在日常的消费中

2025-12-12 10:56:00

虎丘人保财险：精打细算降成本，按需采购提效益

在当前行业竞争加剧与市场环境多变的背景下，虎丘支公司持续推动降本增效工作，这既是应对挑战的必要举措，也是实现长期稳健经营的重要保障

2025-12-12 10:58:00

民生商品升级换代需要及时解疑释惑

劳利近日“水银体温计明年起禁产”的话题引发热议。根据国家药监局此前发布的通知，自2026年1月1日起全面禁止生产含汞体温计产品

2025-12-12 11:01:00

常熟人保财险组织开展“云赏秋韵·镜拍虞山”摄影交流分享活动

12月4日，常熟人保财险工会策划开展了“云赏秋韵·镜拍虞山”摄影交流分享活动，旨在通过摄影艺术提升员工的审美素养与创造力

2025-12-12 11:03:00

头条订阅服务