边界,推理,模型,训练,推理,模型头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

黄仁勋：我从不在乎市场份额、英伟达唯一目标是创造新市场

...英伟达，老黄还讨论了AGI的智能扩展、机器学习的加速、推理与训练的重要性……虽然时长感人（近1个半小时），但一大波网友已经看完并交起了作业（开始卷了是吧！）网友：学起来！学起来！黄仁勋：未来推理的增长将远...……更多

2024-10-23 12:25:00新市,英伟,份额,从不,目标,市场

京东率先推出行业首批高商业可用数字人，618向商家免费开放

...技人工智能业务部总裁何晓冬表示。技术拓宽大模型能力边界，支持企业构建专有模型在AI进化的“马拉松”中，京东大模型展现出了独特的产业基因。目前，京东已经具备全尺寸大模型，满足多样化的产业需求：3B和10B模型可...……更多

2025-05-22 18:51:00京东,商家,开放,数字,商业,行业

百度云升级模型服务，百度版GPTs即日开放 | 最前线

...应用，希望开发者基于咱们大模型去做AI原生应用，它的边界在哪里？能不能介绍一下百度目前跑得最好的AI原生应用有哪些？侯震宇：所谓的边界，我们对于百度来说有自己的To C业务，大家都很熟悉，我们的搜索、信息流，...……更多

2023-12-21 14:31:00模型,升级,开放,服务,模型,应用

全球高校同台PK，齐鲁工业大学斩获一等奖！

...合国际科学前沿问题，以赛促学，拓展学生学识与能力的边界。本次决赛要求各入围队伍在3000瓦功耗约束下设计安装小型超算集群，运行优化国际通行基准测试HPL&HPCG、大模型推理优化、渗流数值模拟、火星大气模拟、新型...……更多

2024-04-22 17:51:00齐鲁,一等奖,工业大学,工业,全球,大学

刚刚，Llama 3.2 来了！支持图像推理，还有可在手机上

... Meta 对 Llama 模型来了一波大更新：不仅推出了支持图像推理任务的新一代 Llama 11B 和 90B 模型，还发布了可在边缘和移动设备上的运行的轻量级模型 Llama 3.2 1B 和 3B。不仅如此，Meta 还正式发布了 Llama Stack Distribution，其可……更多

2024-09-27 13:42:00推理,可在,图像,运行,版本,支持

面壁智能发布2B模型：适配主流手机，推理成本仅为GPT-4的

...在MMLU（多任务语言理解）、Knowledge（知识）、Reasoning（推理）、Comprehension（理解）等关键指标上均超越了Meta Llama 2的13B模型。这一个故事，在2024年2月1日的发布会上，也被AI模型层公司面壁智能的CEO李大海不断提起。对标Mistral..……更多

2024-02-03 16:03:00适配,推理,模型,主流,成本,智能

小模型越级挑战14倍参数大模型，谷歌Test-Time端新的

...发布的新模型草莓所用的方法。研究团队探究了在大模型推理时进行计算优化的方法，根据给定的prompt难度，动态地分配测试时（Test-Time）的计算资源。结果发现这种方法在一些情况下比单纯扩展模型参数更经济有效。换句话说...……更多

2024-09-12 09:58:00模型,参数,模型,训练,测试,时计

美股异动丨金山云一度涨超13% 小米首个推理大模型MiMo开

...收涨14.2%，报7.4港元。消息面上，今天，小米开源首个为推理(Reasoning)而生的大模型“Xiaomi MiMo”，联动预训练到后训练，全面提升推理能力。在数学推理(AIME 24-25)和代码竞赛(LiveCodeBench v5)公开测评集上，MiMo仅用7B的参数规模，...……更多

2025-04-30 23:41:00金山,异动,小米,推理,模型,金山

李飞飞团队“50美元”复现DeepSeek R1？真相是…

...0美元的云计算费用，成功训练出了一个名为s1的人工智能推理模型。该模型在数学和编码能力测试中的表现，据称与OpenAI的O1和DeepSeek的R1等尖端推理模型不相上下。这一消息无疑在AI界投下了一颗重磅炸弹，真相究竟如何？《科...……更多

2025-02-07 06:25:00真相,团队,模型,通义,训练,基座

第一个100%开源的MoE大模型，7B的参数，1B的推理成本

...语言模型 (LM) 在各种任务上取得了重大进展，但在训练和推理方面，性能和成本之间仍然需要权衡。对于许多学者和开发人员来说，高性能的 LM 是无法访问的，因为它们的构建和部署成本过高。改善成本 - 性能的一种方法是使...……更多

2024-09-06 10:01:00推理,模型,成本,参数,模型,训练

多模态LLM视觉推理能力堪忧，浙大领衔用GPT-4合成数据构

新智元报道编辑：乔杨【新智元导读】LLM的数学推理能力缺陷得到了很多研究的关注，但最近浙大、中科院等机构的学者们提出，先进模型在视觉推理方面同样不足。为此他们提出了一种多模态的视觉推理基准，并设计了一种...……更多

2024-08-08 16:23:00模态,领衔,基准,推理,视觉,能力

首个o1复现开源RL框架OpenR来了，UCL、上交等高校联

...湖大学工学院助理教授（研究）杨林易。o1 作为 OpenAI 在推理领域的最新模型，大幅度提升了 GPT-4o 在推理任务上的表现，甚至超过了平均人类水平。o1 背后的技术到底是什么？OpenAI 技术报告中所强调的强化学习和推断阶段的 Sca...……更多

2024-10-15 09:56:00框架,团队,联合,模型,过程,步骤

微软推出14b参数“最先进”小型语言模型

...语言模型的最新成员，官方表示其展示了微软继续探索SLM边界的可能性。官方表示，得益于多方面的技术进步，包括采用高质量的合成数据集、精心挑选的高质量有机数据，以及训练后的创新，Phi-4在数学推理方面超越了同类和...……更多

2024-12-14 00:08:00微软,最先,模型,参数,语言,模型

DeepSeek第二炸：开源首个用于 MoE 模型训练通信库

...码库DeepEP王炸。据了解，DeepEP是首个用于 MoE 模型训练和推理的开源 EP 通信库，它填补了MoE模型专用通信工具的空白，为大规模分布式AI训练和实时推理场景提供了更高效的底层支持。在这里，简单介绍一下DeepEP的技术性能特点...……更多

2025-02-25 11:33:00模型,训练,通信,推理,通信,场景

阿里云重磅升级全栈AI体系，一文看懂云栖大会技术发布

...7连发，在模型智能水平、Agent工具调用和Coding能力、深度推理、多模态等方面实现多项突破。2025云栖大会，阿里云CTO周靖人发布多项重磅技术更新在大语言模型中，阿里通义旗舰模型Qwen3-Max全新亮相，性能超过GPT5、Claude Opus 4等...……更多

2025-09-24 13:30:00一文,阿里,重磅,体系,大会,升级

清华团队提出大模型“密度定律”；足球领域首个视觉语言基础模型

...交视觉-语言-动作建模框架RevThink：使用逆向思维增强 LLM 推理想要第一时间获取每日最新大模型热门论文？点击阅读原文，查看「2024必读大模型论文」合集，以及申请加入「大模型技术分享群」。SwiftEdit：50 倍速文本引导图像...……更多

2024-12-10 09:53:00模型,语言基础,清华,定律,密度,团队

只需这4步华为ModelEngine支持DeepSeek全

快科技2月6日消息，华为ModelEngine是大模型训练、推理和应用开发的AI平台，提供从数据预处理到模型训练、优化及部署的一站式服务。华为官方表示，ModelEngine现已全面支持DeepSeek系列模型R1&V3 671B以及蒸馏系列模型，开发者...……更多

2025-02-06 17:43:00华为,全系列,只需,支持,模型,推理

AI新时代揭幕！会“思考解题逻辑”的OpenAI推理大模型登

...凌晨1时许，AI时代迎来崭新的起点——能够进行通用复杂推理的大模型终于走到台前。OpenAI在官网发布公告称，开始向全体订阅用户开始推送OpenAI o1预览模型——也就是此前被广泛期待的“草莓”大模型。OpenAI表示，对于复杂推...……更多

2024-09-13 13:34:00新时代,推理,逻辑,模型,模型,问题

国产大模型首发中文逻辑推理，「天工大模型4.0」o1版来了

...去，如此自信的原因可能在于最近人们让大模型学会了「推理」的方法。就在 9 月份，OpenAI 正式公开前所未有的复杂推理大模型 o1，这是一个重大突破，新模型既具有通用的能力，也可以解决比此前的科学、代码和数学模型能...……更多

2024-11-28 10:00:00模型,逻辑推理,中文,推理,逻辑,国产

模型即服务，卓世科技MaaS平台 2.0 正式上线

...。本次新上线了包括：模型训练新基座，支持模型训练、推理、量化、评测等功能。卓世科技MaaS平台是一款基于知识增强大模型的一站式行业模型训练开发平台。面向开发者和企业提供从基础算力服务、数据服务、模型训练服...……更多

2024-08-07 09:45:00模型,服务,平台,科技,模型,数据

鄂维南院士领衔新作：大模型不止有RAG、参数存储，还有第3种

...凡的性能而获得了前所未有的关注。然而， LLM 的训练和推理成本高昂，人们一直在尝试通过各种优化方法来降低成本。本文来自上海算法创新研究院、北京大学等机构的研究者受人类大脑记忆层次结构的启发，他们通过为 LLM ...……更多

2024-07-11 09:33:00维南,领衔,院士,新作,模型,存储

腾讯大模型混元Turbo：御气升昺云，梓桐金鼎开

...模型，腾讯混元Turbo性能有显著提升，训练效率提升108%，推理效率提升 100%，推理成本降低 50%，解码速度提升 20%，效果在多个基准测试上对标GPT-4o。最新第三方测评在国内位居第一。腾讯混云大模型已经落地腾讯700+个业务场景...……更多

2024-09-14 14:04:00金鼎,腾讯,模型,腾讯,模型,推理

讯飞星火X1全面升级领跑教育、医疗、司法行业应用

本文转自：人民网-安徽频道4月20日，科大讯飞深度推理大模型——讯飞星火X1迎来全新升级。作为当前业界唯一基于全国产算力训练的深度推理大模型，升级后的星火X1在数学、代码、逻辑推理、文本生成、语言理解、知识问答...……更多

2025-04-22 16:50:00讯飞,星火,行业应用,司法,升级,医疗

DeepSeek V3小版本大升级：推理、前端开发加强这些

...级带来的性能提升却相当显著，特别是在前端开发、数学推理和上下文理解方面有了明显进步。据了解，新版V3模型借鉴DeepSeek-R1模型训练过程中所使用的强化学习技术，大幅提高了在推理类任务上的表现水平，在数学、代码类...……更多

2025-03-25 23:03:00前端,推理,能力,版本,升级,开发

阿里通义实验室黄斐：开源进入千问时代，即将发布的推理模型会更

...开源模型系列，将“很快”放出基于最新模型Qwen2.5-Max的推理模型。2月21日，全球开发者大会（GDC）在上海开幕，在阿里云魔搭社区主办的论坛上，据阿里巴巴通义实验室科学家黄斐介绍，到目前为止，整个通义千问（Qwen）系列...……更多

2025-02-21 23:22:00通义,阿里,推理,实验室,模型,实验

“深思熟虑”的 AI：OpenAI 提出全新安全对齐方法

...方法直接教授模型安全规范，并训练它们在生成响应之前推理这些准则进，将安全原则融入推理过程中。整个过程分为两个阶段，第一阶段，监督微调（SFT）训练模型参考并推理安全规范，使用从基础模型生成的数据集。第二...……更多

2024-12-26 09:29:00深思,全新,方法,安全,模型,安全

o1金牌团队揭秘AI超越人类惊人时刻！22分完整版视频全公开

...共有8点：1 强化学习加持的o1，比人类更善于发现新的CoT推理步骤2 自我批评的涌现，是o1最强有力的时刻3 让o1「超时」前完成回答，然后突然有了「啊哈」时刻 4 scaling参数规模的挑战，以及继续沿着强化学习算法进步之路5 许...……更多

2024-09-23 09:50:00整版,金牌,团队,人类,时刻,视频

$免训练大模型知识编辑，吸收新数据更高效｜EMNLP\'24$

免训练大模型知识编辑，吸收新数据更高效｜EMNLP'24

...的连续提示学习新方法，可以提高知识终身学习的编辑和推理效率。模型编辑旨在纠正大语言模型中过时或错误的知识，同时不需要昂贵的代价进行再训练。终身模型编辑是满足LLM持续编辑要求的最具挑战性的任务。之前的工作...……更多

2024-10-30 09:57:00模型,训练,知识,数据,模型,知识

杨元庆谈AI PC：支持运行个人大模型

...能设备或家庭服务器上，使用存储在本地的个人数据进行推理和学习的人工智能基础模型。它不仅可以像公共大模型那样通过对话提供答案、创作内容，而且更精准、贴切，甚至根据用户的思维模式预测任务，并自主寻找解决方...……更多

2023-11-22 19:04:00杨元庆,模型,运行,支持,个人,模型

对着3个中国AI大模型，两个美国科技界大佬深聊了半小时

...前AI行业快速发展，竞争也越来越激烈，特别是各种高级推理模型之间的竞争。过去一段时间，中国科技公司陆续发布了3款自研的AI模型，分别是DeepSeek（深度求索）的Deepseek R1、阿里巴巴的Marco-1以及香港中文大学与商汤科技的...……更多

2024-12-04 09:48:00大佬,科技界,美国,模型,两个,小时

page 3/1334 首页上一页 1 234 5 6 7 8 下一页末页

更多关于科技的资讯：

辛集市公路桥梁养护启用无人机巡检

河北日报讯（张晓超、李娜）11月19日，辛集市教育北路高架桥上空，一架搭载高清摄像头与专业传感器的无人机缓缓升空，按照预设航线开展桥梁日常检测

2025-12-05 14:56:00

烟台南山学院斩获省部级科技奖荣誉

近日，2025年度中国纺织工业联合会科学技术奖励大会在北京人民大会堂隆重召开。烟台南山学院“针织经编一体成型3D智能织造关键技术及应用”项目斩获“技术发明奖二等奖”

2025-12-05 15:00:00

盐城盐都：“芯”智散热赋能科创驱动前行

江南时报讯以科创破局散热赛道，以匠心赋能产业升级。乘着聚焦“3+3”产业体系、培育新兴产业的发展浪潮，盐城市盐都区已在第三代半导体多个细分领域形成显著集聚优势

2025-12-05 15:07:00

中新建电力集团发电产业：智慧电厂新蓝图

近日，中新建电力集团天河热电分公司与上海电气集团举行了一场关键的技术交流会。会议聚焦于天河热电的智慧化升级，上海电气团队在会上系统性地展示了其先进的智慧电厂整体架构规划

2025-12-05 15:09:00

建行石家庄分行全省系统“人工智能＋”竞赛获佳绩

日前，建行河北省分行2025年“人工智能＋”劳动技能竞赛顺利结束。全省共有111支队伍选送90项作品参加初赛，经过严格的初审选拔

2025-12-05 15:09:00

全国首台套！助力煤矸石全量高值转化

12月1日，由中能建装配式建筑产业发展有限公司投资建设运营的山西大同千万吨级煤矸石综合利用新技术示范项目陶粒中试线成功建成投运

2025-12-05 15:10:00

如何“反内卷”？54.5%职场人将“优化薪酬激励机制”列为首

什么是“好工作”？工作有哪些特质会让员工有“好”感受？日前，智联招聘通过问卷调研的方式，对平台用户展开调研，回收3525份有效样本

2025-12-05 15:26:00

国航举办“国航+”生态主题发布会

海外网北京12月5日电（记者严冰）12月5日，中国国际航空股份有限公司（以下简称“国航”）在北京举办“云端无界凤启耀星河——‘国航+’生态主题发布会”

2025-12-05 15:33:00

乐购房山│实惠购—荟品仓城市奥莱北京首店盛大开业！

12月5日，国内仓储式品牌特卖开创者荟品仓，在房山区瑞来广场盛大开业，带来北京首家城市奥莱门店。近1万平方米超大空间、300+全球知名品牌及1-3折极致折扣

2025-12-05 15:55:00

易生支付“智慧分账”赋能安心鲜生驱动社区零售全国布局

在社区零售数字化转型加速深化的背景下，易生支付与“社区新零售”新兴企业陕西安心鲜生正式达成合作。依托易生支付的深厚技术积淀与成熟系统能力

2025-12-05 16:09:00

ED用药怎么选？金钢鸟领衔西地那非口崩片品牌阵营，购买渠道全

第91届全国药交会上，金鸿药业金钢鸟枸橼酸西地那非口崩片的亮相，让“枸橼酸西地那非品牌选择”“哪里有售”等问题成为行业热议焦点

2025-12-05 16:09:00

苏州黄埭镇推动“产学研”深度融合

江南时报讯日前，苏州冠鸿智能装备有限公司与中南大学计算机学院“跨界”合作，联合启动轮式双臂机器人研发项目，致力于推动创新成果向现实生产力加速转化

2025-12-05 16:13:00

近邻碰碰：以 “邻里经济”打造智慧社区消费新生态 —— 专访

鲁网12月4日讯“远亲不如近邻”，这句家喻户晓的俗语，如今被小门神传媒科技集团董事长付信中赋予了全新的商业内涵。由其集团研发推出的近邻碰碰 AI 智慧惠民设备

2025-12-05 16:47:00

东湖评论：“巨型吊牌”现象值得全行业深思

今年双十一，A4纸大小的巨型吊牌成为女装电商的“标配”。这种硬材质、高存在感的“防白嫖神器”，在社交平台引发热议，同时也揭露了线上服装行业的信任危机

2025-12-05 17:00:00

龙岩联通“5G+AI+无人机”项目荣获第八届“绽放杯”5G应

东南网龙岩12月5日讯（通讯员曹可煊）近日，第八届“绽放杯”5G应用征集大赛全国赛圆满落幕。龙岩联通为华电连城风电打造的“智驭低空——构建‘5G+AI+无人机’绿电智能运维新范式”项目

2025-12-05 17:16:00

头条订阅服务