• 我的订阅
  • 科技

大模型推理与训练的边界之争

类别:科技 发布时间:2024-11-07 20:18:00 来源:鲁网

随着大模型的发展日新月异,其推理和训练的边界问题也引起了广泛讨论。近日,清程极智CEO汤雄超在一场行业活动中明确表示,尽管外界有声音认为OpenAI发布的o1模型模糊了推理和训练的界限,但从技术角度来看,这两个阶段的划分并未发生本质改变。

汤雄超指出,o1模型之所以展现出强大的“推理”能力,实际上是由于其背后巨大的计算量消耗。这种计算量的增加,使得模型能够获得更高质量的回答。然而,这并不意味着推理和训练的边界正在变得模糊,而是推理阶段的计算需求正在增加。

清程极智认为,推理和训练需要差异化的系统设计和实现方式。随着推理计算量的增长,未来不仅在训练阶段,推理阶段也将需要集群规模的算力系统支持,而非目前的小规模单卡或单机算力系统。这预示着行业可能需要不同配置的算力集群,以分别应对训练和推理业务的需求。

清程极智的技术背景基于高性能计算,尤其在超算方面拥有深厚的技术积累。在超大规模国产集群进行大模型训练方面,清程极智有着经典的案例。例如,清程极智的大模型训练系统“八卦炉”能够扩展到10万台服务器的超大规模集群,用于训练百万亿参数量的模型,这一成就在行业内具有里程碑意义。

除了在训练领域的卓越表现,清程极智也始终关注推理的重要性。其推理侧的技术和产品已经服务于多家大模型企业。清程极智的推理引擎软件“chitu”能够支持多种模型、不同芯片、提供多种接口形式,如OpenAI API(文本对话)/HTTP API(文生图),满足不同场景下的推理需求。

随着大模型在各行各业的广泛应用,推理和训练的算力需求都在不断增长。清程极智预测,未来行业将需要更多专业化、定制化的算力解决方案,以适应不断变化的业务需求。这种趋势要求AI Infra厂商不仅要在技术上保持领先,还要在服务上提供更高的灵活性和定制化能力。

综上所述,尽管大模型的推理和训练在计算需求上呈现出一定的融合趋势,但从技术实现和系统设计的角度来看,两者的边界依然清晰。随着技术的不断进步和市场需求的日益增长,期待,未来AI Infra将为大模型的发展提供更加坚实的支撑。

声明:发布该信息旨在为读者提供更多新闻资讯。所涉内容不构成投资、消费建议,仅供读者参考。

责任编辑:吴英兰

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-11-07 23:45:12

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

专注于推理的OpenAI“草莓”模型两周内发布?是人工智能下一重大突破
...数亿用户。 “草莓”模型为何重要?或重新定义AI能力边界,为GPT 5提供高质量合成训练数据OpenAI首席执行官奥特曼(Sam Altman)曾在今年早些时候表示
2024-09-11 09:55:00
...模型,仍需强化学习技术。刘知远说,就推动大模型能力边界而言,“知识蒸馏”技术意义不大,未来仍需探索大规模强化学习技术,以持续激发大模型在思考、反思、探索等方面的能力。AI模型
2025-02-27 05:08:00
谷歌推出第五代AI芯片:训练和运行AI模型的速度提高5倍
...够轻松扩展他们的人工智能模型,超越单个TPU集群的物理边界。也就是说,单个大型人工智能工作负载可以跨越多个物理TPU集群,扩展到数万个芯片,并且经济高效。“在云GPU和云TP
2023-08-31 10:04:00
上海AI实验室版o1已上线!数学题、Leetcode全拿下,还会玩24点
...出了解决思路,而且还在编写完代码之后针对整体逻辑和边界条件进行了检查:把这个代码直接提交了一下,结果真的通过了。 国外网友也都称赞不已:中国公司的进步速度太快了!在推理中自
2024-11-29 09:27:00
...关系;通过概念延伸、条件明确、后果探讨、实务应用、边界探讨五大追问维度,构建了包含150万条数据的多轮对话数据集;通过多轮对话内容借助DeepSeek-R1构建得到深度思考数
2025-03-19 08:25:00
重磅!OpenAI o1模型还没有实现真正的逻辑推理能力
...诊断皮肤癌可以达到专业医生水平,但都是在需求明确、边界清晰、逻辑简单的前提下,也就是概念模型较为简单的前提下,人工智能可以利用算力优势超过人类,但当时人工智能在复杂逻辑推理、
2024-09-18 15:01:00
...天文学、生命科学、材料科学等多个领域,成为打破学科边界、激发创新思维的“科研伙伴”。地学领域模型GeoGPT-VL支持图像描述总结、图像信息提取、地理空间推理、地学分析推理四
2025-12-19 08:54:00
商汤升级“日日新5.0”大模型,对标GPT-4Turbo
...能力的KRE(知识-推理-执行)三层架构,突破大模型能力边界。”徐立表示,“日日新SenseNova 5.0”(以下简称“日日新5
2024-04-24 09:32:00
补齐Transformer规划短板又不放弃快速思考,Dualformer双重优势
...算法。create 子句将节点(由后续坐标表示)添加到搜索边界中,close 子句将节点添加到该闭集。每个子句(create 或 close)后面都跟着 token x
2024-10-17 09:47:00
更多关于科技的资讯:
电科蓝天(688818)出身于中电科十八所,主要从事电能源产品及系统的研发、生产、销售及服务,拥有发电、储能、控制和系统集成全套解决方案
2026-03-20 22:58:00
山东省宠物零食信息填报系统正式上线
鲁网3月20日讯(记者 刘恭臣)记者从3月17日在临沂举办的2026第三届宠物食品安全大会上获悉,山东省宠物零食信息填报系统正式完成二次实操培训
2026-03-20 20:21:00
案鉴|借“赠送皮肤”引流牟利,法院:构成不正当竞争
福州新闻网3月20日讯(记者 阮冠达)近年来,网络游戏已成为数字消费的重要领域。大部分游戏允许玩家购买道具或皮肤,既提升了用户体验
2026-03-20 22:08:00
OK镜、离焦镜、阿托品……近视防控怎么选?福州普瑞眼科专家解答
近年来,儿童青少年近视呈现低龄化、高度数化趋势,OK镜、离焦镜、低浓度阿托品等防控手段层出不穷,不少家长陷入“选择困难”
2026-03-20 22:09:00
河北新闻网讯(孙岳新)近日,教育部职业教育与成人教育司正式公布第二批“十四五”职业教育国家规划教材遴选结果,河北能源职业技术学院经济与管理系主编的《网络营销》《Excel在会计和财务管理中的应用》两部教材成功入选
2026-03-20 21:52:00
济南市中同日启动两大“山东首店” 以精准落子服务区域高质量发展
鲁网3月20日讯3月20日,同派、竞盛酒店×腾讯电竞两大山东首店在济南市市中区望岳・智谷园区同步启动。该项目由济南市中财金集团携手新世界同派酒店管理集团
2026-03-20 17:19:00
海河观察丨这个产业津城齐聚,大干一场的还有谁? 扫码阅读手机版
雅迪:“我500万辆!”台铃:“我600万辆!”爱玛:“我新总部竣工!”小刀:“我三年翻番!”提起电动车,你会想起哪个品牌
2026-03-20 19:44:00
“精卫”电力量子产品发布 量子科技加速“跑进”电力赛道
大皖新闻讯 为了拓展量子科技应用,2026年,安徽实施量子信息“千家场景”行动,推动超过300个应用场景落地,而电力则是重要的应用领域
2026-03-20 17:51:00
近日,央视新闻曝光的电商平台“超长预售”乱象,精准戳中了无数消费者的痛点。例如,北京张女士下单一款预售包,苦等近一个月
2026-03-20 17:05:00
靖江人工智能OPC项目取得新突破
3月18日,星凝互动 AI漫剧产业项目签约落户靖江,这是靖江市在人工智能时代加速布局新赛道、因地制宜发展新质生产力的生动实践
2026-03-20 15:38:00
崇川三券齐发,重磅赋能AI产业高质量发展
为全力构建“百数、百模、百景”AI生态,助力南通打造长三角AI创新高地,南通市崇川区重磅推出“三券一场景一保障”人工智能专项扶持政策
2026-03-20 15:42:00
左涛纵谈山东苏宁“齐鲁策”:以AI重塑“智慧生活”,让服务下沉“焕新齐鲁”
鲁网3月20日讯“智慧生活服务商”——苏宁易购2026升级的全新战略,既有对AI趋势的敏锐捕捉,也是对线下体验价值的投入重视
2026-03-20 16:07:00
【摘要】在生成式AI驱动非遗创新发展的过程中,河南已开展一系列卓有成效的实践探索,但仍面临数据壁垒、融合局限、造血困境及协作鸿沟等诸多挑战
2026-03-20 16:38:00
鲁网3月20日讯当前,我国经济持续回升向好,稳中有进,恢复和扩大消费仍是稳定经济增长的关键抓手,更是惠及民生、激活市场活力的重要路径
2026-03-20 16:43:00
AWE2026圆满收官 鸿蒙智选720智能空气净化器铂境ProMax惊艳出圈
2026年中国家电及消费电子博览会(AWE)已圆满落幕,本届展会上华为全场景智慧生活展台凭借成熟的生态联动实力备受行业关注
2026-03-20 16:45:00