• 我的订阅
  • 科技

大模型推理与训练的边界之争

类别:科技 发布时间:2024-11-07 20:18:00 来源:鲁网

随着大模型的发展日新月异,其推理和训练的边界问题也引起了广泛讨论。近日,清程极智CEO汤雄超在一场行业活动中明确表示,尽管外界有声音认为OpenAI发布的o1模型模糊了推理和训练的界限,但从技术角度来看,这两个阶段的划分并未发生本质改变。

汤雄超指出,o1模型之所以展现出强大的“推理”能力,实际上是由于其背后巨大的计算量消耗。这种计算量的增加,使得模型能够获得更高质量的回答。然而,这并不意味着推理和训练的边界正在变得模糊,而是推理阶段的计算需求正在增加。

清程极智认为,推理和训练需要差异化的系统设计和实现方式。随着推理计算量的增长,未来不仅在训练阶段,推理阶段也将需要集群规模的算力系统支持,而非目前的小规模单卡或单机算力系统。这预示着行业可能需要不同配置的算力集群,以分别应对训练和推理业务的需求。

清程极智的技术背景基于高性能计算,尤其在超算方面拥有深厚的技术积累。在超大规模国产集群进行大模型训练方面,清程极智有着经典的案例。例如,清程极智的大模型训练系统“八卦炉”能够扩展到10万台服务器的超大规模集群,用于训练百万亿参数量的模型,这一成就在行业内具有里程碑意义。

除了在训练领域的卓越表现,清程极智也始终关注推理的重要性。其推理侧的技术和产品已经服务于多家大模型企业。清程极智的推理引擎软件“chitu”能够支持多种模型、不同芯片、提供多种接口形式,如OpenAI API(文本对话)/HTTP API(文生图),满足不同场景下的推理需求。

随着大模型在各行各业的广泛应用,推理和训练的算力需求都在不断增长。清程极智预测,未来行业将需要更多专业化、定制化的算力解决方案,以适应不断变化的业务需求。这种趋势要求AI Infra厂商不仅要在技术上保持领先,还要在服务上提供更高的灵活性和定制化能力。

综上所述,尽管大模型的推理和训练在计算需求上呈现出一定的融合趋势,但从技术实现和系统设计的角度来看,两者的边界依然清晰。随着技术的不断进步和市场需求的日益增长,期待,未来AI Infra将为大模型的发展提供更加坚实的支撑。

声明:发布该信息旨在为读者提供更多新闻资讯。所涉内容不构成投资、消费建议,仅供读者参考。

责任编辑:吴英兰

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-11-07 23:45:12

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

专注于推理的OpenAI“草莓”模型两周内发布?是人工智能下一重大突破
...数亿用户。 “草莓”模型为何重要?或重新定义AI能力边界,为GPT 5提供高质量合成训练数据OpenAI首席执行官奥特曼(Sam Altman)曾在今年早些时候表示
2024-09-11 09:55:00
...模型,仍需强化学习技术。刘知远说,就推动大模型能力边界而言,“知识蒸馏”技术意义不大,未来仍需探索大规模强化学习技术,以持续激发大模型在思考、反思、探索等方面的能力。AI模型
2025-02-27 05:08:00
谷歌推出第五代AI芯片:训练和运行AI模型的速度提高5倍
...够轻松扩展他们的人工智能模型,超越单个TPU集群的物理边界。也就是说,单个大型人工智能工作负载可以跨越多个物理TPU集群,扩展到数万个芯片,并且经济高效。“在云GPU和云TP
2023-08-31 10:04:00
上海AI实验室版o1已上线!数学题、Leetcode全拿下,还会玩24点
...出了解决思路,而且还在编写完代码之后针对整体逻辑和边界条件进行了检查:把这个代码直接提交了一下,结果真的通过了。 国外网友也都称赞不已:中国公司的进步速度太快了!在推理中自
2024-11-29 09:27:00
...关系;通过概念延伸、条件明确、后果探讨、实务应用、边界探讨五大追问维度,构建了包含150万条数据的多轮对话数据集;通过多轮对话内容借助DeepSeek-R1构建得到深度思考数
2025-03-19 08:25:00
重磅!OpenAI o1模型还没有实现真正的逻辑推理能力
...诊断皮肤癌可以达到专业医生水平,但都是在需求明确、边界清晰、逻辑简单的前提下,也就是概念模型较为简单的前提下,人工智能可以利用算力优势超过人类,但当时人工智能在复杂逻辑推理、
2024-09-18 15:01:00
...天文学、生命科学、材料科学等多个领域,成为打破学科边界、激发创新思维的“科研伙伴”。地学领域模型GeoGPT-VL支持图像描述总结、图像信息提取、地理空间推理、地学分析推理四
2025-12-19 08:54:00
商汤升级“日日新5.0”大模型,对标GPT-4Turbo
...能力的KRE(知识-推理-执行)三层架构,突破大模型能力边界。”徐立表示,“日日新SenseNova 5.0”(以下简称“日日新5
2024-04-24 09:32:00
补齐Transformer规划短板又不放弃快速思考,Dualformer双重优势
...算法。create 子句将节点(由后续坐标表示)添加到搜索边界中,close 子句将节点添加到该闭集。每个子句(create 或 close)后面都跟着 token x
2024-10-17 09:47:00
更多关于科技的资讯:
佛山正视利怎么样?品牌硬实力与全民口碑给出答案
在全民视力健康危机日益严峻的当下,我国视力问题人群已高达 7.8 亿,儿童青少年总体近视率近 60%,其中高中生近视率更是飙升至 87
2026-01-12 21:03:00
安建大教师最新研究成果破解心脏病变分割难题
大皖新闻讯 近日,安徽建筑大学陈永麟老师联合南京林业大学、安徽大学及武汉市第三人民医院的专家们,创新性地提出了DAF-Mamba的高性能分割模型
2026-01-12 22:22:00
迪士尼限定快闪登陆马来西亚,杰森娱乐“生态出海”加速市场开拓
2026年1月9日,马来西亚吉隆坡核心商业地标LaLaport BBCC的ACG BASE正式上演为期一个多月的大型主题快闪——这是杰森娱乐集团携手迪士尼以及国际知名插画师Mik
2026-01-12 17:34:00
网络视听向何处发展?第五届网络视听创新发展论坛举办
中国青年报客户端讯(中青报·中青网记者余冰玥沈杰群)近日,“新大众文艺·新视听使命”第五届网络视听创新发展论坛在北京举办
2026-01-12 17:34:00
打开手机,刷几条短视频,准能看见一条养生秘籍;翻几页朋友圈,也少不了长辈们转发的健康预警。从“吃木薯助眠”到“冷冻馒头会长黄曲霉毒素”
2026-01-12 18:18:00
中国消费者报北京讯(记者聂国春)1月8日,北京智源人工智能研究院发布年度报告《2026十大AI技术趋势》。报告指出,人工智能的演进核心正发生关键转移
2026-01-12 19:35:00
近日,连江县古石村夜景照明设计作品“古石微光”接连斩获2025年美国LIT照明设计奖与2025美国IDA国际设计大奖两项国际大奖。
2026-01-12 19:40:00
中国消费者报报道(记者桑雪骐)2025年12月,市场监管总局公布5起民生领域私域直播虚假宣传典型案例。1月7日,市场监管总局发布《直播电商监督管理办法》《网络交易平台规则监督管理办法》
2026-01-12 19:05:00
三联家电41周年店庆:多重补贴叠加,引领春节消费热潮
鲁网1月12日讯新春佳节渐近,山东家电零售行业的领军品牌——三联家电迎来41周年庆典。1月16日至25日期间,一场盛大的店庆活动即将热烈展开
2026-01-12 17:01:00
随着全球环保法规日趋严苛,挥发性有机物(VOCs)治理成为工业企业合规运营的关键环节,沸石转轮吸附浓缩技术因高效节能的特性
2026-01-12 16:56:00
创意碰撞青春,立达 Z 世代・名流广告创意赛圆满落幕
当 Z 世代的脑洞与广告艺术激情碰撞,当校企协同的育人理念落地生根,一场聚焦创意与热爱的行业盛事圆满收官。12月29日
2026-01-12 16:58:00
天津市优秀基层理论宣讲员风采展示党的二十届四中全会强调,要前瞻布局未来产业,推动包括具身智能在内的六个领域成为新的经济增长点
2026-01-12 14:15:00
刘伟涛博士出任时代天使首席医学官 进一步强化全球医学体系建设
时代天使首席医学官刘伟涛博士近日,时代天使宣布,原赛德阳光口腔集团首席医疗官刘伟涛博士已正式加入时代天使,担任首席医学官兼高级副总裁
2026-01-12 16:08:00
近日,2026年湖北省科技创新大会以“乘势而上、聚势提升”为基调,再次锚定打造具有全国影响力的科技创新高地的核心目标,明确将科技创新与产业创新深度融合作为发展新质生产力的关键路径
2026-01-12 16:41:00
创新内容与读者的连接方式,磨铁图书亮相2026北京图书订货会
在2026北京图书订货会上,磨铁携大量优质内容产品亮相。围绕“磨铁,总有新的____”这一slogan,磨铁通过沉浸式的展陈设计
2026-01-12 11:27:00