• 我的订阅
  • 科技

卷模型技术,更要卷工程实现

类别:科技 发布时间:2023-08-10 10:00:00 来源:CSDN

GPT、Llama 等大模型技术的屡屡突破,引爆了全球 AI 产业的新一轮震动,国内百模涌现,所有最顶尖的科研人才,都聚焦如何提升模型参数量与模型效果上。

人工智能领域专家贾扬清曾提及模型的保鲜期(shelf life)概念,他认为从2012年AlexNet发布至今,在每个性能强劲的大模型发布后,只要六个月到一年左右时间,就会出现效果接近的模型。

随着更多优质的通用大模型逐渐开源,模型间的技术壁垒有望进一步消除,如何降低 AI 基础设施和模型实施的成本将成为企业、团队和个人开发者关切的话题。

这要求企业对人工智能技术有全面的认识,并对自身的基础设施和研发流程做出调整、优化,甚至重构。AI 基础设施的构建中,需要关注算力集群、数据存储、模型训练、推理部署等整条链路。在 AI 基础设施的链路中,既可以选择利用现有的云服务,也可以选择开源性质的基础设施产品进行私有化改造。

在高性能算力严重稀缺的市场环境下,一个稳健、高效的 AI 研发底座,可以充分提升团队作战效率。除了 AI 科研能力外,让研发团队具备卓越的工程能力,成了 AI 时代里打赢胜仗、弯道超车的关键。

2023年8月12日(本周六)下午,将在北京朝阳区皇家格兰云天大酒店举行程序员大会 NPCon:AI 模型技术与应用峰会:全链路搭建AI研发底座,将于大家共同探讨:不同规模阶段的企业,该如何选择适合自身的AI基础设施建设方案、高效完善AI的全链路研发流程。

完整议程

卷模型技术,更要卷工程实现

分享嘉宾与内容简介

主题演讲

《大模型涌现,如何部署训练架构与算力芯片》

知乎科技领域答主@陈巍谈芯,人工智能/AI芯片专家,千芯科技董事长。国际计算机学会(ACM)、中国计算机学会(CCF)专业会员,中美发明专利约70+项,著有《GPT-4大模型硬核解读》《GPT-4核心技术分析报告》《GPGPU芯片设计》

演讲内容:

随着GPT等大模型技:术的高速成长与普及,LLM/MLM的开源资源、部署训练架构、算力成本成为大模型应用落地和企业盈亏ROI的关键分水岭,重要性不低于模型精度。本主题将分享GPT等大模型的开源Foundation Model与Finetune、开源应用平台、部署与训练架构、以及GPU和DSA芯片对部署综合成本的重要影响,场景涵盖云计算和端侧私有化部署,对互联网与MaaS企业的产品业务设计与大模型部署有关键参考意义。

主题演讲

LLM 应用技术栈与Agent全景解析

超过 11 年的互联网从业经验,对产品设计、敏捷项目管 理、DevOps、学习型组织文化与 Web 应用开发有深刻理解。近年在企业服务、工具软件领域的 SaaS 的产品、运营和技术管理上有丰富经验。

演讲内容:

将概括目前大模型应用技术栈全景,梳理应用技术栈已实现的能力与要解决的问题、以及 Dify 等AI应用工具平台在 大模型生态中的位置及能力构建,并对当下的大模型技术发展及应用发展的趋势进行展望。

主题演讲

美团视觉GPU推理服务部署架构优化实践

美团视觉智能部,担任软件开发工程师职位,主要负责服务平台开发、视觉模型部署方案设计和GPU服务性能优化等方面的工作。

同时,我也非常关注人工智能领域的前沿进展和应用,积极拥抱新技术带来的变化。在工作之余,我热爱骑行,非常欢迎和大家一起交流学习、探索自然享受骑行乐趣。

演讲内容:

美团视觉致力于将视觉AI技术应用于本地生活服务的各个场景。但随着在线推理服务使用的GPU资源不断增加,GPU利用率低的问题也日益凸显,导致大量计算资源浪费。经过实验分析,我们发现GPU利用率低下的推理服务存在一个共性问题:模型结构中CPU算子和GPU算子相互耦合,严重影响运行效率。为此,我们提出了一种通用高效的部署架构,通过模型结构拆分和微服务化,解决这种常见的性能瓶颈问题。目前,该解决方案已在美团视觉核心服务上成功应用,优化后服务GPU利用率接近100%,服务性能成倍提升。

主题演讲

AI大模型算力系统分析

Dr.Zhu 就职于浪潮信息人工智能与高性能应用软件部,负责大模型、AIGC等前沿AI算法研发和AI应用落地工作。

演讲内容:

结合浪潮信息源大模型的工作实践和智算中心算力平台建设经验,分享当前AI基础大模型的技术趋势、算力需求和计算特征以及当前业界面临的主要技术挑战等内容。

闪电演讲

让你的 AI 应用快速落地

全栈开发者,知名开源项目 ViewDesign(iView) 创始人。

著有《Vue.js 实战》、《Vue.js 组件精讲》,组织过多次 Vue.js 活动。

演讲内容:

InsCode(inscode.net) 是一个一站式的应用开发服务平台,在 AI 的加持下,解决从开发-部署-运维-运营的全链路开发工作。

《开谈》圆桌

AI 时代的研发新范式

与开发者能力演进

毕业于北京航空航天大学,从一线软件及算法工程师至创业企业CTO,进入资本市场,多年来一直专注在Data&AI Infra方向,为多家知名创业公司提供咨询服务。

《开谈》圆桌

AI 时代的研发新范式

与开发者能力演进

南开大学、明尼苏达大学联合培养博士,诺亚方舟实验室推荐搜索项目经理,其领导的研究团队聚焦推荐系统、信息检索、因果推断技术的前沿探索,并将预研成果在公司超过30个产品/场景落地(2013年以来),发表论文超过50篇,申请专利超过40项,并在ACM SIGIR、SIGKDD等学术组织担任高级程序委员/程序委员/审稿人等职务,译著《奇点临近》中文版。

《开谈》圆桌

AI 时代的研发新范式

与开发者能力演进

毕业于北京航空航天大学计算机学院,毕业后一直从事NLP算法工作。目前为智谱AI的CodeGeeX团队算法专家,专业领域为大模型训练及应用。

《开谈》圆桌

AI 时代的研发新范式

与开发者能力演进

清华大学计算机系学士、硕士;有超过10年的新技术研发和创新管理经验。曾任四达时代传媒集团研究院首席架构师,负责设计和建设覆盖非洲十余个国家的三网融合视频系统;曾任职宝尊电商技术总监,管理70人团队,负责多项产品的研发和商业化;连续创业者;拥有数十项国家发明专利。返回搜狐,查看更多

责任编辑:

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-08-10 12:45:40

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

...院长潘青华,解读生成式AI技术发展现状及挑战,展望大模型规模化应用前景。深耕人工智能赛道二十余载,科大讯飞积极拥抱“智能涌现”的大模型时代,依托源头技术创新和成建制的行业顶尖
2024-01-29 09:22:00
...,2024中关村论坛系列活动——中关村开源生态论坛暨大模型智能应用技术大会在刚建成的中关村论坛新会址成功举办。作为中关村论坛永久会址建成后的首场活动,本次大会不仅聚集了大模型
2024-01-28 21:33:00
...将科学原理和工程方法应用于气象观测、数据分析和预测模型的开发。这一领域的发展可以追溯到19世纪末的气象观测仪器的发明和气象数据的收集。随着电子技术的进步,气象雷达、卫星遥感等
2023-09-03 15:48:00
...日报记者 林闻) 10日,我国首个船舶与海洋工程行业大模型——“文鳐”在厦门正式发布。该模型由厦门理工学院、众数(厦门)信息科技有限公司(下称“众数科技”)、福建省船舶工业集
2024-11-13 19:24:00
奔向大模型时代,第一期掘金城市沙龙「 AIGC 技术探索与应用创新」成功举办
...来,将至未至”的 AIGC 时代。AIGC 的底层逻辑:以大模型为“道”,衍生万物左起:杨亦诚 王顺 郑勤锴 陈家泽ChatGPT 爆火,引发中国互联网科技圈对多模态大模型的
2023-04-21 19:00:00
深度学习在AI教育中的应用及其关键技术探究
...标准化和归一化以及特征选择和降维技术。最后,介绍了模型构建和训练的关键步骤,包括深度学习模型的选择和设计、模型初始化和参数调整、批量梯度下降和优化算法以及学习率调整和模型评估
2023-09-12 11:30:00
抢抓AI“风口”的人
本文转自:济南日报算法工程师,一年创造出“大模型”的多种应用场景——抢抓AI“风口”的人宗云兵(右)与同事讨论技术方案。 小组研讨现场。4月25日下午,在济南金现代公司,刚刚从
2024-04-26 11:39:00
山海启航,云知声迈向AGI新征程
...据和应用场景的深厚积累,快速拥有了业内领先的通用大模型和行业大模型,又实现了大模型的规模化商业落地,成为业内为数不多的通用大模型和大规模商业化落地并举的公司。这是云知声全新的
2024-02-04 11:00:00
赛意信息张成康:大模型时代下的企业数字化转型
...兼CEO张成康亮相中欧供应链创新论坛大湾区峰会,以《大模型时代下的企业数字化转型》的主题演讲,深入浅出地阐述了AI对于企业创新与数字化转型的重要性,结合赛意信息在AI领域的创
2024-04-17 16:30:00
更多关于科技的资讯:
为建设“人工智能第一城”注入新动能杭州日报讯 杭州正加快构建场景驱动的AI产业基金,为人工智能产业发展注入全新动力。近日
2025-12-31 07:07:00
单个项目最高补助5000万元每日商报讯 用“意念”操控机械臂帮助瘫痪患者重获行动能力,以人脑为蓝本打造超低功耗芯片处理复杂任务……这些曾只存在于科幻作品中的场景
2025-12-31 07:37:00
日复一日,年复一年,新年的脚步已悄然叩响门环,无论你我是否整理好行囊。这一年的时光,有多少已从指缝间不经意溜走——被闹钟唤醒的清晨
2025-12-31 07:38:00
“现代化城市雄安探路”系列报道(五):数字孪生 创新之城
数字孪生 创新之城——“现代化城市雄安探路”系列报道⑤日前拍摄的雄安城市计算中心。它是雄安数字城市建设的核心枢纽。 河北日报记者 刘光昱摄建筑通过数字建模
2025-12-31 07:42:00
■王鑫摘要:在数字化转型的背景下,企业财务管理正面临由传统核算型向智能决策型的系统性变革。本文从数字化发展的实际需求出发
2025-12-31 04:48:00
1元租机器人,线下开首店:人形机器人打响大众化“发令枪”
大皖新闻讯 2025年的最后两天,中国的人形机器人产业以两件标志性事件,为即将到来的2026年按下了商业化加速键。一边是擎天租以“1元闪租”的体验价格将可以“打太极”的人形机器人推向大众市场
2025-12-30 21:48:00
从\
鲁网12月30日讯12月30日,在济南召开的"永生之手叩响仿生机器人元年之门"主题峰会上,山东未来机器人技术有限公司首次提出将人类生命划分为"碳基阶段"与"硅基阶段"的颠覆性理论框架
2025-12-30 22:13:00
贵州艺森源集团:从手工敲打到智能轰鸣 书写酒包装产业升级答卷
多彩贵州网讯 近日,贵州艺森源集团有限公司生产车间内,智能设备高效运转,自动化生产线有序作业,一派繁忙景象。历经十年深耕
2025-12-30 22:38:00
浪潮智慧文旅“智享商旅 聚力同行”2025浪潮商旅服务日成功举办
鲁网12月30日讯12月25日,由山东浪潮智慧文旅产业发展有限公司主办、山东浪潮智慧空间技术服务有限公司承办的“智享商旅·聚力同行——2025浪潮商旅服务日”在浪潮科技园圆满落幕
2025-12-30 17:23:00
潮新闻讯 浙商,是商业期刊的常客。2025年,他们的名字却接连登上《细胞》(Cell)《自然》(Nature)《科学》(Science)等学术期刊的作者栏
2025-12-30 17:52:00
扎根毕节十年,年产能超7500万只,出口覆盖欧非亚——贵州贵航新能源科技有限公司,已成为推动区域新能源产业链发展的“关键一环”
2025-12-30 18:35:00
肯悦咖啡苹果冰雕点亮冰城 代言人白敬亭助阵亮灯迎新春
2025年12月29日,肯悦咖啡在哈尔滨中央大街举办了一场别开生面的“红苹果心愿季”冰雕点灯仪式。肯悦咖啡的巨型红色咖啡杯造型冰雕搭配“水晶”苹果
2025-12-30 18:50:00
博士创新站典型案例|保定市鑫诺电科软件开发有限公司博士创新站:校企协同创新赋民生
当前供水行业智能化转型加速推进,保定市鑫诺电科软件开发有限公司作为本地企业,在技术层面面临自主开发的智能客服系统缺乏适配技术
2025-12-30 19:36:00
京东京喜自营2025年成交额增长10倍 5大产业带订单量破亿
2025年即将结束,回看这一年,外贸逆袭、市场反内卷、AI全面爆发,用户消费需求回归理性,带动品质消费。今日,京东旗下特价购物品牌京喜自营披露了这一年的成绩单——2025年实现成交额10倍增长
2025-12-30 19:48:00
事关以旧换新!河南公开征集
大河网讯 为深入推进2026年消费品以旧换新政策实施,河南省商务厅日前正式发布《河南省2026年消费品以旧换新家电及数码智能产品参与品牌厂家征集公告》
2025-12-30 19:55:00