• 我的订阅
  • 科技

卷模型技术,更要卷工程实现

类别:科技 发布时间:2023-08-10 10:00:00 来源:CSDN

GPT、Llama 等大模型技术的屡屡突破,引爆了全球 AI 产业的新一轮震动,国内百模涌现,所有最顶尖的科研人才,都聚焦如何提升模型参数量与模型效果上。

人工智能领域专家贾扬清曾提及模型的保鲜期(shelf life)概念,他认为从2012年AlexNet发布至今,在每个性能强劲的大模型发布后,只要六个月到一年左右时间,就会出现效果接近的模型。

随着更多优质的通用大模型逐渐开源,模型间的技术壁垒有望进一步消除,如何降低 AI 基础设施和模型实施的成本将成为企业、团队和个人开发者关切的话题。

这要求企业对人工智能技术有全面的认识,并对自身的基础设施和研发流程做出调整、优化,甚至重构。AI 基础设施的构建中,需要关注算力集群、数据存储、模型训练、推理部署等整条链路。在 AI 基础设施的链路中,既可以选择利用现有的云服务,也可以选择开源性质的基础设施产品进行私有化改造。

在高性能算力严重稀缺的市场环境下,一个稳健、高效的 AI 研发底座,可以充分提升团队作战效率。除了 AI 科研能力外,让研发团队具备卓越的工程能力,成了 AI 时代里打赢胜仗、弯道超车的关键。

2023年8月12日(本周六)下午,将在北京朝阳区皇家格兰云天大酒店举行程序员大会 NPCon:AI 模型技术与应用峰会:全链路搭建AI研发底座,将于大家共同探讨:不同规模阶段的企业,该如何选择适合自身的AI基础设施建设方案、高效完善AI的全链路研发流程。

完整议程

卷模型技术,更要卷工程实现

分享嘉宾与内容简介

主题演讲

《大模型涌现,如何部署训练架构与算力芯片》

知乎科技领域答主@陈巍谈芯,人工智能/AI芯片专家,千芯科技董事长。国际计算机学会(ACM)、中国计算机学会(CCF)专业会员,中美发明专利约70+项,著有《GPT-4大模型硬核解读》《GPT-4核心技术分析报告》《GPGPU芯片设计》

演讲内容:

随着GPT等大模型技:术的高速成长与普及,LLM/MLM的开源资源、部署训练架构、算力成本成为大模型应用落地和企业盈亏ROI的关键分水岭,重要性不低于模型精度。本主题将分享GPT等大模型的开源Foundation Model与Finetune、开源应用平台、部署与训练架构、以及GPU和DSA芯片对部署综合成本的重要影响,场景涵盖云计算和端侧私有化部署,对互联网与MaaS企业的产品业务设计与大模型部署有关键参考意义。

主题演讲

LLM 应用技术栈与Agent全景解析

超过 11 年的互联网从业经验,对产品设计、敏捷项目管 理、DevOps、学习型组织文化与 Web 应用开发有深刻理解。近年在企业服务、工具软件领域的 SaaS 的产品、运营和技术管理上有丰富经验。

演讲内容:

将概括目前大模型应用技术栈全景,梳理应用技术栈已实现的能力与要解决的问题、以及 Dify 等AI应用工具平台在 大模型生态中的位置及能力构建,并对当下的大模型技术发展及应用发展的趋势进行展望。

主题演讲

美团视觉GPU推理服务部署架构优化实践

美团视觉智能部,担任软件开发工程师职位,主要负责服务平台开发、视觉模型部署方案设计和GPU服务性能优化等方面的工作。

同时,我也非常关注人工智能领域的前沿进展和应用,积极拥抱新技术带来的变化。在工作之余,我热爱骑行,非常欢迎和大家一起交流学习、探索自然享受骑行乐趣。

演讲内容:

美团视觉致力于将视觉AI技术应用于本地生活服务的各个场景。但随着在线推理服务使用的GPU资源不断增加,GPU利用率低的问题也日益凸显,导致大量计算资源浪费。经过实验分析,我们发现GPU利用率低下的推理服务存在一个共性问题:模型结构中CPU算子和GPU算子相互耦合,严重影响运行效率。为此,我们提出了一种通用高效的部署架构,通过模型结构拆分和微服务化,解决这种常见的性能瓶颈问题。目前,该解决方案已在美团视觉核心服务上成功应用,优化后服务GPU利用率接近100%,服务性能成倍提升。

主题演讲

AI大模型算力系统分析

Dr.Zhu 就职于浪潮信息人工智能与高性能应用软件部,负责大模型、AIGC等前沿AI算法研发和AI应用落地工作。

演讲内容:

结合浪潮信息源大模型的工作实践和智算中心算力平台建设经验,分享当前AI基础大模型的技术趋势、算力需求和计算特征以及当前业界面临的主要技术挑战等内容。

闪电演讲

让你的 AI 应用快速落地

全栈开发者,知名开源项目 ViewDesign(iView) 创始人。

著有《Vue.js 实战》、《Vue.js 组件精讲》,组织过多次 Vue.js 活动。

演讲内容:

InsCode(inscode.net) 是一个一站式的应用开发服务平台,在 AI 的加持下,解决从开发-部署-运维-运营的全链路开发工作。

《开谈》圆桌

AI 时代的研发新范式

与开发者能力演进

毕业于北京航空航天大学,从一线软件及算法工程师至创业企业CTO,进入资本市场,多年来一直专注在Data&AI Infra方向,为多家知名创业公司提供咨询服务。

《开谈》圆桌

AI 时代的研发新范式

与开发者能力演进

南开大学、明尼苏达大学联合培养博士,诺亚方舟实验室推荐搜索项目经理,其领导的研究团队聚焦推荐系统、信息检索、因果推断技术的前沿探索,并将预研成果在公司超过30个产品/场景落地(2013年以来),发表论文超过50篇,申请专利超过40项,并在ACM SIGIR、SIGKDD等学术组织担任高级程序委员/程序委员/审稿人等职务,译著《奇点临近》中文版。

《开谈》圆桌

AI 时代的研发新范式

与开发者能力演进

毕业于北京航空航天大学计算机学院,毕业后一直从事NLP算法工作。目前为智谱AI的CodeGeeX团队算法专家,专业领域为大模型训练及应用。

《开谈》圆桌

AI 时代的研发新范式

与开发者能力演进

清华大学计算机系学士、硕士;有超过10年的新技术研发和创新管理经验。曾任四达时代传媒集团研究院首席架构师,负责设计和建设覆盖非洲十余个国家的三网融合视频系统;曾任职宝尊电商技术总监,管理70人团队,负责多项产品的研发和商业化;连续创业者;拥有数十项国家发明专利。返回搜狐,查看更多

责任编辑:

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-08-10 12:45:40

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

...院长潘青华,解读生成式AI技术发展现状及挑战,展望大模型规模化应用前景。深耕人工智能赛道二十余载,科大讯飞积极拥抱“智能涌现”的大模型时代,依托源头技术创新和成建制的行业顶尖
2024-01-29 09:22:00
...,2024中关村论坛系列活动——中关村开源生态论坛暨大模型智能应用技术大会在刚建成的中关村论坛新会址成功举办。作为中关村论坛永久会址建成后的首场活动,本次大会不仅聚集了大模型
2024-01-28 21:33:00
...将科学原理和工程方法应用于气象观测、数据分析和预测模型的开发。这一领域的发展可以追溯到19世纪末的气象观测仪器的发明和气象数据的收集。随着电子技术的进步,气象雷达、卫星遥感等
2023-09-03 15:48:00
...日报记者 林闻) 10日,我国首个船舶与海洋工程行业大模型——“文鳐”在厦门正式发布。该模型由厦门理工学院、众数(厦门)信息科技有限公司(下称“众数科技”)、福建省船舶工业集
2024-11-13 19:24:00
奔向大模型时代,第一期掘金城市沙龙「 AIGC 技术探索与应用创新」成功举办
...来,将至未至”的 AIGC 时代。AIGC 的底层逻辑:以大模型为“道”,衍生万物左起:杨亦诚 王顺 郑勤锴 陈家泽ChatGPT 爆火,引发中国互联网科技圈对多模态大模型的
2023-04-21 19:00:00
深度学习在AI教育中的应用及其关键技术探究
...标准化和归一化以及特征选择和降维技术。最后,介绍了模型构建和训练的关键步骤,包括深度学习模型的选择和设计、模型初始化和参数调整、批量梯度下降和优化算法以及学习率调整和模型评估
2023-09-12 11:30:00
抢抓AI“风口”的人
本文转自:济南日报算法工程师,一年创造出“大模型”的多种应用场景——抢抓AI“风口”的人宗云兵(右)与同事讨论技术方案。 小组研讨现场。4月25日下午,在济南金现代公司,刚刚从
2024-04-26 11:39:00
山海启航,云知声迈向AGI新征程
...据和应用场景的深厚积累,快速拥有了业内领先的通用大模型和行业大模型,又实现了大模型的规模化商业落地,成为业内为数不多的通用大模型和大规模商业化落地并举的公司。这是云知声全新的
2024-02-04 11:00:00
vivo发布自研大模型,为用户和开发者带来诸多惊喜
...发者大会于10月10日在广东深圳正式召开,vivo发布自研大模型——全新蓝心大模型矩阵,为用户和开发者带来诸多惊喜。在同日举办的人工智能会场上,vivoAI团队分享了在AI领
2024-10-14 01:53:00
更多关于科技的资讯:
【2025数博会】记者探数博|机器人“咖啡师”上岗
在2025中国国际大数据产业博览会现场,一台智能咖啡机器人成为许多观众科技之旅的起点。只需简单几步,这位“咖啡师”就能制作出一杯手工现磨咖啡
2025-08-30 05:29:00
近日,在省通信管理局精心筹划下,国家超算太原中心、中国移动山西公司智算中心携手接入北京市算力互联互通平台,标志着山西在落实国家“东数西算”战略
2025-08-30 06:46:00
胶东金秋家装节大牌联动920启动仪式在青岛成功举办
青岛,2025年8月29日——今日下午,“胶东金秋家装节 大牌联动920启动仪式”在青岛市市北区居然之家店负一层中庭隆重举行
2025-08-30 07:23:00
【红色导师·思想汇报60】以青春之我,奔赴人工智能浪潮下的时代之约
思想汇报:“人工智能是引领新一轮科技革命和产业变革的战略性技术。”今年暑假,我作为华中农业大学经济管理学院“数智商途”暑期社会实践团队的队长
2025-08-29 14:52:00
临沂首届“何为精工”高端私宅精工论坛启幕,精工专委会同步成立
8月27日至28日,临沂首届“何为精工”高端私宅精工论坛在居然之家北城店盛大启幕。论坛由临沂室内设计师协会主办,汇聚建筑
2025-08-29 14:52:00
从“一瓶酒”到“一头牛”:海普数智为传统产业装上“数据引擎”
在氤氲的酱酒香里,一粒粒红缨子高粱正被赋予数字身份,经历着从农田到餐桌的全程溯源;在繁忙的灌装生产线上,一个个智能瓶盖不再只是容器
2025-08-29 14:55:00
央牧乳业:构建全域渠道生态,引领羊乳产业升级新纪元
央牧乳业以“真羊乳,选央牧”为品牌核心,打造中国羊乳产业渠道建设标杆。目前已完成全国5000+龙头商超系统战略布局(含大润发
2025-08-29 14:59:00
鲁网8月29日讯2025年8月,知名学者王立胜等人所著的《胖东来凭什么:一家幸福企业的哲学逻辑》一书由中国民主法制出版社出版发行
2025-08-29 16:03:00
小米升级澎湃OS 3Beta版后手机变得很烫,官方:约3天恢复满血
8月29日,小米澎湃OS官方微博发布答网友问,详细介绍了澎湃OS 3 Beta 后续推送计划,集中回答大家对小米澎湃OS 3 Beta版的高频问题
2025-08-29 16:04:00
拼多多要亲自拍短剧?招聘短剧制片运营,年薪近50万
8月29日消息,拼多多在招聘平台上发布了一则引人注目的招聘信息,招聘“短剧制片运营”岗位,年薪近50万,负责短剧内容制作
2025-08-29 16:05:00
【2025数博会】可信数据空间破解数据要素流通难题
8月28日,2025中国国际大数据产业博览会上,行业专家与企业代表聚焦可信数据空间建设及数据要素市场化发展开展深度交流
2025-08-29 16:29:00
浙江卫视×浙江文交所 联手打造全球首个爆款综艺文化数字资产
综艺史上的首次突破!浙江文化产权交易所携手Z视介,联手打造的浙江卫视全球首张综艺数字卡,8月29日重磅上线浙江文交所旗下乐数通平台
2025-08-29 16:30:00
对话领航者--滨高电梯朱海涛:成立换新体验中心 业务聚焦两大领域
鲁网8月29日讯近日,齐鲁商势力联盟对话领航者走进滨州市滨高电梯销售有限公司日立换新体验中心,与公司负责人朱海涛面对面
2025-08-29 16:40:00
贵安超算中心:每秒1.3亿亿次的峰值算力助力影视项目渲染
2025年暑期档光影盛宴的背后,贵安超算中心功不可没:参与《猫和老鼠:星盘奇缘》《刺杀小说家2》《731》等12部影视项目渲染
2025-08-29 17:00:00
【2025数博会】虚拟F1驱动贵阳打造全球数字体育新生态
虚拟F1赛事已从娱乐载体跃升为融合职业竞技、技术研发与商业创新的复合生态系统,成为推动真实F1技术革新与连接尖端科技大众化的核心桥梁
2025-08-29 17:00:00