• 我的订阅
  • 科技

AI大模型行业报告:大模型发展迈入爆发期,开启AI新纪元(附下载)

类别:科技 发布时间:2024-10-21 10:03:00 来源:资产保值小助手

技术:大模型发展呈现“规模定律”,Transformer为技术基座

1.1 大模型“大力出奇迹”的背后:Scaling Law

大规模语言模型(Large Language Models,LLM)泛指具有超大规模参数或者经过超大规模数据训练所得到的语言模型。

与传统语言模型相比,大语言模型的构建过程涉及到更为复杂的训练方法,进而展现出了强大的自然语言理解能力和复杂任务求解能力。

AI大模型行业报告:大模型发展迈入爆发期,开启AI新纪元(附下载)

大模型“大力出奇迹”的背后:Scaling Law

大模型发展普遍呈现“规模定律”(Scaling Law)特征,即:模型的性能与模型的规模、数据集大小和训练用的计算量之间存在幂律关系,性能会随着这三个因素的指数增加而线性提高。大模型的参数规模远大于传统深度学习模型,传统模型参数量通常在数万至数亿之间,大模型的参数量则至少在亿级,并已发展到过万亿级的规模。如OpenAI的GPT-1到GPT-3,参数量从1.1亿大幅提升至1746亿,GPT-4非官方估计达到万亿参数(根据Semianalysis消息,GPT-4包含1.8万亿参数),实现性能的突破。根据Google论文,这种大模型具有但小模型不具有的能力通常被称为“涌现能力”(Emergent Abilities)。

AI大模型行业报告:大模型发展迈入爆发期,开启AI新纪元(附下载)

1.2 Transformer是LLM基座,核心优势在于Self-attention机制

当前主流大模型普遍是基于Transformer模型进行设计的。Transformer模型在Google团队2017年论文《Attention Is All You Need》中被首次提出,Transformer的核心优势在于具有独特的自注意力(Self-attention)机制,能够直接建模任意距离的词元之间的交互关系,解决了循环神经网络(RNN)、卷积神经网络(CNN)等传统神经网络存在的长序列依赖问题。

相较于RNN,Transformer具有两个显著的优势。1)处理长序列数据:RNN受限于循环结构,难以处理长序列数据。Self-attention机制能够同时处理序列中的所有位置,捕捉全局依赖关系,从而更准确地理解、表示文本含义。2)实现并行化计算:RNN作为时序结构,需要依次处理序列中的每个元素,计算速度受到较大限制,而Transformer则可以一次性处理整个序列,大大提高了计算效率。

AI大模型行业报告:大模型发展迈入爆发期,开启AI新纪元(附下载)

Transformer组件:Encoder重理解,Decoder重生成

Transformer由两类组件构成:Encoder(编码器)和Decoder(解码器)。通常,Encoder结构擅长从文本中提取信息以执行分类、回归等任务,而Decoder结构则专用于生成文本。

实际上,两类组件可以独立使用,当前主流大模型中,诞生了以BERT为代表的Encoder-only架构、以T5为代表的Encoder-decoder架构、以GPT为代表的Decoder-only架构的大规模预训练语言模型。

AI大模型行业报告:大模型发展迈入爆发期,开启AI新纪元(附下载)

1.3 GPT系列模型技术发展历程回顾

从技术角度来看,结合中国人民大学《大语言模型》的观点,GPT在众多大模型角逐中能够取得瞩目,有以下几点值得注意——1)可拓展的训练架构与学习范式:当谷歌2017年推出基于注意力机制的Transformer模型后,OpenAI团队能够迅速洞察到其作为大规模可扩展训练的理想架构的潜在优越性,最终将Transformer拓展到百亿、千亿甚至万亿参数规模,并且将预训练任务统一为通用学习范式。

2)对于数据质量与数据规模的重视:高质量数据、超大规模数据成为GPT成功的关键基础,比如,OpenAI将人类生成的对话数据和高质量的标注数据用于训练ChatGPT,使得ChatGPT在与人机对话测试中展现出了优秀能力。

1.3 GPT 1~3:采用Transformer架构,参数规模拓展至千亿级

GPT系列模型的技术演变(GPT 1~3):2017年,Google推出Transformer后,OpenAI迅速着手并于2018年推出的第一个GPT模型,全称为Generative Pre-trained Transformer。GPT-1基于生成式、Decoder-only的Transformer架构开发,由于参数规模相对较小,模型尚缺乏通用任务求解能力,GPT-1采用Pre-training(预训练)+Fine-tuning(微调)的两阶段范式,先通过单向Transformer预训练一个通用的模型,然后在特定子任务上进行微调。

GPT-2沿用GPT-1类似架构,并将参数规模扩大至1.5B,并使用大规模网页数据集WebText进行预训练。与GPT-1不同的点在于,GPT-2旨在探索通过扩大模型参数规模来提升模型性能,并且试图使用无监督预训练的语言模型来解决各种下游任务。

OpenAI经过较为充分的实验探索,2020年,GPT-3将模型参数扩展到了175B,较GPT-2提升100余倍,验证了将神经网络扩展到超大规模可以带来大幅的模型性能提升。同时,GPT-3论文正式提出“上下文学习”,建立了以提示学习方法为基础技术路线的任务求解范式。

ChatGPT:一举成为现象级应用,引入RLHF算法改进训练数据

GPT系列模型的技术演变(ChatGPT):在GPT-3的基础上,OpenAI又通过代码训练、人类对齐、工具使用等技术对于模型性能不断升级,推出了GPT-3.5系列模型。2022年11月,ChatGPT正式上线,实现以对话形式解决多种任务,使得用户能够通过网络API体验到语言模型的强大功能。ChatGPT 仅用5天时间注册用户达到100万,约2个月注册用户达到1亿,成为AIGC领域的现象级应用。

OpenAI在官网文章中介绍,ChatGPT主要是沿用了2022年1月推出的InstructGPT。InstructGPT的核心技术是基于人类反馈的强化学习算法,即RLHF算法(Reinforcement Learning from Human Feedback),旨在改进模型与人类对齐的能力。具体实现上,人类标注人员扮演用户和代理进行对话,产生对话样本并对回复进行排名打分,将更好的结果反馈给模型,让模型从两种反馈模式——人类评价奖励和环境奖励中学习策略,对模型进行持续迭代式微调。

AI大模型行业报告:大模型发展迈入爆发期,开启AI新纪元(附下载)

GPT-4系列:能力跃升,增加多模态能力,最新版4o突破性价比

GPT系列模型的技术演变(GPT-4~GPT-4o):继ChatGPT后,OpenAI于2023年3月发布GPT-4,它首次将GPT系列模型的输入由单一文本模态扩展到了图文双模态。GPT-4在解决复杂任务方面的能力显著强于GPT-3.5,在一系列面向人类的考试中都获得了非常优异的结果。

基于GPT-4,OpenAI在2023年9月进一步发布了GPT-4V,重点关注GPT-4视觉能力的安全部署。GPT-4V在多种应用场景中表现出了强大的视觉能力与综合任务解决能力。2023年11月,OpenAI在开发者大会上发布GPT-4 Turbo,引入了一系列技术升级,如:将模型内部知识库更新至2023年4月,将上下文长度提升至128K,价格更便宜,引入若干新的功能(如函数调用、可重复输出等)。

今年5月14日,OpenAI春季发布会,发布了新版旗舰模型GPT-4o。GPT-4o 将文本、音频和视觉集成到一个模型中,提供更快的响应时间、更好的推理能力以及在非英语语言中的更佳表现,不仅在传统文本能力上与GPT-4 Turbo性能相当,还在API方面更快速,价格便宜50%。与GPT-4 Turbo相比,GPT-4o速度提高了2 倍,限制速率提高了5 倍,目前的上下文窗口为128k,模型知识截止日期为2023 年 10 月。

AI大模型行业报告:大模型发展迈入爆发期,开启AI新纪元(附下载)

市场:全球大模型竞争白热化,国产大模型能力对标GPT-3.5Turbo

2.1 海外大模型:通用大模型竞争白热化,闭源LLM三足鼎立

(本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。)

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-10-21 11:45:10

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

360智能门锁斩获“葵花奖”,引领智能家居安全新纪元
360智能门锁在2024年第八届“葵花奖”智能家居评选中斩获三项重要奖项,分别是:“2024智能锁行业创新竞争力品牌”、“2024智能锁行业产品质量安全金奖”、和“2024智能锁
2024-07-11 10:45:00
超聚变探索者大会2025:算力焕新,开启智能新纪元
...,在A时代快人一步。 AI重塑产业格局,算力需求迈入新纪元 当前,以大模型、生成式AI为代表的人工智能技术正以前所未有的速度渗透各行各业,驱动计算产业格局发生深刻重塑
2025-04-18 16:47:00
...用蓬勃发展,其带来的特殊性需求也在推动芯片行业迈向新纪元。日前,在第六届中国国际进口博览会(简称“进博会”)上,毕马威中国特别设立芯片科技和AI大模型进博会专场活动,分享前沿
2023-11-11 15:25:00
8月20日,喜临门(603008.SH)发布2025年半年度报告,上半年公司实现营业收入40.21亿元,同比增长1.59%
2025-08-21 10:52:00
朗姿医美首个数字人Liz惊艳亮相,开启医美数字化体验新纪元
四川新闻网成都9月27日讯 2023年9月26日,“Hello LANCY朗姿医美数字星球启幕会”在成都举行,朗姿医美发布旗下首个数字人Liz
2023-09-27 17:29:00
...务创新提供了技术支撑。行业价值:开启金融数字化转型新纪元赵一楠独创的“金融全周期数模管理体系”是中国金融投资管理领域首个深度融合全周期管理框架、金融资产建模方法与动态风险监管
2025-07-28 20:36:00
...型、生成式人工智能为代表的核心技术突破推动产业进入新纪元,从而也使得对算力的需求显著上升。寒武纪表示,报告期内依托于智能芯片产品及其配套软件平台的技术领先优势,公司产品持续在
2025-04-19 11:58:00
挺能忽悠也会瞎编!ChatGPT一小时生成的研报刷屏,内容靠谱吗?
...,语段间逻辑关联度显著提升。杨烨还提到,ChatGPT开启AI新纪元,加速应用场景落地,带动AI产业上游需求。ChatGPT下游应用场景包括代码机器人、小说衍生器、对话类搜索
2023-02-07 10:10:00
...存,危险废物未张贴标签、标志未更新。自流井区自贡市新纪元恐龙景观制作有限公司存在问题:1.现场检查时制皮工序正在作业,未开启治污设施;2.部分光氧灯管损坏;3.活性炭预处理不
2024-06-12 18:51:00
更多关于科技的资讯:
国务院新闻办公室1月21日上午举行新闻发布会,工业和信息化部介绍2025年工业和信息化发展成效有关情况,并答记者问。全国所有乡镇以及95%的行政村已通5G在移动网络方面
2026-01-22 08:12:00
1月21日,市场监管总局召开专题新闻发布会,通报了2025年综合整治“内卷式”竞争十大典型案例。十大案例中,首案为公开约谈货拉拉
2026-01-22 08:13:00
2025年12月底,全国多家头部家装企业密集推出“资金存管”业务,在行业掀起了一股加强资金安全的新风。资金存管模式在互联网金融
2026-01-22 08:13:00
能治疗癌症的CAR-T细胞疗法有了“国家级说明书”!
大河网讯 你听说过用“特种兵”免疫细胞(CAR-T细胞)来精准打击癌症吗?日前,由郑州大学第一附属医院生物细胞治疗中心牵头编制的《CAR-T细胞疗法临床应用技术规范》《CAR-T
2026-01-22 10:08:00
杭州日报讯 从全球大火的游戏到艺术展再到专门的衍生品零售店,杭州出品的“黑神话”IP的每一场活动都引发了粉丝的关注。这个周末(1月23日-25日)
2026-01-22 08:19:00
日前,太重智能高端装备产业园区的厂房内一片欢腾。由企业自主研发的智能轴承,成功应用于大型电铲并顺利完成厂内模拟测试,各项性能指标均优于设计标准
2026-01-22 07:03:00
最近有件事儿越来越常见:外国人不光来中国旅游,还专门“打飞的”来看病。不是出于好奇体验,而是真心觉得值!值在哪儿?三个字
2026-01-21 21:52:00
中新经纬1月21日电 广东省政府网站21日公布《广东省人工智能赋能交通运输高质量发展若干政策措施》(下称《政策措施》)
2026-01-21 20:20:00
织金平远公司完成 500kVⅡ 组母线母差保护装置校验及传动
多彩贵州网讯(通讯员 史凡莉)近日,织金平远公司厂区内,500kVⅡ组母线设备区域一派忙碌景象。电热检修部与发电运行部工作人员有条不紊地开展母差保护A屏
2026-01-21 17:15:00
九阳太空厨房已安全稳定运行超1500天
中国消费者报报道(记者桑雪骐)航天员们如何健康、舒适地展开太空生活和吃好一日三餐,是大家都很关心的话题。据了解,这背后其实有一个我国自主研制的太空厨房
2026-01-21 18:05:00
秦皇岛经开区第一小学开展人工智能科技实践活动
河北新闻网讯(李佳新)日前,秦皇岛经开区第一小学开展以“AI探索,智创未来”为主题的人工智能科技实践,通过沉浸式实训活动激发学生的科技探索热情
2026-01-21 18:11:00
马年将至(农历),在广州大夫山森林公园,一些徒步爱好者分享了一种创意玩法——“画马”,相关穿越路线攻略一时引发追捧。所谓“画马”
2026-01-21 18:36:00
三重蝶变,中天钢铁解锁“企业主理”新范式
大寒虽寒,热潮涌动。原点空间路演大厅内,由中天钢铁主理的第37场沙龙——“AI智能体创新大赛总结沙龙”以三重蝶变,为常州“智能体+场景应用”示范城市建设吹响了热力全开的奋进号角
2026-01-21 18:28:00
苏州市女企协秘书长、国浩律师(苏州)事务所合伙人葛霞青律师荣登《钱伯斯大中华区指南2026》推荐榜单
江南时报讯 1月15日,全球领先的法律研究和分析机构钱伯斯(Chambers & Partners)发布《钱伯斯大中华区指南2026》(Chambers Greater China Region Guide 2026)
2026-01-21 15:23:00
盐城盐都:“翼”技傍身 照亮前程
江南时报讯 启动无人机,校准飞行参数,规划测绘航线,精准捕捉地面数据……日前,2026年盐城市盐都区首期无人机测绘操控员技能培训在都U+乐业空间正式开班
2026-01-21 15:24:00