• 我的订阅
  • 科技

大语言模型的前世今生与技术奥秘

类别:科技 发布时间:2023-08-19 05:54:00 来源:每日看点快看

本文转自:解放日报

大语言模型的前世今生与技术奥秘

陈晓东

大语言模型的前世今生与技术奥秘

《大模型时代:ChatGPT开启通用人工智能浪潮》龙志勇、黄雯 著中译出版社 中国社会科学院中国产业与企业竞争力研究中心副主任、工业经济研究所研究员 陈晓东

在人类发展史上,由于技术进步带来的全新产品与服务,不仅满足了既有的需求,还创造了新的需求。随着数字技术的广泛应用,以智能化为特征的第四次工业革命已经悄然出现在我们身边,ChatGPT就是其中一个代表性的成果,由于其具备了较为流畅的逻辑性对话和交互能力,所以一出现便备受市场关注。这种成果告诉我们,具有高水平结构复杂性和大量参数的大模型可以实现深度学习。

《大模型时代:ChatGPT开启通用人工智能浪潮》是国内首部全景式详解人工智能大语言模型前世今生及其技术奥秘的作品。

与传统语言模型不同,大语言模型通过在大规模语料库上进行训练来学习语言的统计规律,在训练时通常通过大量的文本数据进行自监督学习,从而能够自动学习语法、句法、语义等多层次的语言规律。人工智能模型与一般模型都是以数学和统计学为基础,可以用来描述一个系统或者一个数据集。人工智能的大语言模型参数有1亿多个,而且这一标准还在不断提高,GPT3的参数已经超过了1750亿个,目前确信有超过万亿参数以上的模型在运行。除此之外还有比大语言模型更大、更复杂的人工神经网络模型,通常拥有数万亿到数十万亿个参数。

一个模型的参数越多,通常意味着可以处理更加复杂、更加丰富的信息,其预测结果也就具有更高的准确性。理论上讲,如果一个模型的参数足够多到跟实际情况一样,那就可以再现已经发生过的事情或者模拟将要发生的情况。超大模型通常被用于解决自然语言处理(NLP)中的问答和机器翻译、计算机视觉中的目标检测和图像生成等更为复杂的任务。这些任务需要处理极其复杂的输入数据,还能从中提取更深层次的特征数据,提高模型的准确性。

如果从人工智能的生成角度来定义大语言模型,生成模型可以根据文本提示生成代码,还可以解释代码,甚至在某些情况下调试代码。这一过程不仅可以实现文本、图像、音频、视频的生成并构建多模态,还可以在更为广泛的领域生成新的设计、新的知识和思想,甚至实现广义的艺术和科学再创造。

值得一提的是,这本书揭示,大语言模型未来的表现可能会在细分的专业性上,虽然其与行业中顶级的专家相较而言可能还会有很大的差距。以大语言模型为代表的人工智能可以催生新模式,可以赋能产业数字化,还可以数字人、个人助理、搜索引擎等形式对数字经济新业态、新模式提供发展动能,它将深刻改变科技、教育等领域的生态。因此,大语言模型的训练和调整需要极其巨大的算力、算法、数据、技术以及超大规模的投入与协作。前三者作为人工智能的三要素,在产业数字化的智能升级进程中发挥着巨大作用。

作者龙志勇、黄雯,曾分别任职于阿里巴巴、百度、腾讯,是人工智能领域的资深从业者。他们通过技术篇、变革篇、应用篇、产业篇四大部分,生动阐释大模型背后的技术原理、对知识处理和社会变革产生的影响,详细介绍了大模型的三类应用(知识工作型、企业业务型、创意娱乐型),同时就相关产业的发展做了前瞻预测。

作为一名产业与企业竞争力领域的研究者,我在阅读这本书后,还收获了更多的思考,其中最重要的就是数字经济时代的新型生产力——算力。数据是生产资料,算法代表新生产关系,算力作为新生产力支撑着算法和数据,而算力水平直接决定数据处理能力。如何组合不同的算力类型,是降低成本并最终得到市场认可的关键。

随着“东数西算”工程与新型基础设施等政策出台,我国算力整体布局将从东部地区逐渐向中西部地区延伸,要鼓励有条件的地区因地制宜不断探索试点算力新领域。在加大算力作为经济发展重要底层支撑的同时,要着力培育并加快建立我国人工智能发展的完整生态。

发展我国大语言模型,还要建立一个统一的大语言模型平台和底层基础来对接国产算力公司,并做好接口,使得所有企业都可以使用,这样才能促进人工智能尤其是大语言模型的生态链建设,进而推动我国人工智能健康、稳定、快速地发展。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-08-19 08:45:05

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

... (全媒体记者王纳)近日,一项来自深圳的神经科学与人工智能融合的研究成果登上了国际顶级学术期刊《自然—机器智能》,为科学家们解开动物社交行为的奥秘带来了新的视角。动物社交行为
2024-01-11 04:04:00
...院院士、之江实验室主任王坚的说法,“如果基础模型是人工智能的皇冠,那么科学基础模型就是人工智能皇冠上的明珠。”全球首个百亿级人类基因组基础模型7个月前,在杭州华大的一间小会议
2025-12-19 07:22:00
千寻智能韩峰涛:到2025年底,投资人会更看好具身智能
...中国一流的前几个高校的优秀博士,研究方向做计算机和人工智能的。“具身智能Scaling Law还有很大红利,模型能力将持续提升”《智能涌现》:具身智能大模型存在一些技术路线的
2025-04-01 10:57:00
打造AI科普范式 科普认知智能大模型亮相科博会
...篇科普文章”“围绕大科学装置生成短视频脚本”“围绕人工智能阐述一段文案”……在活动现场,大家纷纷抛出问题,科普认知智能大模型顺利完成了内容创作,赢得一致赞赏。据介绍,科普认知
2023-10-22 22:35:00
中新社北京3月30日电 (记者 马帅莎)当前,人工智能(AI)热潮正席卷各行各业,医疗是重要一环。2025中关村论坛年会期间,AI医疗成为与会专家热议话题。近年来,AI技术已在门
2025-03-30 14:47:00
...bsp2024年01月25日 &nbsp第&nbsp07&nbsp版)到底什么是人工智能
2024-01-25 01:26:00
DeepSeek开源惠四方(科技名家笔谈)
...昌绘受到热烈欢迎业界纷纷部署近期,中国杭州深度求索人工智能基础技术研究有限公司推出AI语言大模型DeepSeek,受到用户热烈欢迎
2025-02-24 05:52:00
观察|“人人基因组时代”将至,谁来高效准确读懂海量生命数据?
...长期提升的方向之一。全球行业巨头因美纳(Illumina)的人工智能副总裁Kyle Farh在去年9月于江苏南京举行的一场大会上即提出,“基于人工智能和大模型的算法正在基因数
2024-09-12 19:45:00
“气象万千”入课堂,光谷小学生“触摸”云端奥秘
...自主运营的“陶陶气象站”进行了趣味播报演示,其采用人工智能大模型与虚拟人技术相结合的天气播报,亮点突出。小主持人用童趣语言解读专业数据,引发专家点赞。“近年来,国家教育政策逐
2025-03-19 15:45:00
更多关于科技的资讯:
【劲牌故事荟 大家谈友好】“四个友好”引领劲牌构建健康可持续新生态
□谭金山(湖北省社科联“文安平”团队、宜昌市西陵区市场监管局)企业的发展如同时代浪潮中的一叶扁舟,既需乘风破浪,更需掌舵定向
2026-01-09 14:15:00
UU远程2026远程协助重磅升级:被控免登录、自定义验证码等率先上线
引言:网易UU远程2026年即将迎来远程协助升级三连,远程协助功能实现多场景全面升级近日,网易 UU 远程迎来 2026 年首次重磅版本更新
2026-01-09 14:18:00
清华大学携手阿里巴巴共筑AI安全防线 启动大模型与智能体安全研究
近日,阿里巴巴集团与清华大学签订协议,启动智能体与多模态安全产学研深度融合专项合作。双方此次合作为期5年,聚焦中国AI用户在真实应用场景中面临的核心安全挑战
2026-01-09 14:23:00
中国故事海外热播、“泰国模式”全球复制,爱奇艺探索流媒体出海的“长期主义”
2025年,是爱奇艺海外业务进入稳定期之后,增速最高的一年。第三季度,爱奇艺国际版日均会员数创下历史新高,海外会员收入同比增长超过40%
2026-01-09 14:53:00
为进一步优化知识产权服务供给,打通创新成果转化通道,提升知识产权公共服务效能,上饶市“人工智能+”知识产权大数据服务平台(http://shr
2026-01-09 15:04:00
从五金功能件制造者到智能睡眠守护者,喜安思“守护狮”的觉醒之路!
在珠江之畔制造业奔腾的脉搏里,总有一群敢想敢干敢拼的人,让这片沃土跃动出一个又一个传奇,而喜安思智能床垫就是其中之一,喜安思创始人梁富城与陈傲鹏更是其中佼佼者
2026-01-09 15:35:00
近日,【同程商旅】联合【曹操出行】,聚焦国内企业差旅交通全景,重磅发布《2026中国企业差旅交通出行数据研究报告》。发现价值“新流向”国际出行逆势增长
2026-01-09 15:35:00
悍高集团股份有限公司接待44家机构调研,战略清晰彰显经营韧性
随着家居行业逐步从增量市场迈向存量市场,家居五金企业如何找到新的增长曲线,成为考验企业战略定力与运营能力的关键。近期,悍高集团股份有限公司(董事长为悍高欧锦锋)接受包括百嘉基金
2026-01-09 15:35:00
蚂蚁集团两项AI突破获2025年教育部科学研究优秀成果奖一等奖
近日,教育部公布了2025年科学研究优秀成果奖(自然科学和工程技术)授奖名单。蚂蚁集团旗下支付宝(杭州)信息技术有限公司作为主要完成单位参与的“复杂语义场景下知识图谱关键技术与应用”与“复杂服务系统跨界融合关键技术与应用”两项成果
2026-01-09 16:25:00
中新经纬1月9日电 据上海市市场监督管理局网站消息,该局印发《关于促进互联网平台广告规范健康发展的指导意见》(以下简称《意见》)
2026-01-09 16:43:00
长白时评评论员 久泰平市民陈先生长期做食品销售,为了提高销量,他请沪上一位号称粉丝1400多万的网红“X姐爱美食”带货
2026-01-09 11:29:00
被数据总结的365天
算法让这个默默无闻的陌生人,在岁尾的总结里拥有了专属注脚。 又到年末,手机照例被各大App(应用程序)色彩斑斓的年度总结所占据
2026-01-09 12:18:00
从包装焕新到市场布局:中粮餐饮的供应链平台化之路
近日,中粮餐饮旗下核心品牌福掌柜完成了一次深度的包装形象升级。新包装以中华饮食文化为根基,创新性地运用“人文曲线”作为核心设计语言
2026-01-09 13:18:00
国家邮政局数据显示,2025年我国邮政快递业寄递业务量已突破2000亿件,业务收入和寄递业务量分别完成1.8万亿元和2165亿件
2026-01-09 13:34:00
中国消费者报报道(记者刘浩)1月8日,记者从上海市消费者权益保护委员会获悉,2025年,上海市消保委共处理消费投诉321142件
2026-01-09 11:39:00