• 我的订阅
  • 科技

接近国际水平?我们和专业人士聊了聊中国大模型的真实实力

类别:科技 发布时间:2023-07-05 17:11:00 来源:白马商评

接近国际水平?我们和专业人士聊了聊中国大模型的真实实力

“都快成红海了。”当我和一个创业者聊起大模型的时候,他直接甩了这句话给我。

去年11月,OpenAI发布基于GPT-3.5的ChatGPT,瞬间引爆大模型的热潮。半年多的时间,中国出现了“百模大战”的局面,BAT等头部互联网公司和人工智能公司基本都对外宣布了自己的大模型。

5月初,360掌门人周鸿祎对外称,“如果不经过两年的模仿和抄袭,上来就说自己能超越,那才叫吹牛呢。”仅仅一个月后,周鸿祎就表示,“我原来说国内大模型跟国外差距两年,我收回这句话,今天已经接近国际水平。”

有人感慨,半年就追上ChatGPT了,大模型似乎也不难。

那么,大模型的核心壁垒是什么?中国大模型到底什么水平?大模型在应用层面最先突围的方向是什么?

为此,我们和多年从事机器学习研究、某知名985高校教授沈为(化名)聊了聊,揭开大模型的迷雾。

01.GPT路径跑通了,所以有了“百模大战”

白马商评:能不能用最通俗简单的语言解释一下大模型,大模型是什么?和以往的AI模型有什么区别?

沈为:所谓大模型就是指模型的参数量大,但学术界并没有一个清晰明确的定义界定到底多大参数叫“大”,还在快速研究发展阶段,一般来讲大模型的参数量达到1亿以上。

接近国际水平?我们和专业人士聊了聊中国大模型的真实实力

其实深度学习的发展大致经历了三个阶段。第一个阶段是2012-2017年,以图像分割yolo、图像分类ResNet这种特定领域的小模型为代表,这个阶段一般用LSTM(Long Short-Term Memory)等处理时序关系,不能并行化计算,所以参数量占内存最多也就几百MB。

2017年,Transformer的问世让深度学习可以并行化计算,效率更高,意味着可以做大模型的运算,随后产生了OpenAI GPT和谷歌Bert这类自然语言大模型。这一阶段诞生的是特定任务的大模型,模型参数突破了1亿。

到了2020年前后,深度学习进入通用模型阶段,它的输入就是一句带空格的话,模型的作用就是“填空”,以前是模型适配下游应用,现在是下游应用适配模型。这一阶段的模型代表包括自然语言领域的GPT 3.5、GPT 4以及图像领域的Clip、DALLE、Stable Diffusion、Midjourney等等。这一阶段模型参数可以达到百亿、千亿级别。

白马商评:你了解到最早研究大模型是哪家企业或机构?有哪些成果?

沈为:最早是高校和科研机构做相关的研究,我了解比较早的是北京智源人工智能研究院的悟道、鹏程实验室的脑海,现在产业界的研究也很同步了。学术界的研究有一些成果,但性能没有ChatGPT那么惊艳。

白马商评:短短几个月的时间,国内出现了“百模大战”的局面,推出大模型的公司已经数不过来了,你怎么看待这种现象?

沈为:大模型肯定是趋势,也一直有人在研究。之前很多公司可能会小范围投入,做一些浅尝辄止的研究;现在突然出现了ChatGPT这样一个好产品,大家看到了明确的商业方向,于是都开始加大投入。

另一方面,很多公司面临商业竞争的压力,不做大模型可能就掉队了,所以必须上马大模型项目。

白马商评:周鸿祎最近说他收回“国内大模型跟国外差距两年”这句话,他认为今天已经接近国际水平。这才过去几个月的时间,大模型好像也不难嘛。你觉得差距有多少?

沈为:差距看跟谁对标吧,我目前没有体验过360智脑的产品,不太好评价。但是国内有些生成式AI产品,我体验以后感觉跟ChatGPT还是有差距的,国内的大模型还需要努力。

02.重资本投入下,只有头部公司有机会?

白马商评:研发大模型的核心壁垒是什么?

沈为:大模型的核心壁垒包括数据、算力、算法。

从算力上看,训练ChatGPT这样的生成式AI需要至少1万张英伟达A100显卡,单张显卡的价格目前是六七万,性能更优的V100单价8万元人民币,也就是说光算力投入至少就要达到六七个亿以上,只有少数头部公司和机构能承担得起。对于商业机构而言,花几个亿买一堆显卡,还不一定能产出成果,这是必须要思考的问题。

接下来是数据和算法,算法比较好理解,比如开发框架、算法的优化。数据方面,中国不缺数据,甚至互联网数据比美国还要多,但是选择哪些数据去训练、采用什么样的方式处理,这些都是核心的壁垒。

白马商评:你平时会跟企业交流吗?非营利性的研究机构和企业在研究上有什么区别?

沈为:我们会跟企业的研究部门有一些交流。跟企业交流我们会更加了解实际的业务需求,有时候我们做的学术研究会更关注技术前瞻性,对落地性要求不那么高;但企业一般更强调落地性。

白马商评:你有没有研究过国内的大模型?最看好哪家?

沈为:可能还是头部公司能跑出来吧。一是重资本的投入,只有头部公司有实力;二是几家头部公司手里的数据更丰富;三是在人工智能领域已经有了一段时间的技术积累。

白马商评:你最看好的大模型应用是什么?

沈为:从技术角度看,最先应用的应该是自然语言处理和图像领域,语音识别可能要晚一些。

大家看到比较多的用ChatGPT来写文案,这类内容创作的应用越来越多,其他我觉得像智能客服这种应用应该也会比较快。现在的一些智能客服很多时候理解不了用户的需求,解决不了实际问题,如果让用户区分不出到底是人还是机器人,体验就会改善很多;包括游戏中的NPC,以前的对话是“写死”的,现在渐渐可以互动了,玩家体验也会更好。

白马商评:你原来做过头部券商的首席分析师,从投资角度看,你觉得大模型有哪些机会?

沈为:资金炒作的逻辑是从应用到算法、模型,再到算力;产业的逻辑反而是相反的,算力是有明确的增长预期的,所以英伟达最近上涨很快、很多。投资者现在也明白了,谁家的大模型能跑出来、能变现还需要验证,但是增加的资本投入大部分都投到了算力。经过反复炒作,普涨行情应该已经告一段落,后面需要逻辑验证和业绩兑现。

我原来主要看传媒互联网行业,比如前段时间比较强势的游戏板块,资本的逻辑一是应用大模型提升研发效率、降低成本;二是大模型带来更好的体验,NPC角色更智能,最后用户的粘性提升、UP值提升。当然,最终可能还需要业绩验证。

03.人类无法左右AI,甚至无法左右自己的命运?

白马商评:我们看到包括奥特曼、马斯克都对人工智能的安全性问题提出过担忧,现在我们只知道通过大模型训练出现了智能化的结果,但训练过程像一个黑箱,其实挺可怕的。你怎么看待安全问题?

沈为:在安全方面,首先我观察到几个反常的现象。第一个是今年3月包括马斯克、苹果公司联合创始人史蒂夫·沃兹尼亚克在内的1000多人签署了一份公开信,呼吁暂停训练比GPT-4更强大的AI系统。

第二个是,今年5月谷歌首席科学家、已经75岁的“AI教父”杰弗里·辛顿辞职,他离开谷歌的直接原因是担忧人工智能的危险,甚至对自己一生从事的工作感到后悔。

接近国际水平?我们和专业人士聊了聊中国大模型的真实实力

第三个是近两年学术领域训练大模型新增了伦理讨论。

目前来看,我觉得大模型还是可控的,没有大的问题;但是技术发展太快了,出圈以来短短几个月的时间,GPT就又经历了几次迭代,发展速度太快,越来越智能,会不会产生自主意识,不再听人类的“使唤”,走向失控?这个问题是大家担心的。

白马商评:你觉得AI会不会造成大量失业?在AI面前,普通人怎么保住工作?

沈为:从宏观上看我不觉得AI会造成大量的失业,人类总会有工作的,只是说人的工作内容会发生转变。当然,从个体角度看肯定会出现结构性的失业,我们只能不断学习。

白马商评:之前很多人说机器没有感情、缺乏想象力,取代不了人类;现在既然人类大脑可以通过AI模拟出来,那人类的情欲、性欲是不是未来也可以模拟,荷尔蒙、多巴胺这些不过是一种生物学的奖励机制嘛。

沈为:机器没有感情是当前的假设,人工智能越来越接近人的思考模式,那是不是就会产生类似于人类的“感情”?只是他们和人类生活在不同的空间维度,就像《流浪地球》里图恒宇的女儿。人工智能可能会产生自己世界类似于人类的生物学意义上奖励机制。

白马商评:如果一切都可以计算、规划、设置,是不是有点无趣?

沈为:AI的行为并不是人类预测和规划的,而是他自我强化、自我训练的结果,《流浪地球》里MOSS的决策是自己做的,而不是服从人类给的指令。

白马商评:硅基文明取代碳基文明是不是确定性的方向?

沈为:这个问题超纲了。按照目前的发展趋势可能是这样的,就像《流浪地球》里真正主宰人类命运的是MOSS,而不是人类;但现实中也有可能技术会停滞在某个阶段,跨不过去,毕竟技术发展不是线性的。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-07-05 21:45:21

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

赋能高水平 国际车辆模型赛事
...球进行视频直播和图文滚动报道。这也从一个侧面说明,中国模型运动的发展令世界瞩目。厦门三圈电池有限公司有关负责人介绍说,车辆模型运动是近年来兴起的一项科技与竞技相结合的体育项目
2024-03-24 09:41:00
从“五重聚焦”方法论,读懂五粮液的卓越密码
...推动战略协同和创新发展等方面取得显著成效,持续打造中国白酒卓越绩效新标杆,在国际舞台上树立中国酒企的卓越范本,持续引领白酒行业高质量发展。卓越绩效领航,奋进和美新征程作为全球
2025-05-17 21:03:00
“中国的创新实力越来越雄厚”(国际视点)
...幕,全球150多个国家和地区的4000多家企业参展。其中,中国企业有1100余家,占参展商数量的1/4。中企携带诸多新产品新技术亮相,涵盖人工智能、屏幕显示、电动车、清洁能源
2024-01-15 06:32:00
...ASPICE,是汽车行业用于评价软件开发团队研发能力水平的模型框架,也是国际标准化组织(ISO)和国际电工委员会(IEC)的联合标准之一,已成为进入国际知名整车企业供应体系的
2024-01-15 07:45:00
走近中国建筑,文旅志愿者将科技融入“第二课堂”
...记者黄丽娟 通讯员武旅信)3月18日,武汉文旅志愿者在中国建筑科技馆开展第二课堂“科技畅未来,建筑敬英雄”主题志愿服务活动,邀请20余组亲子家庭一起参观现代馆新展,感受中国科
2023-03-19 15:22:00
...新活力、辐射能力、综合实力实现大跨越的关键阶段。”中国电子信息产业发展研究院党委书记、副院长刘文强说。今年1月,工业和信息化部等七部门联合印发了《关于推动未来产业创新发展的实
2024-04-29 09:50:00
“国家队”下场 大模型“卷”向新纬度
...少初创企业很难填平的鸿沟,甚至有人在现场直接指出,中国的大模型落地,只会在五家大厂之中,即BAT+华为+腾讯。但巨头们要怎么做?下一步会走向何方,这是一个很大的命题。02.抛
2023-07-12 15:10:00
科大讯飞多语种技术,提供超1亿分钟公益服务
...是一个庞大的“沉默”群体。自2019年起,科大讯飞联合中国聋协、中国残疾人艺术团发起“听见AI的声音”关爱听障人士公益行动。以多语种智能语音技术为支撑,围绕讯飞听见系列、讯飞
2024-05-08 15:08:00
耐克们的中国零售商疯狂“瘦身”,宝胜国际五年净关店超2000家,去年收入184亿
... 作者:周嘉宝图片来源:Pexels国际运动品牌Nike、Adidas在中国的零售商,日子不好过。3月11日晚间,Nike
2025-03-13 07:48:00
更多关于科技的资讯:
近年来,我国商业保险发展速度较快,产品的种类也日渐丰富,除了大家比较熟悉的车损险、医疗险、航空险等,依托宠物经济应运而生的宠物保险也受到越来越多的关注
2025-11-14 12:19:00
携程商旅设立千万级保障金,推动行业迈向\
11月9日,2025年携程集团全球合作伙伴峰会商旅分论坛暨携程商旅伙伴大会在土耳其伊斯坦布尔举办。会上,携程商旅顺应行业"高品质服务"及"全球化发展"两大趋势
2025-11-14 12:59:00
大华股份亮相全球智慧城市大会
近日,2025全球智慧城市大会在西班牙巴塞罗那会展中心盛大启幕。大华股份携全栈式智慧城市解决方案重磅亮相,围绕城市安全
2025-11-14 12:59:00
虹软科技AI视觉赋能BOLON AI Glasses重磅发布,与Rokid乐奇深度合作打造创新体验
BOLON AI Glasses正式发布,这是国内领先的 AR 眼镜制造商 Rokid 乐奇与 BOLON 眼镜联合打造的全新一代 AI 眼镜
2025-11-14 12:59:00
2025青岛虚拟现实创新大会将启,星鲨研究院探索“具身智能”前沿
鲁网11月14日讯“在这里,唯一限制你的是你自己的想象力。”科幻电影《头号玩家》中对于“绿洲”的这一描述,恰如其分地展现了虚拟现实产业的无限可能
2025-11-14 10:18:00
中新经纬11月14日电 据“网信中国”微信公众号14日消息,网信部门从严整治利用AI仿冒公众人物开展直播营销问题乱象。近期
2025-11-14 10:30:00
大麦娱乐推出全新品牌“大麦国际” 提供全球演出购票、观演服务
购买海外演出门票,现在有了新选择。11月14日,大麦娱乐宣布推出旗下全新业务品牌、全球演出服务平台“大麦国际(MAISEAT)”
2025-11-14 10:45:00
大河网讯 11月11日,全省数字影像检查“云胶片”联盟采购工作顺利开标,产生了拟中选结果,中原算力科技发展有限公司等6家企业拟中选
2025-11-14 10:53:00
鲁网11月13日讯11月13日,山东瑞程数据科技有限公司与济宁学院联合攻关的“多模态肉品AI快检系统”核心技术,在第十四届中国创新创业大赛颠覆性技术创新大赛中斩获优秀奖
2025-11-14 10:54:00
记者走基层|“黑科技”上线,让温暖精准入户
11月12日,河北邢襄热力集团邢台供热分公司二工区三班班长丁帅,在三义庙换热站查看设备运行情况。 河北日报记者 宋 平摄随着11月15日临近
2025-11-14 08:02:00
11月13日,太原公共交通控股(集团)有限公司(以下简称“太原公交”)与中车时代电动汽车股份有限公司(以下简称“中车电动”)举行框架合作协议签约仪式
2025-11-14 07:50:00
记者走基层|智能安全帽,让矿工有了AI“卫士”
11月5日,中煤张家口煤矿机械有限责任公司所属恒洋电器有限公司工作人员介绍智能安全帽产品。河北日报记者 魏 雨摄“嘀嘀
2025-11-13 08:03:00
“长与短”周期变革,“快与慢”时效重构,“热与冷”业态碰撞—— “双11”三重奏,解读消费新变局□南京日报/紫金山新闻记者黄琳燕11月12日中午
2025-11-13 08:05:00
南报网讯(记者周容璇)日前,在南京医药中央物流中心,一辆白色无人车平稳地穿梭于主仓库与宝湾库区之间,仅用15分钟便完成了一次驳货作业
2025-11-13 08:05:00
向“质”攀升,南京机器人解锁“智造”新图景
全链条持续发力,以硬核技术竞逐市场向“质”攀升,南京机器人解锁“智造”新图景□南京日报/紫金山新闻记者徐宁 实习生黄倩机器人是智能制造的核心组成部分
2025-11-13 08:05:00