• 我的订阅
  • 科技

垂直大模型竞争,能突破数据“卡点”吗?

类别:科技 发布时间:2023-05-19 14:01:00 来源:科技云报道

AI大模型火遍全球,中国产业也激发了对人工智能应用的新热情。

随着各大厂商参与竞逐,市场正在分化为通用与垂直两大路径,两者在参数级别、应用场景、商业模式等方面差异已逐步显现。

垂直大模型竞争,能突破数据“卡点”吗?

01 企业涌入垂直大模型赛道

通用AI大模型像ChatGPT,能够处理各种领域和场景的自然语言,但由于需要巨大的计算资源和数据量,已经成为国内外大厂的重点项目。

这类企业往往有着强大的技术团队和资金支持,且有着自己的场景和流量优势。比如百度、阿里、腾讯、字节、华为等,在搜索、社交、电商、办公等领域都有着自己的通用AI大模型。

相较之下,创业公司、细分领域企业很难在这样的竞争中获得先发优势或者差异化优势。

而垂直AI大模型只关注某个特定的领域或者场景,它能够利用行业的数据和知识,提供更精准和高效的解决方案,更好地满足用户在某个领域或者场景下的需求和期待,如:医疗、金融、教育等。

同时,它可以利用一些开源或者闭源的通用AI大模型作为基础,然后在其上进行指令微调(instruction tuning),来适应自己的目标领域或者场景。

因此,它的参数规模比通用大模型低一个量级,如果让数据飞轮和模型训练能够很好结合,在某些特定领域甚至比通用大模型的效果更好、成本更低。

在这样的背景下,越来越多的企业加入了垂直大模型的赛道。

5月18日,深信服发布国内首个自研安全大模型,成为安全领域GPT技术应用首秀;

5月5日,学而思宣布正在进行自研数学大模型的研发,命名为MathGPT,面向全球数学爱好者和科研机构;

3月,达观数据公布正在开发曹植系统,专注于金融、政务、制造等垂直领域的大语言模型。

明确的商业化落地场景和更低的算力成本,为各类企业打开了进军垂直大模型的大门。

02 垂直大模型的考验

垂直大模型的优势在于不够大:算力不够大、算法难度低,但并不代表垂直大模型谁都能做。

众所周知,AI大模型三要素:算力、算法、数据,都是喂养AI的“饲料”。

先说算力。

大模型之所以“大”,就是因为参数众多和数据量庞大。AI大模型所需要的计算量,大致上相当于参数量与数据量的乘积。

过去5年,AI大模型的参数量几乎每年提升一个数量级,例如GPT-4参数量是GPT-3的16倍,达到1.6万亿个。

随着图像、音视频等多模态数据的引入,大模型的数据量也在飞速膨胀。这意味着想要玩转大模型,必须拥有大算力。

而一套垂直大模型的训练和推理成本,做个参考,在数字人垂类技术场景中,可以做到比Open AI同参数规模的模型低一个量级,像启元世界的战略总监王思捷就曾提到:先构建更小的垂类模型(比如百亿参数、十亿参数),让数据飞轮和模型训练能够很好结合,垂类模型在某些领域可能比Open AI的效果更好成本更低。

即便垂直大模型在算力要求上已远远低于通用大模型,但对算力基础设施的投入依然会阻挡部分小公司的入局。

再说算法。

在三要素中,算法的研发难度相对较低,每家公司都有自己实现大模型的路径算法,且有众多开源项目可作为参考,中国公司最容易缩短甚至抹平差距。

最后说数据。

高质量的数据是助力AI训练与调优的关键,足够多、足够丰富的数据,是AI大模型的根基。

OpenAI此前披露,为了AI像人类那样流畅交谈,研发人员给GPT-3.5提供多达45TB的文本语料,相当于472万套中国“四大名著”。这些语料的来源包括维基百科、网络文章、书籍期刊等,甚至还将代码开源平台Github纳入其中。

但是聚焦到细分行业,数据的获取就没那么容易了。

兴业证券公开表示,要训练专业的行业大模型,优质的行业数据、公共数据至关重要。

就国内数据市场而言,据发改委官方批露,我国政府数据资源占全国数据资源的比重超过3/4,但开放规模不足美国的10%,个人和企业可以利用的规模更是不及美国的7%。

而行业数据更是非常核心的私域数据,私域数据量越大,质量越高,就越有价值。

比如,一个医疗公司拥有大量医疗数据、病例数据,那么它就能开发出医疗垂直大模型类的产品。同理,建筑行业的项目数据、金融行业的用户画像数据、海运行业的船位数据等,都是赋能垂直大模型的关键。

但是这些私域数据都攥在企业自己手中,而且为了数据安全和合规,绝大部分机构是要本地化部署才会尝试大模型训练,很难想象企业会把自己的核心数据拿给别人去训练。

此外,如何合理地给数据打上分级标签、做好标注也非常重要。数据分级分类能够帮助产品提效,而高精度的标注数据能够进一步提升大模型的专业表现。

但现阶段垂直行业想要获取高精度标注数据的成本较高,而在公开数据库中,行业专业数据也较少,因此对垂直大模型的建构提出了很高的要求。

总体而言,想要做好垂直大模型,数据的重要性,远超过算力和算法。

数据,已成为企业突破垂直大模型的“卡点”。

03手握行业数据领先一步

垂类大模型讲求应用与场景先行的逻辑,而在国内更是强调产业侧的价值。

一方面,在当前中国的智能化浪潮下,产业侧数字化革新本就有广阔的市场需求;另一方面,在toB生态下,基于垂直应用的实践也有利于形成数据飞轮与场景飞轮。

而这一切的前提,是推出垂类大模型的公司在该行业已建立技术壁垒与护城河,即“人无我有”的竞争优势。

如此看来,在垂直行业深耕多年的企业或将有更大的赢面。

这类企业在数据层面、大模型以及知识图谱方面都有较为深厚的积累,对于大模型的优化更具优势。同时,它们对于to B客户需求和落地场景有很深的理解,能够更好地保证垂直大模型产品的可信和可靠,满足企业级对于安全可控合规的需求。

目前,已有一些垂类大模型在金融、教育、医药、营销等场景中得到试炼。

例如,彭博社利用自身丰富的金融数据源,基于开源的GPT-3框架再训练,开发出了金融专属大模型BloombergGPT;

网易有道则面向教育场景,推出自研的类ChatGPT模型“子曰”;

在ChatGPT发布后仅几周,谷歌公布了一个专门用于回答医疗保健相关问题的大型医用语言模型Med-PaLM......

相信随着越来越多企业入局,垂直大模型在各个行业和细分领域中将大量涌现。而那些能将一个垂直领域做专、做透,用高质量的数据持续优化模型,跑通商业闭环,构建起产业生态的企业,最终将把价值链做到足够长。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-05-19 17:45:21

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

林达华谈大模型发展之路:未来会有更高效的模型结构出现
大模型的上下文长度快速增长,超长上下文解锁新应用,但推理计算代价高昂,上下文本身对于信息不会进行压缩,不能直接捕捉其中的深层知识和规律。上海人工智能实验室领军科学家林达华。过去一
2024-03-25 10:53:00
百度副总裁侯震宇:AI技术突破口在于前沿理论研究,探寻突破Transformer方法
...体,深入产业”战略,遵循“芯片层”、“框架层”、“模型层”、“应用层”的“四层逻辑”,文心千帆大模型将为企业用户同时提供公有云及私有化部署。近日,百度董事长李彦宏曾在一次内部
2023-05-10 03:00:00
深化应用场景:泰康在线保险“大模型”赋能全业务
自ChatGPT横空问世,人工智能-大模型技术成为全球关注焦点,带来新一轮科技革命浪潮。站在人工智能颠覆保险产业现状,洗牌旧竞争格局的新历史时期,泰康在线作为科技互联网财险公司,
2025-02-20 09:02:00
百度All in的大模型何时能赚钱?
...供更加个性化、智能化和便利化的产品和服务。但是,大模型作为动辄投入数十亿的项目,故事势必要从巨头们讲起,而作为这场大模型竞争中的主要玩家之一,率先发布文心一言的百度不可谓不是
2023-10-27 18:02:00
...月11日电 (记者栗翘楚)当下,各行各业都在加速拥抱大模型。近期,由工信智库联盟指导,百度发展研究中心联合中国信通院、中国新一代人工智能发展战略研究院、中国互联网络信息中心等
2024-10-11 16:55:00
讯飞医疗:医疗大模型第一股,强势登陆港交所
...疗在香港交易所主板成功挂牌上市,成为香港市场医疗大模型第一股。此次IPO不仅是科大讯飞分拆上市的重要里程碑,也是中国人工智能医疗领域的一次重大突破。本次IPO,公司预计募资净
2024-12-30 10:03:00
手机银行APP变身“金融Siri”:你的理财顾问会是个聊天框吗
当下,大模型技术正以“摩尔定律”般的速度迭代,国产DeepSeek大模型以开源生态掀起“技术平权”飓风,在这场生成式AI从实验室跃进产业深水区的历史进程中,金融机构的数字化命运正
2025-03-03 15:09:00
字节猛踩油门
...节跳动旗下火山引擎面向企业市场发布了豆包1.5深度思考模型,同步升级文生图模型3.0、视觉理解模型,并推出OS Agent解决方案及AI云原生推理套件
2025-04-18 22:26:00
大模型重塑电商,淘宝、百度、京东讲出新故事
配图来自Canva可画随着AI技术日渐成熟,大模型在各个领域的应用也越来越深入,国内互联网行业也随之进入了大模型竞赛的后半场,开始从“百模大战”转向了实际应用。大模型从通用到细分
2024-03-29 10:00:00
更多关于科技的资讯:
晚上6点半,杭州遥望科技大楼的直播间里,灯光亮如白昼。小五对着镜子最后检查了一下妆容,深吸一口气,走向镜头。五年前,她站在黑龙江齐齐哈尔的寒风中
2025-12-12 08:08:00
如果未来的高速公路能像人一样“思考”,预判几公里外的风险;如果跨海大桥有“专属医生”,能飞檐走壁进行体检;如果服务区不再只是简简单单的驿站
2025-12-12 08:09:00
河北新闻网讯(杨春辉)如何深化信贷业务专业化能力,推动一线员工全面掌握产品体系与营销策略,从而为“一池两新万企”行动提供坚实支撑
2025-12-12 06:53:00
12月10日-12日,由浙江传媒学院主办、浙江传媒学院实践教学与艺术创作中心协办的 “剧想天开”——《儿童剧人物造型设计创新人才培训》成果展在杭州时尚中心正式展出
2025-12-12 07:07:00
站在4K摄像机前,主播“俍一”落落大方,此刻她站在演播室里,但直播间的观众们看到的却是由AI实时生成的背景。这样的场景在以前是不可想象的
2025-12-12 07:08:00
家电业创新驱动拓蓝海
家电业正朝着绿色、智能化方向升级,既精准匹配消费者需求,也开拓了市场新空间从电视、冰箱、洗衣机的传统“三大件”到智慧互联
2025-12-12 07:14:00
今年“双12”,南京企业捧出主题多元、内容丰富的促消费活动,推动消费市场提质扩容据悉,今年南京将“双12”作为南京市“四季有约·暖冬跨年庆”促消费活动的重要节点
2025-12-12 07:14:00
在直播间买了商品退货难、赔付慢等情况一直是困扰消费者的难题,临近“双12”,由杭州高新区(滨江)市场监管局联合辖区内头部直播电商企业共同起草的团体标准《放心消费直播间管理与运营规范》(以下简称《规范》)正式发布
2025-12-12 07:38:00
鲁网12月11日讯近日,建设银行泰安分行高效推进网点服务数字化转型,顺利完成泰安花园支行、新泰向阳支行、新汶翟镇支行、东平白佛山支行等4家网点的排队机轻量化叫号模式试点改造
2025-12-11 14:40:00
意大利ICA意卡亮相大湾区设计论坛:以色彩、技术与资源,赋能设计师
2025年广州设计周于12月5日至8日盛大开幕,在广州保利世贸博览馆、广州国际采购中心及海珠国际会展中心三馆共18个展厅同时举行
2025-12-11 14:53:00
苏大课堂来了位虚拟数字人老师
近日,在苏州大学传媒学院副教授程曦的《新媒体运营》课堂上,迎来了一位与她外型一模一样的虚拟数字人老师,只要是关于课程中的问题
2025-12-11 14:57:00
中新经纬12月11日电 11日,“网信中国”微信号发布汽车行业网络乱象专项整治行动公开曝光第二批典型案例。近期,国家网信办会同工业和信息化部等部门持续开展汽车行业网络乱象专项整治行动
2025-12-11 15:10:00
鲁网12月11日讯走进建行青岛市分行瞿塘峡路支行,大堂经理正俯身协助客户核对账单、同步讲解线上查询技巧;城阳支行营业部里
2025-12-11 15:17:00
【儒商风采】德州市恩锋企业管理咨询有限公司董事长李媛媛:先做朋友,再做生意
鲁网12月11日讯(记者 赵洪斌 通讯员 赵慧)“让一个企业家在半小时内,向陌生人交底,说出自己公司的核心难题——这事儿
2025-12-11 15:17:00
全国首展 即刻登艇!来北京apm 跟随minini小伙伴们开启一场冬日巡礼
2025年12月5日至2026年1月31日,minini 2025冬季假日系列全国首展,重磅登陆北京apm!此次主题展以“冬季巡礼”为核心脉络
2025-12-11 15:23:00