• 我的订阅
  • 财经

百川智能、阿里云等进入开源大模型领域,开启商业化前奏

类别:财经 发布时间:2023-10-14 00:21:00 来源:财经风云

闭源商业化的“百模大战”暂告段落,开源大模型仍旧热闹。

今年7月Meta推出开源且免费的大型语言模型LLama2后,基于该模型微调的大模型不断涌现。此外,阿联酋阿布扎比技术创新研究所推出大参数模型Falcon180B,国内8、9月份推出的开源大模型则包括阿里云Qwen-7B、Qwen-14B,百川智能Baichuan2-7B、Baichuan2-13B等。近日,香港中文大学贾佳亚团队还联合MIT发布长文本开源大语言模型LongAIpaca,号称全球首个70B参数长文本开源大语言模型,显示开源之潮还在继续涌动。

业界和学界对大模型开源感到兴奋。截至发稿日,以“LLama2”为关键词在全球知名AI开源社区HuggingFace检索模型,有超6000个结果。百川智能创始人王小川透露,截至9月初,旗下两款开源大模型下载量超过500万。

大模型开发者林峣(化名)告诉记者,7月他发布了基于baichuan-13B微调的大模型,没想到8月底该模型在HuggingFace的下载量超160万次。他还在做开源大模型微调,在与其他做大模型的技术人员交流中,他发现很多公司为了较低成本和高效率,也在基于开源模型做微调。

越来越多AI工作者和企业参与进大模型开发,悄然改变了大模型生态。不久之前,业界还在争论谁“造轮子”(做大模型)谁“用轮子”(基于大模型开发应用),高昂的训练成本将中小型企业挡在大模型开发的门外,似乎只能面对不低的大模型服务定价。如今,事情发生了改变。

开源潮流涌动

从GPT3.0开始,OpenAI便不“Open”了,基于GPT3.5开发的ChatGPT火爆全球后,OpenAI还推出了收费版本。一众类GPT大模型一开始也以闭源方式呈现,不少商业公司将开发的大模型用于自身业务优化并对外开放合作。

大模型分为训练和推理两个过程,前者将大模型训练成型,后者即为应用。由于训练大模型需极大算力,开发成本高昂,业界多有关于不需“重复造轮”的讨论。例如,入场做大模型后,百度创始人、董事长兼首席执行官李彦宏屡次呼吁行业聚焦大模型的应用层,称创业者“卷大模型没意义,卷应用机会更大”。业内另一种声音则是通过大模型开源,在免除前期高昂模型训练成本的情况下引入更多参与者,加速大模型生态进化。

对难以入场训练大模型的企业而言,使用其他企业的闭源大模型服务有成本偏高的弊病。记者从使用GPT大模型服务的SaaS厂商了解到,用GPT4替代200名客服的成本达数十万美元。

基于长远考虑,北京智源人工智能研究院院长黄铁军近日接受第一财经记者采访时则表示,技术本身不断迭代演进,不能封闭在少数公司里,第三方参与者汇聚成洪流,将来可能成为大模型时代的技术底座,而不是变成某个公司作为运营商的形态。

在学界和业界的强劲需求下,开源之潮涌动。今年年初Meta推出LLama大模型后,一场源代码泄露风波,促使基于LLama构建的多个大模型涌现,Meta“从善如流”,7月发布了LLama2开源可商用版本。国内,北京智源人工智能研究院于6月发布开源可商用的悟道3.0大模型,随后,百川智能、阿里云等进入开源大模型领域。

百川智能、阿里云等进入开源大模型领域,开启商业化前奏

开源大模型涌现后,生态变化明显。林峣向记者回忆道,LLama开源极大推动开源大模型社区繁荣,业界发现可以基于LLama用较少成本在一些场景中逼近ChatGPT的效果,随之Ziya、Linly、Chinese-LLama-Alpaca等汉化版LLama出现,后续还出现许多原生中文开源模型。得益于生态活跃,林峣的大模型项目已发布了基于baichuan2-13b、LLama-30B、Qwen-7B等主流开源大模型微调的模型。记者所在的一个数百人大模型交流群中,每天都有从业者交流如何匹配客户需求及开源大模型相关技术细节。

对业界而言,除免费商用、部署成本较低之外,开源大模型还有一些难以取代的优势。林峣告诉记者,开源意味着自主可控、可在开源大模型基础上按需自行训练定制,使其更好应用于自身业务。而闭源模型如文心一言、讯飞星火等仅提供接口,无法再进行训练,OpenAI的大模型提供了训练接口,但训练时可能涉及企业机密数据泄露问题。

使用外部闭源大模型已引发业界关于数据泄露的担忧。此前,三星在内部使用ChatGPT等外部AI工具,曾导致机密信息外流,今年5月,有消息称三星担心传输至生成式AI平台的数据被存储在外部服务器上,已禁止员工使用ChatGPT、谷歌Bard等生成式AI工具。

开源之后

对大模型企业而言,开源与闭源并不矛盾,企业在开源与闭源、收费与免费之间选择,阿里云是在闭源大模型推出后,发布了免费可商用的Qwen-14B和Qwen-4B-Chat等,百川智能则是在推出开源可免费商用的多款大模型后,9月底推出闭源大模型Baichuan2-53B,并开放该模型API接口且启动商业化。

“厂商开源参数量较小的模型可产生影响力、构建生态,对于参数量更大的模型则可商业化。或者开源大模型厂商可收取商用授权费,或在开源模型后售卖云服务、算力、模型定制化服务。”林峣认为,这是开源大模型厂商可能的盈利路径。

虽然开源大模型目前还在市场竞争初期,不少模型并未收费,但业界仍有探索盈利的动作。今年6月发布的开源大模型ChatGLM2-6B一开始商用并不免费,7月,智谱AI和清华KEG实验室才决定该模型可免费商用。同时拥有闭源大模型和开源免费大模型的百川智能、阿里云等企业,推出开源免费大模型客观上也有打开知名度的作用。

大模型不仅在训练时需要算力,在推理时也需要算力,记者了解到,从业者获取开源大模型后进行微调和推理,计算量小的情况下或只需一张显卡,商用后则免不了部署算力。云厂商可承接这部分算力需求,一批云厂商近期也闻风而动。

百度智能云此前已推出企业级一站式大模型平台千帆,9月还发布了千帆大模型平台2.0,将内置主流大模型数量增加至42个;腾讯云TI平台8月接入LLama2、Falcon等超20个主流模型,支持大模型直接部署调用且可全程低代码操作;阿里云魔搭社区也在积极接入主流大模型,包括baichuan2系列、InternLM-20B等。

此外,目前企业使用闭源大模型服务存在一定的安全顾虑,闭源大模型不仅源代码不被外部使用者掌控,还部署在特定的外部云服务器上,相比之下,开源大模型可定制化、可避开某些数据泄露风险的特点突出,企业可以选择部署在自有服务器或其他终端上,这带来了潜在商业机会。LLama2已与高通展开合作,高通计划2024年在旗舰智能手机和PC上支持基于LLama2的AI部署,推出生成式AI应用,实现用户隐私保护及个性化。

在应用大模型的问题上,隐私保护和个性化服务尤为重要。在近期第一财经记者参加的一场行业论坛上,高通AI产品技术中国区负责人万卫星谈到,AI处理的重心正向边缘端转移,大模型可根据终端侧数据提供个性化服务,且不需依赖任何网络连接,数据留在终端,可解决隐私问题。

或是考虑到开发者利用开源大模型微调或推理的成本,目前不少开源大模型的参数量低于GPT4等商用闭源大模型,多为70亿或130亿参数。有业内人士指出,这些参数较小的模型转而在预训练时使用大量数据,以提升最终表现,应用至垂直领域,大模型性能表现仍很强大。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-10-14 05:45:03

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

百川智能完成3亿美元A1轮融资,阿里、腾讯、小米等巨头参投
...叶峰《每日经济新闻》记者获悉,10月17日,王小川旗下百川智能官宣已完成A1轮战略融资,融资金额3亿美元,阿里、腾讯、小米、深创投等科技巨头及多家顶级投资机构参投。对于百川智
2023-10-17 16:54:00
王小川公布最新530亿百川大模型,阿里腾讯等超150家企业已使用
百川智能创始人兼CEO 王小川成立120天,王小川的大模型公司百川智能又有了新动作。钛媒体App获悉,8月8日下午,百川智能在北京发布530亿参数通用大模型Baichuan-53B
2023-08-09 15:00:00
作者|邓咏仪编辑|苏建勋36氪获悉,百川智能已完成A1轮3亿美元战略融资,投资方包括阿里、腾讯、小米等科技巨头及多家顶级投资机构。百川智能成立于2023年4月,由前搜狗公司CEO
2023-10-17 11:39:00
阿里云的AI路线图
...型系列就是基于阿里云人工智能平台PAI训练而成。此外,百川智能、智谱AI、零一万物、昆仑万维、vivo、复旦大学等企业及机构均在阿里云上训练大模型。人工智能馆围绕MaaS(模
2023-11-04 16:01:00
大模型时代的阿里云,将云计算进行到底
...模型社区,其中,通义千问开源版本累计下载超百万次,百川智能、智谱AI、上海人工智能实验室、IDEA研究院等业界顶级玩家都已将其核心大模型在魔搭上首发
2023-11-01 12:00:00
AI落地之夜,聊聊要未来的爆发还是要当下的效果|阿里云创业者社群
...航信、招商银行、同道猎聘等,大模型明星公司智谱AI、百川智能等,投资机构代表元璟资本等,研究机构IDEA,以及行业内众多上下游的创业公司,比如松应科技、Nolibox计算美学
2024-02-06 08:00:00
...智能化时代正在开启,AI将成为各行各业的新型生产力。百川智能创始人兼CEO王小川认为,大模型浪潮将超越外界之前所有的想象,技术大爆炸正在发生,人类已步入通用人工智能时代。20
2023-11-01 09:48:00
王小川公布最新大模型,号称全球最长上下文,是GPT-4的14倍|钛媒体焦点
搜狗创始人、百川智能创始人兼CEO 王小川国内大模型技术竞争加速,继讯飞星火、智谱推出最新产品之后,百川也迎来了新的大模型成果。钛媒体获悉,10月30日上午,王小川创立的 AI
2023-10-30 15:02:00
AI狂飙,谁是中国独角兽背后的「超级买家」?
...及AIGC及大模型领域的独角兽一共有4家,分别为智谱AI、百川智能、零一万物、Minimax名之梦。AIGC及大模型领域的独角兽一共有4家 图源
2024-01-23 20:00:00
更多关于财经的资讯:
2月9日晚间,温州意华接插件股份有限公司(下称“意华股份”,股票代码:002897)发布公告称,公司经审慎评估,决定将“乐清光伏支架核心部件生产基地建设项目”达到预定可使用状态的日期由2026年4月延期至2026年12月
2026-02-09 23:53:00
盘江股份电力板块2026年首月发电量超额完成6.75%
2月9日,记者从贵州盘江精煤股份有限公司获悉,2026年1月,公司电力板块超额完成月度发电目标6.75%,顺利实现首月发电量“开门红”
2026-02-10 02:44:00
2026年贵州将力争房地产开发投资完成1210亿元
2月9日,记者从2026年全省住房城乡建设工作会议获悉,2026年,贵州将力争房地产开发投资完成1210亿元、新增商品房销售面积2050万平方米
2026-02-10 03:47:00
铜仁闵孝镇开展写春联送祝福普法宣传活动
法润千家添福运,平安万户迎新春。春节临近,年味渐浓,为让法治精神随新春祝福一同走进千家万户,2月5日,“法治铜仁·平安相伴江口在行动——写春联送祝福”法治宣传活动走进铜仁市江口县闵孝镇街头
2026-02-10 03:46:00
中新经纬2月9日电 9日晚间,上海证券交易所、深圳证券交易所、北京证券交易所集体宣布,推出优化再融资一揽子措施。上交所指出
2026-02-09 20:46:00
中新经纬2月9日电 据财政部网站消息,近日,财政部、海关总署、税务总局联合发布《关于跨境电子商务出口退运商品税收优惠政策的公告》(以下简称《公告》)
2026-02-09 20:53:00
东南网2月9日讯(本网记者 林先昌)9日,福建省人民政府新闻办公室召开2025年福建省金融运行情况新闻发布会,会上发布了金融支持福建涉外经济发展情况
2026-02-09 21:26:00
多问一句别嫌烦 防范诈骗于未然——赫章农商银行成功拦截一起“跨境投资理财”类诈骗
2026年2月3日,赫章农商银行水塘堡支行在日常业务办理中,凭借敏锐的职业嗅觉和对客户负责任的态度,在客户遭遇诈骗时,耐心地“多问一句”
2026-02-09 22:01:00
多彩贵州网讯(记者 金星)乘着“一带一路”农业合作的东风,近日,贵州黔方有渔水产科技有限公司(以下简称“黔方有渔公司”)首批鲜活鳗鱼
2026-02-09 22:01:00
当森林防火的警钟在哲觉镇敲响,另一份关于“钱袋子”安全的守护,也悄然走进了群众身边。2026年2月3日,借助哲觉镇森林防火会议人员集中的有利时机
2026-02-09 22:02:00
中新经纬2月9日电 据香港证监会网站9日消息,凯银国际(香港)有限公司(下称:凯银)因基金管理缺失遭香港证券及期货事务监察委员会(下称
2026-02-09 22:22:00
威宁农信联社开展春节期间取现高峰应急演练,筑牢金融服务安全防线
为有效应对春节期间取现高峰与极端天气叠加的现金供应风险,近日,威宁农信联社组织开展春节期间取现高峰凝冻天气现金供应突发应急演练
2026-02-09 22:01:00
和邦生物在四川成立航运公司
近日,四川和邦航运有限公司成立,注册资本5000万元,经营范围包含:国内贸易代理;国际货物运输代理;装卸搬运;港口货物装卸搬运活动等。企查查股权穿透显示,该公司由和邦生物(603
2026-02-09 17:12:00
国家级茶树新品种‘豫茶2号’‘豫茶5号’宣讲会成功举行
大河网讯 2月5日,由信阳师范大学、大别山实验室联合主办的国家级茶树新品种‘豫茶2号’‘豫茶5号’专题宣讲会,在大别山实验室服务中心顺利举行
2026-02-09 17:15:00
致敬自强精神!仰韶酒业贺岁微电影《豫功移山》首映
大河网讯 2月8日,仰韶酒业2026年贺岁微电影《豫功移山》首映式在郑州举行。活动汇聚了政府领导、省酒协代表、文化学者
2026-02-09 17:15:00