• 我的订阅
  • 科技

推理成本直降99%!百川智能「1+3」矩阵揭秘,两张4090玩转旗舰新模型

类别:科技 发布时间:2024-11-04 09:50:00 来源:新智元

推理成本直降99%!百川智能「1+3」矩阵揭秘,两张4090玩转旗舰新模型

【新智元导读】大模型热,企业落地难?就在刚刚,百川智能推出「1+3」产品矩阵,一站式解决大模型商业化难题。「系列优质通用数据+领域增强训练工具链」,仅需10分钟就能让企业自主成为模型定制增强专家,实现行业最佳的多场景可用率。

大模型热两年后,将大模型融入业务场景、组织流程,提高产品和服务质量,已经成为越来越多企业的共识。

不仅如此,员工们也希望能用AI提升工作效率,甚至打破职业发展的天花板。

然而,许多企业在落地的具体过程中,却面临着众多痛点,困难重重。

推理成本直降99%!百川智能「1+3」矩阵揭秘,两张4090玩转旗舰新模型

AI正以意想不到的规模融入工作场所:帮助节省时间(90%),专注于最重要的工作(85%),变得更有创造力(84%),并且更享受工作(83%)

AI商业落地困难重重,何解?

首先,成本就是一大难关。

现实问题是,该给大模型买多少算力?投多少人做数据治理、训练模型?需要多少人做运维?

第二,数据隐私与安全,也是让不少企业望而却步的重要原因。

B端企业往往对数据隐私要求较高,但大模型通常是由第三方提供,这个过程中就存在数据泄露的风险。

比如,一家医疗公司计划将大模型用于患者诊断,但担心数据传输到第三方模型提供商的服务器,会泄露患者隐私。虽然可以进行数据脱敏,但脱敏后的数据精度降低,也会降低模型效果。

第三,模型的集成与部署复杂,需要专业技术团队的支持。

B端用户的技术栈各不相同,现有的大模型可能需要大量调整,才能与企业现有系统集成。

比如某零售公司想要将大模型嵌入到内部CRM系统中,但由于API接口与现有系统不兼容,他们就需要开发大量中间接口,在内部数据安全防护上花费额外资源。结果就是项目推进极慢,还需要大量技术支持。

还有一种情况是,通用模型虽然有全领域能力,但是很多具有独特专业知识的行业和场景却无法直接应用。

比如在大模型落地工业场景上,施耐德电器数字化就提出了这样的「两难问题」——制造业企业的数据、知识、经验无法分享,导致数据流动差,难以出现垂直行业大模型;单个企业出面做私有化垂直的微调大模型,则会成本过高、维护难度过大。

此时,就需要结合客户领域和场景对通用大模型进行定向调优和增强。

然而,这个过程更是存在诸多痛点:缺少全链路增强的训练工具和框架;缺少与原模型匹配的通用训练预料;缺少模型训练的超参数、数据标注、数据清洗、配比等训练经验……

显然,今天的AI仍处于钻木取火的阶段,谁能攻破以上难题,让企业可靠、经济、易用地使用大模型,谁就能率先拿下一城。

这时,我们需要的是一套完整的工业级解决方案。

而就在昨天,百川智能正式面向企业用户,发布了「1+3」一站式大模型商业化解决方案,包括全链路优质通用训练数据、Baichuan4-Turbo、Baichuan4-Air两款模型,以及全链路领域增强工具链。

推理成本直降99%!百川智能「1+3」矩阵揭秘,两张4090玩转旗舰新模型

「1+3」的组合,覆盖了从数据构建、模型训练到强化调优、部署运营的全流程。

通过这个产品矩阵,企业既能保障自身数据和隐私安全,还能以较低成本高效实现效果最佳的大模型私有化部署,用大模型赋能多种业务场景。

一言以蔽之,工具多、部署快、效果好、成本低。

搭配自用通用优质训练数据,多场景可用率高达96%

当前,AI社区已经有很多高质量的LLM可以免费获取,诸如Llama、Gemma等等。

它们具备了强大的通用泛化能力,然而,由于每个企业都拥有自身独特的专业知识和应用场景,直接应用通用模型难以达到理想效果,因此必须对模型进行定制化优化从而适应特定领域和场景的需求。而优化后模型在多场景下的可用率是评估其价值的关键标准。

目前,行业主流的定制化优化方式有两种:用场景数据微调;场景数据混合开源通用数据微调。

推理成本直降99%!百川智能「1+3」矩阵揭秘,两张4090玩转旗舰新模型

数据显示,仅用专业数据微调模型,多场景可用率是84%。

若是利用行业公开的通用数据,或者自建通用数据集,外加专有数据进行领域增强训练,可用率会有所提升,但也只能提升2%。

以上这些还不是最优解,因为对于很多企业来说,多场景可用率低于90%基本上就是不可用的状态。

导致这种情况的主要原因是,受限于诸多因素,企业在混合微调时只能自建或者使用开源的通用数据,很难获得与原模型高度匹配的通用训练数据,因此即便经过调优,模型也有很大概率会失去通用性,变成无法应对多个场景的专用模型。

这次,百川智能直接给出了其自用的预训练通用数据、SFT微调通用数据以及强化学习过程中的通用数据。

同时,自研的超参自动化搜索和调优技术、数据动态自适应配比技术等训练经验和技术,也都一并封装成工具,给到企业使用。

用白话说就是,Baichuan4-Turbo、Baichuan4-Air用到的高质量通用训练数据和训练技巧,都在里面!

评测结果显示,在使用百川智能优质通用训练数据与企业专有数据混合微调后,模型在金融、教育、医疗等场景下的专业细分任务的平均可用率高达96%。

相比不混合通用数据提升12%,混合开源通用数据提升10%。

相较于其他行业解决方案,百川智能取得了最新的SOTA,这也从侧面证明了模型想要在企业场景下取得优秀表现,需要的是专有数据与和原模型高度匹配的通用数据的「混合增强」。

推理成本直降99%!百川智能「1+3」矩阵揭秘,两张4090玩转旗舰新模型

模型升级:Baichuan4-Turbo两张4090即可部署,Baichuan4-Air推理成本下降99%

接下来,如何将Baichuan4-Turbo、Baichuan4-Air应用在实际场景中?

从名字中不难看出,它们都是Baichuan 4系列基础模型的升级。

对于企业来说,在不同场景阶段,对模型性能和成本要求各不相同。

在复杂场景探索阶段,他们更加关注模型性能、部署成本。

而在已验证过的大规模落地阶段,他们更侧重模型推理成本、响应速度。

这次新发布的两款模型,分别应对不同阶段的客户落地场景,效果更好,成本更低。

复杂场景探索:Baichuan4-Turbo

其中,Baichuan4-Turbo属于旗舰模型升级版。

它适合复杂场景的初期探索阶段,尤其适用于对于初始部署成本(比如显存)较为敏感的场景。

对于B端企业用户,大模型时常会遇到极为复杂的场景,这时就对模型能力提出了很高的要求。

比如在一个金融机构中,需要实时分析海量交易和市场数据,还要检测异常交易、反欺诈,预测信用风险等等。

推理成本直降99%!百川智能「1+3」矩阵揭秘,两张4090玩转旗舰新模型

此时就需要大模型能够整合动态数据与多模态处理、具有强大的模型识别与实时预测能力。

这样它才能快速集成结构化(交易记录)和非结构化数据(文本),并进行跨模态的信息分析。并且,它还能对数据中的微小变化做出快速响应,识别风险信号。

针对以上场景,Baichuan4-Turbo就是一个极具性价比的选择。

相比Baichuan 4,Baichuan4-Turbo在B端客户高频应用场景上,效果均有显著提升。具体来说,分聚类提升了9.09%、多语言提升了31.43%、信息摘要提升了50%、生成提升了12.77%。

而在成本上,通过w4kv4等infra量化,Baichuan4-Turbo仅需2张4090,即可达到GPT-4o效果。

可以说达到了旗舰模型的行业最低,仅为Baichuan 4的15%。

在响应速度上也更快,其中首token速度提升了51%、token流速提升了73%。

广泛应用:首个MoE模型Baichuan4-Air

Baichuan4-Air则是Baichuan 4系列中的低成本极速版,同时也是百川智能发布的首款MoE模型。

它适合中等复杂及简单场景的广泛应用阶段,尤其是请求量大、推理成本敏感型的场景。

比如电商搜索和推荐、智能客服与对话机器人,都属于这一类。

电商平台的用户访问量大,产品浏览和搜索请求频繁发生,此时模型无需深层理解用户的全部行为,只需提供较高相关性的推荐即可。

推理成本直降99%!百川智能「1+3」矩阵揭秘,两张4090玩转旗舰新模型

而在智能客服场景,银行、零售、物流等企业的在线客服系统往往有高并发的用户咨询,用户问题相对简单、重复性高,不涉及复杂情感理解和多轮对话。

此时,相比复杂大模型,轻量化的模型就能实时响应海量请求,在不牺牲速度的情况下回答大量简单的用户咨询,企业也不必承受复杂模型带来的高计算成本。

Baichuan4-Air,正是为这类用户量身打造。

它的效果和Baichuan 4基本持平,但价格只有后者的1%——0.98厘/千tokens,目前行业最低。

同时,它的响应也更快,首token速度提升了77%、token流速提升了93%。

值得一提的是,作为百川智能的首个MoE模型,Baichuan4-Air 行业首创了PRI架构,巧妙融合了Pyramid(金字塔架构)、Residual(残差结构)、Interval(区间结构)三种配置方式。

与标准的MoE架构相比,Baichuan4-Air的MoE架构保持了MLP(多层感知机)和Attention(注意力机制)的内部结构不变,仅对混合专家MLP层的配置方式进行优化,通过合理配置专家数量和激活策略,能够更好地平衡计算负载,减少计算量,提高推理速度。

正是由于这种MoE架构上的创新,Baichuan4-Air在时效率和模型性能上均表现优异。

在相同训练数据下,Baichuan4-Air不仅时效率更高,性能也大幅领先于GPT4-style、Mixtral-style结构的MoE模型。

推理成本直降99%!百川智能「1+3」矩阵揭秘,两张4090玩转旗舰新模型

至此,所谓停止预训练模型的谣言,也就不攻自破了。

全链路领域增强工具链,覆盖模型部署全流程

作为「1+3」产品矩阵中的「1」,从数据处理、增量预训练、模型微调、强化学习、提示词优化,到评测、量化、部署,「全链路领域增强工具链」全面覆盖了私有化部署的所有关键环节。

推理成本直降99%!百川智能「1+3」矩阵揭秘,两张4090玩转旗舰新模型

模型训练经验+高效训练框架

值得一提的是,百川团队基于数万亿token的训练实战经验,全部开放。

这其中,微调数据自动化增强、标注工具、数据配比搜索策略等,全部被封装到全生命周期工具包中,企业直接可用。

在整套工具链中,还包含了百川开放的高效训练框架。

相较于开源方案,基于百川成熟的训练框架,能在相同收敛结果下,将训练速度提升数倍。

与此同时,它还支持RAG、Agent能力定制化,以及超长窗口训练等高级功能。

这些能力,能够帮助企业在更短时间内,完成复杂模型训练任务。

得到微调模型后,在部署前还需进行全面的模型评测。

「全链路领域增强工具链」中提供了一站式模型评测方案,不仅包含了行业标准的基准测试,还包含了全面自动评测功能。

一方面,能够帮企业了解模型相对表现;另一方面,还能为其模型优化提供精确指导。

不仅如此,通过大量的适配工作,百川智能还实现了多平台适配的私有化部署方案,和英伟达、华为、寒武纪、高通、MTK、天数等主流芯片都能适配。

推理成本直降99%!百川智能「1+3」矩阵揭秘,两张4090玩转旗舰新模型

多、快、好、省,深受合作伙伴好评

那些拿到内测资格的客户,纷纷对百川智能两款新模型、全链路领域增强工具链,给出了好评。

新致软件称,百川的工具包为LLM开发带来了革命性的提升。

这套工具不仅能够有效处理私有数据资产,还可以与百川优质通用数据融合训练,从而显著提升了最终模型的表现效果。

另一个案例来自信雅达。

他们的实践表明,Baichuan4-Turbo在硬件需求方面实现了重大突破——仅需2张4090显卡即可流畅运行,大幅降低了基础设施投入成本。

更令人瞩目的是,自部署该模型以来,他们在业务层面取得了显著成效:客户满意度提升15%,运营效率更是实现了近30%的增长。

以上,这些数据充分证明了百川智能的一站式解决方案,在实际应用场景中的卓越表现。

截至目前,百川智能已经服务了数千家客户,不仅有北电数智、完美世界游戏等行业领军企业,还与多家行业生态伙伴,以及运营商达成合作,携手构建百川大模型生态。

随着生态朋友圈不断壮大,百川的实践证明,LLM的落地不是遥不可及的未来,而是触手可及的现实。

最终实现,让更多企业以更低门槛、更高效率拥抱AI时代,推动各行各业的升级。

参考资料:

https://platform.baichuan-ai.com/homePage

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-11-04 12:45:01

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

百川智能、阿里云等进入开源大模型领域,开启商业化前奏
...8、9月份推出的开源大模型则包括阿里云Qwen-7B、Qwen-14B,百川智能Baichuan2-7B、Baichuan2-13B等
2023-10-14 00:21:00
百川智能发布baichuan3稳定语言模型
1月29日,百川智能发布超千亿参数的大语言模型Baichuan3。在多个权威通用能力评测如CMMLU、GAOKAO和AGI-Eval中
2024-01-29 19:57:00
“AIGC智算之道”圆桌对话: 浪潮信息+百川+快手+金山办公
...,智算发展之道”圆桌论坛,与浪潮信息高级副总裁刘军、百川智能技术联合创始人陈炜鹏、快手异构计算负责人刘凌志、金山办公技术总监熊龙飞围绕大模型时代的智算机遇、痛点与破局之道展开
2023-09-13 18:00:00
李开复辟谣「掉队」传闻,零一万物推「白菜价」顶级模型
...国内的大模型创业公司「六小虎」(月之暗面、Minimax、百川智能、智谱 AI、零一万物、阶跃星辰)开始在不同的道路上做出选择
2024-10-22 09:57:00
商汤升级“日日新5.0”大模型,对标GPT-4Turbo
...理时上下文窗口达200K左右。云、端、边全栈大模型产品矩阵中,用于终端设备的“商汤端侧大模型”可满足各类终端用户对大模型技术的应用需求。“日日新5.0”和GPT-4回答趣味推
2024-04-24 09:32:00
对话王小川:国内在技术理想上拼不过OpenAI,但应用落地会跑得更快
...6月15日、7月11日、8月8日。这是王小川自4月10日官宣创办百川智能入局AI大模型创业以来,先后推出三个大模型的时间
2023-08-09 15:00:00
王小川公布最新530亿百川大模型,阿里腾讯等超150家企业已使用
百川智能创始人兼CEO 王小川成立120天,王小川的大模型公司百川智能又有了新动作。钛媒体App获悉,8月8日下午,百川智能在北京发布530亿参数通用大模型Baichuan-53B
2023-08-09 15:00:00
...于同属于国产大模型“六小虎”的MiniMax(2021年成立)、百川智能(2023年成立)、月之暗面(2023年成立)
2025-04-20 08:29:00
阿里云通义千问主力模型价格直降97%,大模型商业化拐点已至
...供更丰富的模型和工具链。阿里云百炼平台上汇聚通义、百川、ChatGLM、Llama系列等上百款国内外优质模型,内置大模型定制与应用开发工具链,开发者可以便捷地测试比较不同模型
2024-05-22 16:18:00
更多关于科技的资讯:
莆田荔城区成立鞋服产业链特聘专家团,引领产学研用协同创新莆田鞋踏“新”而行东南网1月18日讯(福建日报报业集团记者 陈汉儿 通讯员 林佳媚)企业研发人员拎着样品到高校测试
2026-01-19 00:15:00
连日来,随着新一轮国补及我省以旧换新政策的实施,不少市民将家电和电子类产品纳入了年货的购物清单,春节前的消费市场愈发活跃
2026-01-18 20:22:00
2026年是“十五五”开局之年,作为东部沿海经济大省,浙江如何迈好第一步、展现新气象?新年伊始,宁波舟山港梅山港区一片繁忙
2026-01-18 20:33:00
2026山东电信渠道终端生态大会成功举办
1月16日,以“智能领航,智惠共生”为主题的2026中国电信山东公司(以下简称“山东电信”)渠道终端生态大会在济南成功举办
2026-01-18 22:14:00
守护岁月的瑰宝:贤纯Wispure联名央视《国家宝藏》重磅发布“分龄鲜蒸猫粮”
2026年1月17日,贤纯Wispure正式宣布,携手央视顶级文化IP“《国家宝藏》”*推出联名系列“分龄鲜蒸猫粮”。该系列产品已在抖音
2026-01-18 22:15:00
华夏银行临沂分行发布宠物行业生态圈暨萌宠主题卡 以金融力量赋能琅琊“萌宠经济”
鲁网1月18日讯2026年1月18日,华夏银行临沂分行在万达广场举办“宠物行业生态圈暨萌宠主题卡发布会”。本次活动以“金融赋能生活
2026-01-18 19:56:00
当河南周口郸城县影院的太空舱躺椅坐满返乡青年,当北京“影院新空间”变身球迷狂欢的第二主场,当三、四线城市IMAX厅票房年增85
2026-01-18 19:10:00
吉林大学19个专业停招
近日,吉林大学正式更新本科专业设置情况,141个本科专业的布局调整引发关注。据1月12日校方公开信息,吉林大学共有141个本科专业
2026-01-18 19:48:00
中新经纬1月18日电 据路透社1月18日报道,据周五提交的法庭文件显示,埃隆・马斯克正向OpenAI及微软公司索赔最高1340亿美元(约合人民币超9340亿元)
2026-01-18 12:53:00
厦门网讯(厦门日报 佘峥)1月20日起,厦门大学思明校区访客预约入校方式改变,将采用“线上预约+摇号”形式。厦大保卫处近日发布消息
2026-01-18 08:43:00
河北日报讯(记者王璐丹)近日,平方公里阵列天文台(SKAO)官网发布消息,位于南非的平方公里阵列中频射电望远镜(SKA-Mid)首次成功获得干涉条纹
2026-01-18 07:54:00
人工智能如何赋能“安徽万物”?
大皖新闻讯 1月16日,《安徽省“人工智能+万物”应用行动方案》发布,到2030年,安徽“人工智能+万物”应用落地将超万个
2026-01-17 21:56:00
鲁网1月17日讯1月13日上午,普惠(临沂)投资服务有限公司考察组一行赴临沂市供应链金融协会开展学习交流活动。临沂市供应链金融协会会长
2026-01-17 14:47:00
1月16日,全球最大、起重量达2300吨的桥面吊机在河北省秦皇岛市一装备制造企业正式下线,标志着我国在大型桥梁施工装备领域又获重大突破
2026-01-17 15:44:00
2026天然苏打水市场趋势:健康化、场景化成主流 泉匠深耕多区域市场实现销量突破
随着健康消费理念的深度渗透,天然苏打水行业正迎来高质量发展的黄金期。据行业权威报告预测,2026年中国天然苏打水市场规模将突破260亿元
2026-01-17 15:58:00