• 我的订阅
  • 科技

百川智能发布Baichuan4-Finance大模型,金融场景能力领先GPT-4o近20%

类别:科技 发布时间:2024-12-24 09:16:00 来源:网易科技报道

12月23日消息,百川智能正式发布全链路领域增强金融大模型——Baichuan4-Finance。该模型金融专业能力和场景应用能力大幅领先GPT-4o,在中国人民大学财政金融学院新近发布的评测体系FLAME以及国内主流开源金融评测基准FinancelQ上均登上榜首。

据介绍,此次发布的Baichuan4-Finance基于百川智能自主研发的全链路领域增强技术方案,涵盖了从数据集构建、模型预训练到微调和强化学习的完整流程。尤其是在训练阶段,该模型首次引入领域自约束训练技术,使其在金融专业能力和多场景适配能力上实现了同步提升。

据悉,攻克了专项能力和泛化能力平衡问题这一模型落地应用的最大阻碍后,Baichuan4-Finance能够在效率提升、风控合规、客服、决策支持等诸多层面为金融行业带来全方位的价值提升。例如,它能够帮助金融从业者处理文档审核、客户咨询、产品营销等大量日常工作,还能依托深厚的金融专业知识和法律法规理解能力,为机构提供精准的风险识别和合规保障。此外,还可以凭借强大的数据分析能力为管理层提供专业的市场洞察和决策建议。

百川智能发布Baichuan4-Finance大模型,金融场景能力领先GPT-4o近20%

FLAME评测分为FLAME-Cer(金融资格认证能力评测)和FLAME-Sce(金融场景应用能力评测)两个方向,其中FLAME-Cer覆盖CPA、CFA、FRM等14类权威金融资格认证。在这一评测中,Baichuan4-Finance整体准确率达到93.62%,在银行、保险、基金等领域的准确率均突破95%,领先GPT-4o近20%。

而在FLAME-Sce的场景应用能力评测中,其一级核心金融业务场景的整体可用率达到84.15%,在金融数据计算和金融知识理论等细分场景中的可用率更是超过90%。

除了FLAME体系,Baichuan4-Finance在国内主流的金融评测基准FinanceIQ上也同样超越了GPT-4o和XuanYuan3-70B,整体准确率达到79.23%,领先GPT-4o近13%。

百川智能发布Baichuan4-Finance大模型,金融场景能力领先GPT-4o近20%

据介绍,百川智能为该模型构建了一套全面且严谨的金融数据集,覆盖了金融专业教材、顶级金融期刊论文、政策文件、金融法律法规等核心数据,同时囊括企业财报、研究报告、金融专业问答集等实践应用类数据。

为了进一步提升模型的通用能力和金融专项能力,百川智能在领域自约束训练中引入了混合数据策略。通过将高精度的通用数据与高质量的金融数据共同训练,Baichuan4-Finance不仅避免了模型能力单一化的弊端,还实现了通用能力和金融能力的双向增强。此外,在后续训练环节,百川智能通过合成数据和指令数据对模型进行微调,同时针对数学计算等关键场景进行样本增强,显著提升了模型的场景适配能力与执行效率。

软通动力指出,该模型完美契合了客户对通用能力与金融专业能力并重的需求,自部署以来,客户满意度提升了20%。(袁宁)

本文来自网易科技报道,更多资讯和深度内容,关注我们。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-12-24 12:45:02

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

推理成本直降99%!百川智能「1+3」矩阵揭秘,两张4090玩转旗舰新模型
【新智元导读】大模型热,企业落地难?就在刚刚,百川智能推出「1+3」产品矩阵,一站式解决大模型商业化难题。「系列优质通用数据+领域增强训练工具链」,仅需10分钟就能让企业自主成为
2024-11-04 09:50:00
数势携手百川发布大模型联合解决方案,推动中国大模型价值落地
...司(以下简称“数势科技”)和国内通用大模型厂商北京百川智能科技有限公司(以下简称“百川”)联合发布大模型数据分析垂直领域应用解决方案。此联合解决方案是双方能力耦合实现商业化的
2024-02-26 16:21:00
百川智能发布baichuan3稳定语言模型
1月29日,百川智能发布超千亿参数的大语言模型Baichuan3。在多个权威通用能力评测如CMMLU、GAOKAO和AGI-Eval中
2024-01-29 19:57:00
王小川公布最新530亿百川大模型,阿里腾讯等超150家企业已使用
百川智能创始人兼CEO 王小川成立120天,王小川的大模型公司百川智能又有了新动作。钛媒体App获悉,8月8日下午,百川智能在北京发布530亿参数通用大模型Baichuan-53B
2023-08-09 15:00:00
王小川公布最新大模型,号称全球最长上下文,是GPT-4的14倍|钛媒体焦点
搜狗创始人、百川智能创始人兼CEO 王小川国内大模型技术竞争加速,继讯飞星火、智谱推出最新产品之后,百川也迎来了新的大模型成果。钛媒体获悉,10月30日上午,王小川创立的 AI
2023-10-30 15:02:00
阳光保险谷伟:公司目标建设领先的混合式大模型平台和应用体系
...hatGPT、百度文心一言、腾讯混元、讯飞星火、阿里千问、百川、智谱等,随时利用其先进能力,做到与时俱进;对于保险行业垂域场景,采用在开源大模型上自研、与外部厂商合作共建、直
2023-11-20 23:09:00
让大模型“外挂硬盘”,百川智能发布新API系列,企业定制成本大大降低
...题在于——如何让大模型高效地在实际应用场景中落地?百川智能的最新实践是:用大模型+增强技术,可以大大提升企业应用大模型的效率。现在,全球大模型领域都在“开卷”长文本,这是目前
2023-12-21 15:32:00
...高新科技(天津)有限公司(以下简称聚力高新)、北京百川智能科技有限公司(以下简称百川智能)签署战略合作协议,在天开园成立百川智能北方运营中心和大模型场景应用联合实验室,标志着
2024-11-10 13:42:00
大模型行业资本暗流涌动,10亿元融资成入局门槛?
...队能力等多方面的综合实力。其中,智谱AI、月之暗面、百川智能、MiniMax、零一万物、阶跃星辰、中科闻歌和面壁智能这8家大模型独角兽企业在2024年融资次数超10次
2025-01-03 10:45:00
更多关于科技的资讯: