• 我的订阅
  • 科技

如何让大模型输出更精准、更可靠的结果?

类别:科技 发布时间:2024-05-13 15:03:00 来源:消费日报网

大模型虽然强大,但是也有技术缺陷。有时会产生“幻觉”,甚至会犯一些事实性错误。这是大模型技术逻辑带来的天然缺陷,大模型的技术机理是,通过大量的知识训练,基于概率最大的原则生成答案。

那么这就带来了几个问题,公开的数据库中往往缺乏真正有用的知识,大模型能学习到只是“皮毛”,由此生成的答案只能是泛泛而谈;而且一旦在训练过程中学习到了不准确的内容,大模型生成的答案就会产生偏差。再者,大模型是基于概率来生成答案,即便是“1加1等于几”这样的问题,也是大模型在训练的过程中,“发现”1+1后面出现2的概率最大,所以才会给出2的答案。除了“1+1=2”这样铁一般的事实不容易出错外,在很多问题上,大模型都不能保证百分之百正确。

大模型另外一项重大挑战是,没有办法实时更新知识。比如,ChatGPT 3.5只学习了2021年9月之前的知识,此后这个世界产生的新知识就无从知晓了。

那么有没有什么办法让大模型变得更准确、更专业呢?答案是有的,这就是今天要谈的检索增强生成技术。

检索增强生成技术英文简称RAG,它的技术原理是整合外部知识库,在大模型接收到提问时,先去检索外部知识库,并将其提供给大模型。这样,大模型在生成答案时,能够参考这些外部数据库中的信息,从而生成更准确和相关的答案。这种方式不仅增强了大模型的输出质量,还避免了重新训练模型的繁琐过程。

百融云创大模型应用一站式开发平台

百融云创将RAG技术引入到大模型应用一站式开发平台——赛博坦,并对Q&A场景专门做了模型能力的强化。在RAG技术的加持下,赛博坦能够学习到足够个性、专业、有用的知识,全面提升了生成答案的精准度和专业性,效果出奇的好。

如何让大模型输出更精准、更可靠的结果?

如何让大模型输出更精准、更可靠的结果?

在赛博坦平台上,用户可以通过角色设定、人物性格、能力范围等基础设定,打造个性化十足、能力强大的助理机器人。但此时的机器人在处理专业工作上,还差一些专业训练。用户可以点开知识管理模块上传文件,它可以是问答、文档,也可以是数据表格。完成上传后,“机器人”会全面学习这些文件,形成知识块。当用户提问时“机器人”通过RAG技术把与问题相关的知识检索出来,并提供给大模型,利用其语义理解能力,结合上下文最终生成问题答案。

每个领域都有自己的智慧和专业知识,RAG的精髓在于能够帮助企业建立专属知识库,这个知识库就像是企业独有的秘笈和配方,不仅可信、有用还独有,这为大模型解决具体行业的具体任务时提供了基础。

同时,RAG还拥有强大的知识长期记忆和理解关联能力,能进行复杂的逻辑推理和概念关联,从而生成更深入的解析和推断。这使得大模型兼具专业性、精准性、可追溯三大优势。

01专业性

RAG如同给大模型开了一个外挂,让它在回答问题之前先在企业的专业知识库里“过过脑子”。同样一个问题,在应用RAG技术前后会产生截然不同的答案。如果用户能建立一个足够强大的企业知识库,大模型很快就能从一个“票友”进化成行业专家。知识改变命运,这句话也适用于大模型。

02精准性

知识不在多,在于精。RAG能帮助大模型抓到问题的核心,并且回答到点上。利用RAG技术实现知识的嵌入、分块和提取,可以为大模型规范出框架和边界,使其在一定范围内去阅读、理解和回答,而不是任其天马行空,这将大大减少其“胡说八道”的概率。百融云创利用赛博坦平台服务了某机构的客服部门,该机构利用赛博坦平台设定线上智能客服的角色、性格,并上传大量语料形成知识库,在RAG的助力下,该机构智能客服与用户的交互变得十分顺畅和丝滑,此前“答非所问”的情况大为改观。

03透明可追溯

RAG技术另外一项优势就是知识的可追溯性,当机器人回答某个问题的时候,会清晰地显示引用知识的源头。一直以来,大模型的“黑盒”模式让人们难以完全信任,RAG则有效改变了这一情况。

我们利用赛博坦平台问了一个问题,“财富管理客户智能运营怎么做?”可以看到,在回答这个问题的同时,它还展示了引用的知识来源。

如何让大模型输出更精准、更可靠的结果?

结合RAG技术的赛博坦,模型的表达能力和预测性能得到显著提升。在第三方测评机构的测评中,百融云创大模型的准确性和精准性,取得了行业领先的成绩,多项指标优于ChatGPT3.5。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-05-13 17:45:13

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

百融云创荣获“2024大模型创新应用奖”
...“2024新科技100强金i奖”正式发布,百融云创荣获“2024大模型创新应用奖”。作为人工智能代表性企业,百融云创自主构建了大模型预训练
2024-09-25 11:51:00
3天把Llama训成Mamba,性能不降,推理更快!
...初始化。之后就是SSM的运算过程,再通过投影和累加得到输出。模型架构和训练下图给出了模型的架构,因为Transformer的知识存在于MLP层
2024-09-06 10:01:00
生成式AI的抄袭输出问题值得关注(附图片)
...门话题以来,版权问题逐渐凸显。我们把复制训练数据的输出称为“抄袭输出”。此类输出的存在和特定诉讼结果很可能决定生成式AI的未来经济效益和社会影响。如何判定LLM的输出内容是否
2024-01-11 06:45:00
ChatGPT大流行的思考-解析篇
...及优化,如如何更好的分词\指代\句法分析,从而更好的输出最终任务,如这一代(袋)苹果多少钱,应该根据上下文进行判断;但GPT的出现提供了一个新的研究方向,它的理念是尝试从端到
2023-02-17 21:00:00
大语言模型,实现智能客服知识库自动扩写功能
...,使其协同工作完成文本生成任务。框架的关键是输入与输出的有效衔接。生成多样化文本:在框架中生成多个候选扩充文本,这些文本需尽量保证多样性以提高选择空间。评估和筛选:采用自动评
2023-05-06 19:00:00
深挖大模型幻觉!哈佛大学最新报告:LLM等价于众包,只是在输出「网络共识」
...晦涩难懂和有争议问题时产生「幻觉」的原因,发现模型输出的准确性高度依赖于训练数据的质量和数量。研究结果指出,大模型在处理有广泛共识的问题时表现较好,但在面对争议性或信息不足的
2024-10-26 09:51:00
对话北大赵东岩:为啥DeepSeek幻觉率这么高?用户如何避免被AI“欺骗”?
...问题出错,这个得看问题的复杂程度。有部分原因是模型输出的随机性导致的(也是模型有创造力的源泉),这方面随着模型能力的增强,幻觉也会越来越小,但很难完全避免。 对于忠实性幻觉
2025-03-05 15:54:00
鄂维南院士领衔新作:大模型不止有RAG、参数存储,还有第3种记忆
...及哪种模型架构适合读取和写入显式记忆。研究者将输入输出关系作为电路的内部机制,并将知识定义为输入输出关系及其电路。通过操纵这些电路,人们可以从 LLM 中分离出许多知识,同时
2024-07-11 09:33:00
被DeepSeek带火的知识蒸馏 开山之作曾被拒:诺奖得主坐镇都没用
...目标在softmax层加入温度参数T。当T=1时,就是普通的softmax输出。T越大,输出的概率分布越平滑(soft)
2025-02-07 17:44:00
更多关于科技的资讯:
廊坊推出算力券撬动人工智能产业每年投放总额不超过1000万元,已吸引23家初创企业落地河北日报讯(记者刘英、刘杰)“基于流程
2025-11-08 07:54:00
摘要:随着数字经济的深入发展,传统供应链金融暴露出信息不透明、业务流程复杂、风险管控难度大等突出问题,其数字化转型已成为当前行业发展的重要课题
2025-11-08 05:24:00
摘要:本文探讨数字化时代企业管理模式的创新路径,首先分析数字化对企业管理模式的核心影响,指出其推动管理对象向“人-财-物-数据”融合转变
2025-11-08 05:24:00
智推时代:用GEO打造品牌增长新引擎
在生成式AI重塑流量格局的当下,如何将前沿技术转化为可持续的商业增长,已成为品牌面临的核心挑战。智推时代精准切入这一赛道
2025-11-07 08:03:00
(一)开篇引言行业背景与痛点:中国信息通信研究院《2025年数字营销发展趋势报告》指出,截至2025年6月,国内生成式引擎月活用户已突破8
2025-11-07 08:05:00
一、旅游出行安全保险尚无权威排名,选择需聚焦三大核心指标目前旅游出行安全保险市场不存在公认的统一排名标准,产品选择应重点考察保险公司服务能力(偿付能力充足率
2025-11-07 08:06:00
当生成式AI技术以迅猛势头重构搜索生态时,如何为企业精准挑选高度契合需求的GEO(生成式引擎优化)服务供应商,已成为抢占下一代流量入口的核心战略动作
2025-11-07 08:06:00
科学实力获市场验证:任我行液体钙获全球销量第一认证
2025年11月初,德国Moms Garden任我行旗下成人液体钙产品确认获得尚普咨询集团授予的“成人液体钙全球销量第一”与“骨骼健康领导品牌”双重市场地位认证证书
2025-11-07 08:07:00
磷虾油产品对比 磷虾油品牌深度测评与科学选购指南
近年来随着健康意识的不断提升,富含Omega-3、磷脂和虾青素的磷虾油逐渐成为大众关注的营养补充剂。然而在市场快速扩张的背后
2025-11-07 08:07:00
道路“会思考” 出行更美好!数字道路建设赋能未来之城
数字道路建设赋能未来之城道路“会思考” 出行更美好雄安新区的街道上,看似普通的路灯杆集合了多种智能设备,成为智慧交通的“眼睛”
2025-11-07 08:20:00
今年9月27日,雄安图书馆正式向公众开放。一个多月来,已迎来访客20余万人次。这座形如书卷徐徐展开的建筑,不仅是新区一座崭新的文化地标
2025-11-07 08:20:00
关注进博会丨河北再赴进博之约(二):把全球好物装进“购物车”
把全球好物装进“购物车”——河北再赴进博之约(二)11月6日,在第八届中国国际进口博览会河北省主题展区,河北参展商正在进行路演活动
2025-11-07 08:21:00
南报网讯(通讯员王亚洲朱丽纯记者王婷婷)日前,“智云经开”品牌发布暨创新中心签约仪式在兴智科技园举行。南京经开区与省数据局
2025-11-07 08:23:00
今年以来,肥乡联社在省联社及邯郸审计中心的精准指导下,锚定代理保险业务作为中间业务增长的核心抓手,深挖县域保险市场潜力
2025-11-07 10:22:00
为全面提升金融服务安全性,切实保障广大客户的资金与信息安全,近期,行唐联社市仝信用社积极行动,开展了一系列网络安全宣传与防护活动
2025-11-07 10:24:00