• 我的订阅
  • 科技

如何让大模型输出更精准、更可靠的结果?

类别:科技 发布时间:2024-05-13 15:03:00 来源:消费日报网

大模型虽然强大,但是也有技术缺陷。有时会产生“幻觉”,甚至会犯一些事实性错误。这是大模型技术逻辑带来的天然缺陷,大模型的技术机理是,通过大量的知识训练,基于概率最大的原则生成答案。

那么这就带来了几个问题,公开的数据库中往往缺乏真正有用的知识,大模型能学习到只是“皮毛”,由此生成的答案只能是泛泛而谈;而且一旦在训练过程中学习到了不准确的内容,大模型生成的答案就会产生偏差。再者,大模型是基于概率来生成答案,即便是“1加1等于几”这样的问题,也是大模型在训练的过程中,“发现”1+1后面出现2的概率最大,所以才会给出2的答案。除了“1+1=2”这样铁一般的事实不容易出错外,在很多问题上,大模型都不能保证百分之百正确。

大模型另外一项重大挑战是,没有办法实时更新知识。比如,ChatGPT 3.5只学习了2021年9月之前的知识,此后这个世界产生的新知识就无从知晓了。

那么有没有什么办法让大模型变得更准确、更专业呢?答案是有的,这就是今天要谈的检索增强生成技术。

检索增强生成技术英文简称RAG,它的技术原理是整合外部知识库,在大模型接收到提问时,先去检索外部知识库,并将其提供给大模型。这样,大模型在生成答案时,能够参考这些外部数据库中的信息,从而生成更准确和相关的答案。这种方式不仅增强了大模型的输出质量,还避免了重新训练模型的繁琐过程。

百融云创大模型应用一站式开发平台

百融云创将RAG技术引入到大模型应用一站式开发平台——赛博坦,并对Q&A场景专门做了模型能力的强化。在RAG技术的加持下,赛博坦能够学习到足够个性、专业、有用的知识,全面提升了生成答案的精准度和专业性,效果出奇的好。

如何让大模型输出更精准、更可靠的结果?

如何让大模型输出更精准、更可靠的结果?

在赛博坦平台上,用户可以通过角色设定、人物性格、能力范围等基础设定,打造个性化十足、能力强大的助理机器人。但此时的机器人在处理专业工作上,还差一些专业训练。用户可以点开知识管理模块上传文件,它可以是问答、文档,也可以是数据表格。完成上传后,“机器人”会全面学习这些文件,形成知识块。当用户提问时“机器人”通过RAG技术把与问题相关的知识检索出来,并提供给大模型,利用其语义理解能力,结合上下文最终生成问题答案。

每个领域都有自己的智慧和专业知识,RAG的精髓在于能够帮助企业建立专属知识库,这个知识库就像是企业独有的秘笈和配方,不仅可信、有用还独有,这为大模型解决具体行业的具体任务时提供了基础。

同时,RAG还拥有强大的知识长期记忆和理解关联能力,能进行复杂的逻辑推理和概念关联,从而生成更深入的解析和推断。这使得大模型兼具专业性、精准性、可追溯三大优势。

01专业性

RAG如同给大模型开了一个外挂,让它在回答问题之前先在企业的专业知识库里“过过脑子”。同样一个问题,在应用RAG技术前后会产生截然不同的答案。如果用户能建立一个足够强大的企业知识库,大模型很快就能从一个“票友”进化成行业专家。知识改变命运,这句话也适用于大模型。

02精准性

知识不在多,在于精。RAG能帮助大模型抓到问题的核心,并且回答到点上。利用RAG技术实现知识的嵌入、分块和提取,可以为大模型规范出框架和边界,使其在一定范围内去阅读、理解和回答,而不是任其天马行空,这将大大减少其“胡说八道”的概率。百融云创利用赛博坦平台服务了某机构的客服部门,该机构利用赛博坦平台设定线上智能客服的角色、性格,并上传大量语料形成知识库,在RAG的助力下,该机构智能客服与用户的交互变得十分顺畅和丝滑,此前“答非所问”的情况大为改观。

03透明可追溯

RAG技术另外一项优势就是知识的可追溯性,当机器人回答某个问题的时候,会清晰地显示引用知识的源头。一直以来,大模型的“黑盒”模式让人们难以完全信任,RAG则有效改变了这一情况。

我们利用赛博坦平台问了一个问题,“财富管理客户智能运营怎么做?”可以看到,在回答这个问题的同时,它还展示了引用的知识来源。

如何让大模型输出更精准、更可靠的结果?

结合RAG技术的赛博坦,模型的表达能力和预测性能得到显著提升。在第三方测评机构的测评中,百融云创大模型的准确性和精准性,取得了行业领先的成绩,多项指标优于ChatGPT3.5。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-05-13 17:45:13

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

生成式AI的抄袭输出问题值得关注(附图片)
...门话题以来,版权问题逐渐凸显。我们把复制训练数据的输出称为“抄袭输出”。此类输出的存在和特定诉讼结果很可能决定生成式AI的未来经济效益和社会影响。如何判定LLM的输出内容是否
2024-01-11 06:45:00
ChatGPT大流行的思考-解析篇
...优化,如如何更好的分词\\指代\\句法分析,从而更好的输出最终任务,如这一代(袋)苹果多少钱,应该根据上下文进行判断;但GPT的出现提供了一个新的研究方向,它的理念是尝试从端
2023-02-17 21:00:00
大语言模型,实现智能客服知识库自动扩写功能
...,使其协同工作完成文本生成任务。框架的关键是输入与输出的有效衔接。生成多样化文本:在框架中生成多个候选扩充文本,这些文本需尽量保证多样性以提高选择空间。评估和筛选:采用自动评
2023-05-06 19:00:00
深入讨论 DRD:从交互模型解析设计需求及关系
...于是提取出三个概念(图 3):(用户)输入、(系统)输出、界面。从模型二可知,系统会根据验证(不是所有输入都要验证)结果执行不同的动作和反馈不同的信息,在这里将验证的信息统称
2023-04-18 14:00:00
人工智能的意义在于对“投资体系的重塑与融合”
...后春笋来形容了,现在算法国内还没有跑出媲美GPT-3.5大模型的厂商,我们还在观测,在应用方面,我们实际上更加看好可以直连海外大模型的厂商,不过需要注意的是,国内厂商普遍还是
2023-06-04 23:13:00
科学家推出大模型数据集,涵盖奥赛数学题,有望让AI辅导数学课程
...模型本身的情况下,针对大模型的输入加以设计,让它的输出更加符合需求。赵子龙等人认为:工业界的训练资源远远超过他所在学术界,因此他很难在微调模型上下功,所以他和同事决定从第二种
2024-03-13 10:26:00
...是“ABC”模型?“ABC”模型(A指输入、B指心智模式、C指输出)。提高自身认知,提升心智模式,才能实现预期的输出、预期的行为、预期的结果。以安全工作为例,A输入是指:安全
2024-04-08 07:57:00
AIGC带来新一轮工具革新,在协同办公领域是受阻还是爆发?
...装。二是将来每个人可以借助AI能力胜任多个职位,灵活输出工作结果。“AIGC技术的发展将推动办公软件向更多的平台拓展,如智能手机、平板电脑等。同时,办公软件厂商也可能将AIG
2023-08-07 21:01:00
掰开揉碎告诉你,ChatGPT凭啥是人工智能“流量王”
...解码器网络。其中,编码器是将输入序列“编码”为一个输出(向量C),解码器是将该输出(向量C)作为输入“解码”为一个输出序列。在这个框架下可以使用不同的算法来解决不同的任务,它
2023-05-29 11:00:00
更多关于科技的资讯: