• 我的订阅
  • 科技

如何让大模型输出更精准、更可靠的结果?

类别:科技 发布时间:2024-05-13 15:03:00 来源:消费日报网

大模型虽然强大,但是也有技术缺陷。有时会产生“幻觉”,甚至会犯一些事实性错误。这是大模型技术逻辑带来的天然缺陷,大模型的技术机理是,通过大量的知识训练,基于概率最大的原则生成答案。

那么这就带来了几个问题,公开的数据库中往往缺乏真正有用的知识,大模型能学习到只是“皮毛”,由此生成的答案只能是泛泛而谈;而且一旦在训练过程中学习到了不准确的内容,大模型生成的答案就会产生偏差。再者,大模型是基于概率来生成答案,即便是“1加1等于几”这样的问题,也是大模型在训练的过程中,“发现”1+1后面出现2的概率最大,所以才会给出2的答案。除了“1+1=2”这样铁一般的事实不容易出错外,在很多问题上,大模型都不能保证百分之百正确。

大模型另外一项重大挑战是,没有办法实时更新知识。比如,ChatGPT 3.5只学习了2021年9月之前的知识,此后这个世界产生的新知识就无从知晓了。

那么有没有什么办法让大模型变得更准确、更专业呢?答案是有的,这就是今天要谈的检索增强生成技术。

检索增强生成技术英文简称RAG,它的技术原理是整合外部知识库,在大模型接收到提问时,先去检索外部知识库,并将其提供给大模型。这样,大模型在生成答案时,能够参考这些外部数据库中的信息,从而生成更准确和相关的答案。这种方式不仅增强了大模型的输出质量,还避免了重新训练模型的繁琐过程。

百融云创大模型应用一站式开发平台

百融云创将RAG技术引入到大模型应用一站式开发平台——赛博坦,并对Q&A场景专门做了模型能力的强化。在RAG技术的加持下,赛博坦能够学习到足够个性、专业、有用的知识,全面提升了生成答案的精准度和专业性,效果出奇的好。

如何让大模型输出更精准、更可靠的结果?

如何让大模型输出更精准、更可靠的结果?

在赛博坦平台上,用户可以通过角色设定、人物性格、能力范围等基础设定,打造个性化十足、能力强大的助理机器人。但此时的机器人在处理专业工作上,还差一些专业训练。用户可以点开知识管理模块上传文件,它可以是问答、文档,也可以是数据表格。完成上传后,“机器人”会全面学习这些文件,形成知识块。当用户提问时“机器人”通过RAG技术把与问题相关的知识检索出来,并提供给大模型,利用其语义理解能力,结合上下文最终生成问题答案。

每个领域都有自己的智慧和专业知识,RAG的精髓在于能够帮助企业建立专属知识库,这个知识库就像是企业独有的秘笈和配方,不仅可信、有用还独有,这为大模型解决具体行业的具体任务时提供了基础。

同时,RAG还拥有强大的知识长期记忆和理解关联能力,能进行复杂的逻辑推理和概念关联,从而生成更深入的解析和推断。这使得大模型兼具专业性、精准性、可追溯三大优势。

01专业性

RAG如同给大模型开了一个外挂,让它在回答问题之前先在企业的专业知识库里“过过脑子”。同样一个问题,在应用RAG技术前后会产生截然不同的答案。如果用户能建立一个足够强大的企业知识库,大模型很快就能从一个“票友”进化成行业专家。知识改变命运,这句话也适用于大模型。

02精准性

知识不在多,在于精。RAG能帮助大模型抓到问题的核心,并且回答到点上。利用RAG技术实现知识的嵌入、分块和提取,可以为大模型规范出框架和边界,使其在一定范围内去阅读、理解和回答,而不是任其天马行空,这将大大减少其“胡说八道”的概率。百融云创利用赛博坦平台服务了某机构的客服部门,该机构利用赛博坦平台设定线上智能客服的角色、性格,并上传大量语料形成知识库,在RAG的助力下,该机构智能客服与用户的交互变得十分顺畅和丝滑,此前“答非所问”的情况大为改观。

03透明可追溯

RAG技术另外一项优势就是知识的可追溯性,当机器人回答某个问题的时候,会清晰地显示引用知识的源头。一直以来,大模型的“黑盒”模式让人们难以完全信任,RAG则有效改变了这一情况。

我们利用赛博坦平台问了一个问题,“财富管理客户智能运营怎么做?”可以看到,在回答这个问题的同时,它还展示了引用的知识来源。

如何让大模型输出更精准、更可靠的结果?

结合RAG技术的赛博坦,模型的表达能力和预测性能得到显著提升。在第三方测评机构的测评中,百融云创大模型的准确性和精准性,取得了行业领先的成绩,多项指标优于ChatGPT3.5。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-05-13 17:45:13

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

百融云创荣获“2024大模型创新应用奖”
...“2024新科技100强金i奖”正式发布,百融云创荣获“2024大模型创新应用奖”。作为人工智能代表性企业,百融云创自主构建了大模型预训练
2024-09-25 11:51:00
3天把Llama训成Mamba,性能不降,推理更快!
...初始化。之后就是SSM的运算过程,再通过投影和累加得到输出。模型架构和训练下图给出了模型的架构,因为Transformer的知识存在于MLP层
2024-09-06 10:01:00
生成式AI的抄袭输出问题值得关注(附图片)
...门话题以来,版权问题逐渐凸显。我们把复制训练数据的输出称为“抄袭输出”。此类输出的存在和特定诉讼结果很可能决定生成式AI的未来经济效益和社会影响。如何判定LLM的输出内容是否
2024-01-11 06:45:00
ChatGPT大流行的思考-解析篇
...优化,如如何更好的分词\\指代\\句法分析,从而更好的输出最终任务,如这一代(袋)苹果多少钱,应该根据上下文进行判断;但GPT的出现提供了一个新的研究方向,它的理念是尝试从端
2023-02-17 21:00:00
大语言模型,实现智能客服知识库自动扩写功能
...,使其协同工作完成文本生成任务。框架的关键是输入与输出的有效衔接。生成多样化文本:在框架中生成多个候选扩充文本,这些文本需尽量保证多样性以提高选择空间。评估和筛选:采用自动评
2023-05-06 19:00:00
深挖大模型幻觉!哈佛大学最新报告:LLM等价于众包,只是在输出「网络共识」
...晦涩难懂和有争议问题时产生「幻觉」的原因,发现模型输出的准确性高度依赖于训练数据的质量和数量。研究结果指出,大模型在处理有广泛共识的问题时表现较好,但在面对争议性或信息不足的
2024-10-26 09:51:00
对话北大赵东岩:为啥DeepSeek幻觉率这么高?用户如何避免被AI“欺骗”?
...问题出错,这个得看问题的复杂程度。有部分原因是模型输出的随机性导致的(也是模型有创造力的源泉),这方面随着模型能力的增强,幻觉也会越来越小,但很难完全避免。 对于忠实性幻觉
2025-03-05 15:54:00
鄂维南院士领衔新作:大模型不止有RAG、参数存储,还有第3种记忆
...及哪种模型架构适合读取和写入显式记忆。研究者将输入输出关系作为电路的内部机制,并将知识定义为输入输出关系及其电路。通过操纵这些电路,人们可以从 LLM 中分离出许多知识,同时
2024-07-11 09:33:00
被DeepSeek带火的知识蒸馏 开山之作曾被拒:诺奖得主坐镇都没用
...目标在softmax层加入温度参数T。当T=1时,就是普通的softmax输出。T越大,输出的概率分布越平滑(soft)
2025-02-07 17:44:00
更多关于科技的资讯:
比黄金涨的还猛!羽毛球价格上涨100% 网友纷纷提前囤货
快科技4月1日消息,近两年,众所周知,黄金价格真是一路狂飙。今日上午10点25分,黄金涨至3139.92美元的新纪录高位
2025-04-01 19:09:00
本文转自:人民网人民网北京4月1日电 (记者夏晓伦)当下,消费市场的竞争日益激烈,餐饮行业也在不断探寻新的发展路径与价值增长点
2025-04-01 19:16:00
全自研高性能RISC-V服务器芯片在前海首发
本文转自:人民网睿思芯科创始人、CEO谭章熹正式发布灵羽处理器。主办方供图人民网深圳4月1日电 (刘森君)3月31日,深圳前海企业睿思芯科举办2025春季新品发布会
2025-04-01 19:35:00
比亚迪腾势赵长江:Z9GT 120km/h追尾大货车 电池完好无损没有起火自燃
快科技4月1日消息,车辆碰撞后电池起火事件频发,再次引发大家对于新能源车安全的关注。今日,腾势销售事业部总经理赵长江微博发文称
2025-04-01 19:40:00
比亚迪腾势汽车3月销量达12620辆:平均成交价36.5万元
快科技4月1日消息,2025年4月1日,腾势汽车发布最新销量数据。3月,腾势汽车累计销量达12620辆,同比增长22.8%
2025-04-01 19:40:00
SU7爆燃致3人死亡:小米汽车遭遇最严峻的信任危机
经历了一整晚的微信聊天记录发酵之后,小米SU7在安徽高速上智驾发生车祸,导致三名花季少女丧生的命案,登上了热榜的头条。巨大的舆论风波背后
2025-04-01 19:40:00
女子冒风烧纸祈福引燃9辆车 官方通报:刑拘
快科技4月1日消息,清明将至,又到了祭祖祈福的时候,尤其需要提醒大家注意用火安全。据“北京朝阳消防”最新通报,3月30日
2025-04-01 19:40:00
10年来最大改版iOS 19六月登场!3款iPhone遭淘汰无缘升级
快科技4月1日消息,苹果将于6月10日举办WWDC开发者大会,届时将公开新一代iOS 19操作系统,有消息称这将是近十年来iOS系统最大幅度的改版
2025-04-01 19:40:00
连续53年吃35000个汉堡!美国72岁奇男子创纪录:非常健康
这绝对是一个不良的示范,但美国男子唐纳德·戈斯克(DonaldGorske)是个幸运儿!他是麦叔叔家巨无霸的“终极粉丝”
2025-04-01 19:40:00
天钡新款迷你机首发4099元:锐龙7 Pro 8845HS、6个3.5寸硬盘位
快科技4月1日消息,天钡WTR MAX“NAS型迷你主机”已经上市,首发4099元。新款迷你机采用全新模具,全金属一体化构造
2025-04-01 19:40:00
中国科大实现毫秒级可集成量子存储器
大皖新闻讯 大皖新闻记者从中国科学技术大学获悉,该校郭光灿院士团队的李传锋、周宗权研究组基于团队原创的无噪声光子回波方案
2025-04-01 19:49:00
夫妻自如租房5年:妻子多项指标异常
4月1日消息,据媒体报道,一对夫妻在杭州租住自如房屋5年,妻子体检发现多项指标异常,包括胸闷、过敏性咽炎、抵抗力降低、肺部结节
2025-04-01 20:10:00
十堰广电讯(全媒体记者 张陈堰 朱江 通讯员 纪宏新)3月底,世界规模最大原址保护的恐龙蛋化石遗址青龙山恐龙蛋化石群,首次成功尝试运用三维激光扫描技术
2025-04-01 20:24:00
携手十五载 共赢新未来:新克尔光电生产基地乔迁佛山
3月29日,广东新克尔光电科技有限公司(以下简称:新克尔光电)在佛山市三水区中南高科高端电子信息港举行生产基地乔迁仪式暨年度供应商大会
2025-04-01 20:26:00
海外媒体宣发:如何用全球声音塑造品牌影响力
一、案例启示:国际品牌的破圈密码在当今全球化的市场环境下,品牌影响力的提升已成为企业在激烈竞争中脱颖而出的关键因素。海外媒体发稿作为一种高效的品牌传播方式
2025-04-01 20:52:00