• 我的订阅
  • 科技

如何让大模型输出更精准、更可靠的结果?

类别:科技 发布时间:2024-05-13 15:03:00 来源:消费日报网

大模型虽然强大,但是也有技术缺陷。有时会产生“幻觉”,甚至会犯一些事实性错误。这是大模型技术逻辑带来的天然缺陷,大模型的技术机理是,通过大量的知识训练,基于概率最大的原则生成答案。

那么这就带来了几个问题,公开的数据库中往往缺乏真正有用的知识,大模型能学习到只是“皮毛”,由此生成的答案只能是泛泛而谈;而且一旦在训练过程中学习到了不准确的内容,大模型生成的答案就会产生偏差。再者,大模型是基于概率来生成答案,即便是“1加1等于几”这样的问题,也是大模型在训练的过程中,“发现”1+1后面出现2的概率最大,所以才会给出2的答案。除了“1+1=2”这样铁一般的事实不容易出错外,在很多问题上,大模型都不能保证百分之百正确。

大模型另外一项重大挑战是,没有办法实时更新知识。比如,ChatGPT 3.5只学习了2021年9月之前的知识,此后这个世界产生的新知识就无从知晓了。

那么有没有什么办法让大模型变得更准确、更专业呢?答案是有的,这就是今天要谈的检索增强生成技术。

检索增强生成技术英文简称RAG,它的技术原理是整合外部知识库,在大模型接收到提问时,先去检索外部知识库,并将其提供给大模型。这样,大模型在生成答案时,能够参考这些外部数据库中的信息,从而生成更准确和相关的答案。这种方式不仅增强了大模型的输出质量,还避免了重新训练模型的繁琐过程。

百融云创大模型应用一站式开发平台

百融云创将RAG技术引入到大模型应用一站式开发平台——赛博坦,并对Q&A场景专门做了模型能力的强化。在RAG技术的加持下,赛博坦能够学习到足够个性、专业、有用的知识,全面提升了生成答案的精准度和专业性,效果出奇的好。

如何让大模型输出更精准、更可靠的结果?

如何让大模型输出更精准、更可靠的结果?

在赛博坦平台上,用户可以通过角色设定、人物性格、能力范围等基础设定,打造个性化十足、能力强大的助理机器人。但此时的机器人在处理专业工作上,还差一些专业训练。用户可以点开知识管理模块上传文件,它可以是问答、文档,也可以是数据表格。完成上传后,“机器人”会全面学习这些文件,形成知识块。当用户提问时“机器人”通过RAG技术把与问题相关的知识检索出来,并提供给大模型,利用其语义理解能力,结合上下文最终生成问题答案。

每个领域都有自己的智慧和专业知识,RAG的精髓在于能够帮助企业建立专属知识库,这个知识库就像是企业独有的秘笈和配方,不仅可信、有用还独有,这为大模型解决具体行业的具体任务时提供了基础。

同时,RAG还拥有强大的知识长期记忆和理解关联能力,能进行复杂的逻辑推理和概念关联,从而生成更深入的解析和推断。这使得大模型兼具专业性、精准性、可追溯三大优势。

01专业性

RAG如同给大模型开了一个外挂,让它在回答问题之前先在企业的专业知识库里“过过脑子”。同样一个问题,在应用RAG技术前后会产生截然不同的答案。如果用户能建立一个足够强大的企业知识库,大模型很快就能从一个“票友”进化成行业专家。知识改变命运,这句话也适用于大模型。

02精准性

知识不在多,在于精。RAG能帮助大模型抓到问题的核心,并且回答到点上。利用RAG技术实现知识的嵌入、分块和提取,可以为大模型规范出框架和边界,使其在一定范围内去阅读、理解和回答,而不是任其天马行空,这将大大减少其“胡说八道”的概率。百融云创利用赛博坦平台服务了某机构的客服部门,该机构利用赛博坦平台设定线上智能客服的角色、性格,并上传大量语料形成知识库,在RAG的助力下,该机构智能客服与用户的交互变得十分顺畅和丝滑,此前“答非所问”的情况大为改观。

03透明可追溯

RAG技术另外一项优势就是知识的可追溯性,当机器人回答某个问题的时候,会清晰地显示引用知识的源头。一直以来,大模型的“黑盒”模式让人们难以完全信任,RAG则有效改变了这一情况。

我们利用赛博坦平台问了一个问题,“财富管理客户智能运营怎么做?”可以看到,在回答这个问题的同时,它还展示了引用的知识来源。

如何让大模型输出更精准、更可靠的结果?

结合RAG技术的赛博坦,模型的表达能力和预测性能得到显著提升。在第三方测评机构的测评中,百融云创大模型的准确性和精准性,取得了行业领先的成绩,多项指标优于ChatGPT3.5。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-05-13 17:45:13

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

百融云创荣获“2024大模型创新应用奖”
...“2024新科技100强金i奖”正式发布,百融云创荣获“2024大模型创新应用奖”。作为人工智能代表性企业,百融云创自主构建了大模型预训练
2024-09-25 11:51:00
3天把Llama训成Mamba,性能不降,推理更快!
...初始化。之后就是SSM的运算过程,再通过投影和累加得到输出。模型架构和训练下图给出了模型的架构,因为Transformer的知识存在于MLP层
2024-09-06 10:01:00
生成式AI的抄袭输出问题值得关注(附图片)
...门话题以来,版权问题逐渐凸显。我们把复制训练数据的输出称为“抄袭输出”。此类输出的存在和特定诉讼结果很可能决定生成式AI的未来经济效益和社会影响。如何判定LLM的输出内容是否
2024-01-11 06:45:00
ChatGPT大流行的思考-解析篇
...及优化,如如何更好的分词\指代\句法分析,从而更好的输出最终任务,如这一代(袋)苹果多少钱,应该根据上下文进行判断;但GPT的出现提供了一个新的研究方向,它的理念是尝试从端到
2023-02-17 21:00:00
大语言模型,实现智能客服知识库自动扩写功能
...,使其协同工作完成文本生成任务。框架的关键是输入与输出的有效衔接。生成多样化文本:在框架中生成多个候选扩充文本,这些文本需尽量保证多样性以提高选择空间。评估和筛选:采用自动评
2023-05-06 19:00:00
深挖大模型幻觉!哈佛大学最新报告:LLM等价于众包,只是在输出「网络共识」
...晦涩难懂和有争议问题时产生「幻觉」的原因,发现模型输出的准确性高度依赖于训练数据的质量和数量。研究结果指出,大模型在处理有广泛共识的问题时表现较好,但在面对争议性或信息不足的
2024-10-26 09:51:00
对话北大赵东岩:为啥DeepSeek幻觉率这么高?用户如何避免被AI“欺骗”?
...问题出错,这个得看问题的复杂程度。有部分原因是模型输出的随机性导致的(也是模型有创造力的源泉),这方面随着模型能力的增强,幻觉也会越来越小,但很难完全避免。 对于忠实性幻觉
2025-03-05 15:54:00
鄂维南院士领衔新作:大模型不止有RAG、参数存储,还有第3种记忆
...及哪种模型架构适合读取和写入显式记忆。研究者将输入输出关系作为电路的内部机制,并将知识定义为输入输出关系及其电路。通过操纵这些电路,人们可以从 LLM 中分离出许多知识,同时
2024-07-11 09:33:00
被DeepSeek带火的知识蒸馏 开山之作曾被拒:诺奖得主坐镇都没用
...目标在softmax层加入温度参数T。当T=1时,就是普通的softmax输出。T越大,输出的概率分布越平滑(soft)
2025-02-07 17:44:00
更多关于科技的资讯:
□南京日报/紫金山新闻记者张甜甜 通讯员夏俊林娜10月31日,南京市统计局、国家统计局南京调查队发布南京经济“三季报”
2025-11-01 09:44:00
上海虹桥医院癫痫专病诊疗新高度:个性化方案,全程化守护
癫痫发作的不可预测性及其对记忆、情绪、社交、学业与工作等方面的深远影响,构成了广大患者面临的核心挑战。诊断的复杂、治疗方案的普适性困境以及持续管理的缺失
2025-11-01 10:05:00
第十季炒股大赛冠军诞生:光伏逆变器行业龙头涨幅登顶
在《大众证券报》读者俱乐部第十季炒股比赛中,选手“馨小憩”以159.84元/股推荐的阳光电源(300274),荐股涨幅19
2025-11-01 11:00:00
近日,国内首款真空高压铸造人形机器人腿部骨骼零部件在中信戴卡股份有限公司研制成功并生产下线,首批20件量产产品已发往国内客户
2025-11-01 11:10:00
视频制作:陈希河北新闻网讯(记者 李春炜)随着AI技术飞速发展,在今年的双十一期间,AI笔记本也成为爆款产品。近日,记者走进安徽合肥的联想PC设备研发和制造基地
2025-11-01 15:39:00
10月30日,“版权强企燕赵行”活动走进保定市高阳县。活动通过进企问需、校企对接、版权法律法规科普、版权服务平台及版权区块链平台推介等方式
2025-11-01 15:47:00
10月30日,在由盖世汽车主办的2025第七届“金辑奖”颁奖盛典上,东软集团凭借在智能汽车互联领域持续的产品创新与卓越的全球化实践
2025-11-01 16:16:00
钻戒定制怎么选?2025五大宝藏品牌全解析,一篇避坑
准备结婚选钻戒,却被天然钻的高价劝退?想入手培育钻戒,又怕遇到“参数虚标”“售后无保障”的问题?2025年培育钻石市场规模突破300亿元
2025-11-01 16:17:00
第三十七届中国仿真大会在合肥市庐阳区召开
大皖新闻讯 11月1日,第三十七届中国仿真大会在合肥市庐阳区召开,大会以“数智仿真、新质发展”为主题,吸引全国约千名学者与业界代表
2025-11-02 00:04:00
“科大讯飞1024科博展”亮点抢先看!现场黑科技拉满,免费开放
大皖新闻讯 想让AI陪你对弈吗?想穿越时空与孙悟空来场“智慧交锋”吗?第八届世界声博会暨2025科大讯飞全球1024开发者节科博展将于11月2日至6日在合肥体育中心启幕
2025-11-02 00:04:00
出海再提速!锦江酒店(中国区)宣布旗下7天酒店出海,同日签约10个项目
锦江酒店(中国区)规模化出海再次迎来关键节点。10月31日,其于深圳正式宣布,国民品牌7天酒店将进军东南亚市场。这是继今年8月底
2025-11-01 10:02:00
10月28日,亚洲国际动力传动与控制技术展览会(PTC ASIA 2025)在上海新国际博览中心启幕。近1800家海内外知名展商齐聚
2025-11-01 07:03:00
正式发布!视源股份牵头制定《娱乐用车载显示系统图像质量技术规范》团体标准
2025年10月23日,在全国音频、视频及多媒体系统与设备标准化技术委员会(SAC/TC 242)商用显示标准研究组第六次全会暨标准研讨会上
2025-10-31 08:20:00
中感集团煤仓安全综合解决方案亮相中国国际煤炭采矿展,以系统性创新重塑矿山作业安全
在北京举行的第21届中国国际煤炭采矿技术交流与设备展览会上,中感集团创新展示的“煤仓安全综合解决方案”引发行业高度关注
2025-10-31 08:51:00
人工智能产业决胜与 Data&AI 数据基础设施建设——科杰科技于洋中国国际数字经济博览会主题演讲
2025中国国际数字经济博览会在石家庄国际会展中心开幕。科杰科技董事长于洋受邀出席2025首席数据官峰会论坛,并作主题为《人工智能产业决胜与 Data&
2025-10-31 08:51:00