• 我的订阅
  • 科技

表格增强生成TAG登场:解锁AI自然语言与数据库的完美结合

类别:科技 发布时间:2024-09-10 13:38:00 来源:机器之心Pro

表格增强生成TAG登场:解锁AI自然语言与数据库的完美结合

与 Text2SQL 或 RAG 不同,TAG 充分利用了数据库系统和 LLM 的功能。

人工智能已经改变了人们的工作方式和与数据交互的方式。回想几年前,研究人员必须编写 SQL 查询和代码才能从大量数据中提取有用信息。如今,他们只需输入问题,由语言模型驱动的底层系统会完成其余工作,让用户只需与数据对话即可立即获得答案。

这些新系统向数据库提供自然语言交互,这种转变取得了丰硕成果,但仍存在一些问题。从本质上讲,这些系统仍然无法处理各种查询。

本文,来自 UC 伯克利和斯坦福大学的研究人员现在正努力用一种名为表格增强生成 (TAG,Table-Augmented Generation) 的新方法来解决这一问题。

表格增强生成TAG登场:解锁AI自然语言与数据库的完美结合

论文地址:https://arxiv.org/pdf/2408.14717 项目地址:https://github.com/TAG-Research/TAG-Bench 论文标题:Text2SQL is Not Enough: Unifying AI and Databases with TAG

TAG 是一种统一且通用的范式,用于回答数据库中的自然语言问题。TAG 模型代表了 LM 和数据库之间未曾探索过的广泛交互。

TAG 是如何工作的

目前,当用户对自定义数据源提出自然语言问题时,主要采用两种方法:文本到 SQL 或检索增强生成 (RAG)。

虽然这两种方法都能很好地完成工作,但当问题变得复杂并超出系统能力时,用户就会遇到问题。

举例来说,文本到 SQL 的方法(这是一种将文本提示转换为数据库可以执行的 SQL 查询)仅关注可以用关系代数表达的自然语言问题,但只能查询用户可能想要询问的一小部分问题。

相似的,RAG 只能通过对数据库中的一个或几个数据记录的点查找来回答相关的查询。这种方法专注于直接从数据库中检索特定信息点,而不涉及更复杂的数据处理或分析。

然而,对于商业用户来说,他们的问题通常需要复杂的领域知识、世界知识、精确计算和语义推理的组合。

为了解决这一问题,该研究提出了 TAG 系统,其实现主要包含三个步骤:查询合成、查询执行和答案生成。

表格增强生成TAG登场:解锁AI自然语言与数据库的完美结合

TAG 模型很简单,但功能强大,由以下三个方程定义:

表格增强生成TAG登场:解锁AI自然语言与数据库的完美结合

值得注意的是,TAG 模型统一了之前的方法,包括 Text2SQL 和 RAG,它们仅代表了 TAG 的特殊情况并且仅能解决有限的用户问题子集。

查询合成

首先,LM 推断哪些数据与回答问题相关,并将输入转换为该数据库的可执行查询(不仅仅是 SQL) 。

其中,syn 函数接受自然语言请求 并生成要由数据库系统执行的查询 。对于给定的用户请求,此步骤负责 (a) 推断哪些数据与回答请求相关,以及 (b) 执行语义解析以将用户请求转换为可由数据库系统执行的查询。此查询可以使用任何查询语言。论文示例中使用了 SQL。

如图 1 所示,该查询的问题是「总结票房最高的被认为是经典的爱情电影的评论」。在这里,数据源包含有关每部电影的名字、收入、类型和相关评论的信息。在此步骤中,系统利用 LM 的语义推理能力来生成 SQL 查询,该查询使用来自数据源的电影标题、评论、收入和类型的属性。

查询执行

在查询执行阶段,exec 函数在数据库系统中执行查询,获取表。此步骤利用数据库查询引擎对大量存储的数据进行有效地查询。

如图 1 所示,数据库查询是用 SQL 编写的 selection 和 ranking 查询,它返回包含相关行的表。查询使用 LM 执行选择,根据电影名字评估哪些电影是经典电影,并使用标准类型过滤器查找爱情电影。查询还根据收入对结果进行排名,以查找票房最高的电影。如图所示,结果表包含电影泰坦尼克号的评论。

答案生成

在这一步中,gen 函数使用 LM 生成用户自然语言请求 R 的答案 A。

还是以图 1 为例,在 TAG pipeline 最后阶段,输出有关泰坦尼克号的评论摘要作为对原始用户请求的回答。在示例中,相关数据 被编码为字符串,供模型处理。编码表与原始用户请求 一起传递给 LM。为了获得答案,此步骤利用模型对评论列的语义推理能力来总结评论。

实验及结果

表 1 显示了每种方法的精确匹配准确率和执行时间。如表所示,在选定的 BIRD (一个数据集,用于测试 LMs 的文本到 sql 的能力)查询类型中,研究者发现手写 TAG(hand-written TAG)基线始终能达到 40% 或更高的精确匹配准确率,而其他基线的准确率均未超过 20%。

表格增强生成TAG登场:解锁AI自然语言与数据库的完美结合

具体而言,Text2SQL 在所有基线上的表现都不佳,执行准确率不超过 20%,但在 Ranking 查询上的表现尤其糟糕,准确率只有 10%,因为许多 Ranking 查询需要对文本进行推理。Text2SQL + LM 在各个基线上的表现都同样糟糕,但在基于匹配和比较的查询上表现更差,准确率只有 10%。

对于 RAG,可以看到它在所有查询类型中都不能正确回答单个查询,这表明 RAG 不适合这个领域的查询。

手写 TAG 总体上正确回答了 55% 的查询,在比较查询中表现最佳,精确匹配准确率为 65%。由于精确排序商品的难度较高,该基线在所有查询类型(排名查询除外)中的表现始终良好,准确率超过 50%。总体而言,与标准基线相比,此方法的准确率提高了 20% 至 65%。

表 2 表明,由于省略了答案生成步骤,vanilla Text2SQL 在需要 LM 推理的查询上表现较差,精确匹配准确率为 10%。与此同时,RAG 基线和 Retrieval + LM Rank 基线在所有查询类型上都表现不好,只能正确回答一个查询。相比之下,手写 TAG 基线在需要知识的查询和需要推理的查询上都实现了超过 50% 的准确率。

表格增强生成TAG登场:解锁AI自然语言与数据库的完美结合

值得注意的是,除了提供卓越的准确率外,手写 TAG 方法还提供了高效的实现,与其他基线相比,执行时间少用了 1/3。手写基线对所有查询的平均耗时为 2.94 秒。

最后,该研究定性分析了每个基线在聚合查询上的结果。图 2 为一个示例展示,查询的内容为「提供有关雪邦国际赛车场的比赛资料」。

结果显示,RAG 基线只能提供有关部分比赛的信息,因为大多数相关比赛都无法被检索到。另一方面,Text2SQL + LM 基线无法利用 DBMS 中的任何信息,仅依赖于参数知识并且不提供进一步的分析。

相比较来说,手写基线提供了 1999 年至 2017 年在雪邦国际赛道举行的所有比赛的详尽摘要。

表格增强生成TAG登场:解锁AI自然语言与数据库的完美结合

https://venturebeat.com/data-infrastructure/table-augmented-generation-shows-promise-for-complex-dataset-querying-outperforms-text-to-sql/

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-09-10 14:45:01

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

SEO 已死,LLMO 万岁
...维的向量表示。一旦检索到相关的信息,解码网络会根据自然语言生成能力自动生成响应序列。整个过程几乎可以瞬间完成,这意味着 ChatGPT 可以即时给出查询的答案
2022-12-29 10:00:00
智能体首达Kaggle Grandmaster,华为结构化推理补齐思维链短板
...外部工具(如超参数优化算法、集成方法、计算机视觉和自然语言处理库)协作的内部函数,从而可以最佳方式构建解答。下图展示了 Agent K v1
2024-11-09 09:53:00
科学家建立新评价基准,助力评估大模型数据分析能力
...具。以 GPT-4 为代表的大型语言模型,它们已经能够理解自然语言查询,并能生成相应的代码或分析,让自动数据分析变得更加接近现实。例如,Devin 的成功,激发了人们对基于大
2024-04-07 10:50:00
钉钉十周年推出AI 1.0版本,无招:迎接AI时代的工作方式
...人找事”变成“事找人”。钉钉One也被设计为人与AI通过自然语言对话的统一入口。用户可以长按One 按钮以语音对话,指挥钉钉里的各个 Agent 为你处理工作,例如发起会议、
2025-08-25 14:17:00
百度GBI具有支持自然语言交互、跨数据库分析能力
...商业智能产品——百度GBI。据官方介绍,百度GBI具有支持自然语言交互、跨数据库分析和专业知识学习三方面能力,将商业分析师十几天才能完成的数据分析工作缩短到分钟级。李彦宏称,
2023-10-18 01:38:00
5000字详解Quick BI缘何吸引众多权威机构,四入Gartner并完成象限突破
...其他云产品的依赖。同时,新增的“智能问答”模块通过自然语言查询能力,能够自动生成可视化数据叙事。与前一年相比,Gartner认为Quick BI在大多数关键能力上都有了显著提
2023-05-10 13:00:00
百度GBI发布 支持自然语言交互、跨数据库分析和专业知识学习三种能力 【百度GBI发布 支持自然语言交互、跨数据库分析和专业知识学习三种能力】《科创板日报》17日讯,中国首个生成
2023-10-17 11:39:00
ChatGPT已经慢了,这是国内AI搜索新高度,免费可用
...发与优化同样必不可少:对全网研报进行质量分级,通过自然语言处理和内容质量评估模型筛选出高质量研报资源; 内置涵盖各类金融问题的分析方法库,结合使用深度学习模型和专家知识体系
2024-11-06 09:44:00
辰安科技申请基于自然语言的数据库查询方法专利,使用户无需掌握复杂的数据库查询语言即可获取所需信息
...息显示,北京辰安科技股份有限公司申请一项名为“基于自然语言的数据库查询方法、设备和存储介质”的专利,公开号CN119961283A,申请日期为2025年1月。专利摘要显示,本
2025-05-14 13:34:00
更多关于科技的资讯:
本报讯 日前,我国电器电子产品有害物质管控领域(中国RoHS)首个强制性国家标准《电器电子产品有害物质限制使用要求》经国家标准化管理委员会批准发布
2025-09-10 10:54:00
人工智能赛事火热,百余选手角逐“最强大脑”“算法高手”指尖翻飞 键盘之上跃动智慧南报网讯(记者余梦迪)“嗒嗒!嗒嗒!”9月7日的南京开放大学(南京工匠学院)赛场内
2025-09-10 07:43:00
□通讯员陶炎鲁荟宇林爽姜静南京日报/紫金山新闻记者徐宁“以前我每个月都要从承包商系统中手动导出考核明细表,再结合管理规定进行数据分析并编写通报材料
2025-09-10 07:44:00
5G小微基站 米粒芯片“守门”这种滤波器芯片出自宁企,用于商场、地下车库等场景,使国产高端滤波器实现弯道超车□南京日报/紫金山新闻记者孙秉印 实习生赵璇 通讯员麒轩9月9日
2025-09-10 07:44:00
“贵州白酒云展会”数字化平台于“一码贵州”正式上线
多彩贵州网讯 9月9日,在第十四届中国(贵州)国际酒类博览会盛大开幕之际,“贵州白酒云展会”数字化平台于“一码贵州”正式上线
2025-09-10 00:50:00
投洽会期间厦门火炬高新区共有41个项目完成签约 计划总投资约433亿元
投洽会上,火炬高新区企业展示的芯片产品吸引客商关注。(本组图/厦门日报全媒体记者 卢剑豪 摄)多家位于火炬高新区的专精特新“小巨人”企业亮相投洽会
2025-09-09 08:44:00
刚刚过去的暑假,“工厂游”火爆出圈。多地工厂纷纷敞开大门,推出丰富多彩的研学项目。而在社交平台上,“工厂游”的攻略被大量转发
2025-09-09 08:46:00
东南网9月8日讯(通讯员 苏培婷)9月5日,由大田县总工会、国网大田县供电公司联合主办,国网大田县供电公司工会承办的首届“电力工匠”职业技能竞赛AI技术应用项目比赛圆满落幕
2025-09-09 09:28:00
本报讯 作为中国洗涤用品工业协会主办的行业盛会,第45届(2025)中国洗涤用品行业年会与第17届中国国际日化产品原料及设备包装展览会(以下简称“中国国际日化展”)将于今年10月15日至17日在重庆国际博览中心举行
2025-09-09 10:44:00
摩登中国时尚展传递中国皮革强音
本报记者 解 磊 文/摄为了满足人们对鞋包服饰等消费需求,为国际国内品牌企业、特色区域、独立设计师提供一个高端商贸合作
2025-09-09 10:44:00
近年来,我国消费市场涌现出许多新亮点,其中一个令人意外却极具代表性的现象是:碳纤维最大应用市场,竟然不是航空航天或风电叶片
2025-09-09 10:45:00
获SIAL创新金奖:纸沙拉沙拉脆片掀起零食健康新主张
消费日报网讯 9月1日,在2025 SIAL西雅国际食品展(深圳)举办同期,第24届SIAL创新大赛获奖榜单正式发布。湖南立方体食品有限公司选送的产品纸沙拉沙拉脆片荣获金奖
2025-09-09 11:17:00
王腾发微博辟谣:有失职,但没有窃取机密出售
9月8日,王腾发布离开小米的微博,当天,“小米王腾因泄密被辞退”登上热搜。此前,2023年8月25日,王化曾发博表示,欢迎王腾回京~好好干
2025-09-09 11:18:00
王腾深夜发文离开小米,其曾被赠“谨言慎行”T恤
9月8日晚,中国区市场部总经理、REDMI品牌总经理王腾发布微博:很惭愧跟大家说声抱歉,过去犯了一些错误,接受该有的代价
2025-09-09 11:18:00
前零一万物联创戴宗宏创业:20人团队,能干上百人的AI定制项目
文|周鑫雨编辑|苏建勋国内市场、ToB、定制化——每个词都踩到了当下AI创业的雷点上。但这恰恰是前零一万物联合创始人戴宗宏
2025-09-09 15:19:00