管理进化

表格问答常见实现方案有哪些


摘要:当前表格知识问答的实现方案主流方式有:端到端的 NL2SQL、多轮对话形式的 SQL 关键字提取两种。

详细解答:

当前表格知识问答的实现方案主流方式有:端到端的 NL2SQL、多轮对话形式的 SQL 关键字提取两种。

1、端到端的 NL2SQL

NL2SQL(Natural Language to SQL)是一项将用户的自然语言语句转成可执行的SQL 语句的技术,有很大的实际应用价值,对改善用户与数据库之间的交互方式有重大意义。

企业的关系数据库通常存储了大量和生产运营相关的数据。通常查询数据库中的数据需要通过像 SQL 这样的程序式查询语言来进行交互,这就需要懂 SQL 语言的专业技术人员来执行这一操作。

为了让非专业用户也可以按需查询数据库,当前流行的技术方案设计了基于条件筛选的专门界面,用户可以通过点选不同的条件来查询数据库。通过界面操作,虽然可以满足基本的查询需求,但是极大地限制了数据库查询的使用场景和查询效果。

同时,即使对于精通数据库程序语言的专业人士,根据需求正确的书写 SQL 语句,维护这样一个查询界面也是一项重复度较高的工作。

于是如何通过自然语言自由地查询数据库中的目标数据成为了新兴的研究热点。Natural Language to SQL (NL2SQL) 就是这样的一项技术,它可以将访客的诉求转为可以执行的 SQL 语句。

在深度学习端到端解决方案流行之前,NL2SQL 的解决方案主要是通过高质量的语法树和词典来构建语义解析器,分析访客的诉求,再将分析的结果依据规则转写成相应的 SQL。

最新的解决方案是基于端到端模型与 SQL 特征规则相结合,例如 X-SQL,HydraNet 等。

2、基于多轮对话形式的 SQL 关键字提取

这种方式是把访客的意图看成一个任务型对话过程,首先把 SQL 常见的查询方式整理成一个对话流程,完成这个查询需要的条件,设置成对话中的槽位,通过一轮或者多轮从用户获取需要的 SQL 关键字,最后和用户确认查询的含义,并且返回最后的答案。

这种方式和 NL2SQL 表格问答最大的差别是, NL2SQL 的表格问答是模型自动抽取 SQL 中的所有关键字,不需要人工介入。

而多轮对话形式的 SQL 是把 SQL 关键字提取转成对话的槽位,系统没理解的部分,可以通过澄清话术再次询问用户,降低了难度。

但是这种方式需要事先配置多个对话流程,把主流的 SQL 语法都涵盖进去,人工成本巨大,不利于领域迁移。

以上就是关于表格问答两种实现方案的一些介绍,相信你已经有所了解。

智齿客服