【关于 Complex KBQA】 那些你不知道的事 (上)

共 2397字,需浏览 5分钟

 ·

2021-09-16 10:08



作者:杨夕

项目地址:https://github.com/km1994/nlp_paper_study

面经地址:https://github.com/km1994/NLP-Interview-Notes

论文:A Survey on Complex Knowledge Base Question Answering:Methods, Challenges and Solutions

会议:IJCAI'2021

论文地址:https://www.ijcai.org/proceedings/2021/0611.pdf

扩展长论文地址:https://arxiv.org%2Fpdf%2F2108.06688.pdf#=&zoom=130

个人介绍:大佬们好,我叫杨夕,该项目主要是本人在研读顶会论文和复现经典论文过程中,所见、所思、所想、所闻,可能存在一些理解错误,希望大佬们多多指正。

摘要

知识库问答(KBQA)旨在回答知识库(KB)上的问题。最近,大量研究集中在语义或句法复杂的问题上。本文详细总结了复杂KBQA的典型挑战和解决方案. 我们开始介绍有关 KBQA 任务的背景。接下来,我们介绍了复杂 KBQA 的两种主流方法,即基于语义解析(SP-based)的方法和基于信息检索(IR-based)的方法。然后我们从两大类的角度综合回顾了先进的方法。具体地,我们阐述了它们对典型挑战的解决方案。最后,我们总结并讨论了未来研究的一些有希望的方向。

一、论文背景

知识库 (KB) 是一种结构化数据库,其中包含形式(主题、关系、对象)的事实集合。已经构建了大型知识库,例如 Freebase[Bollackeret al., 2008]、DBPedia [Lehmannet al., 2015] 和 Wikidata [Tanonet al., 2016],以服务于许多下游任务。基于可用的知识库,知识库问答 (KBQA) 是一项旨在以知识库为知识源回答自然语言问题的任务。KBQA 的早期工作 [Bordeset al., 2015; Donget al., 2015; Huet al., 2018a; Lanet al., 2019a]专注于回答简单的问题,其中只涉及一个事实。例如,“JK 罗琳出生在哪里?”是一个简单的问题,可以仅使用“(J.K.罗琳,出生地,英国)”这一事实来回答。

二、论文动机

相比仅包含单个关系事实的简单问题,复杂问题通常有以下几个特征。我们以文中的例子 “谁是杰夫·普罗斯特秀提名的电视制片人的第一任妻子?” 为例:


图 1:问题“谁是杰夫·普罗斯特秀提名的电视制片人的第一任妻子?”问题的复杂 KBQA 示例。我们为这个问题提供了相关的知识库子图。回答这个问题的真实路径用彩色边框标注。主题实体和答案实体分别以粗体和阴影框显示。“多跳”推理、“约束”关系和“数值”操作在黑色虚线框内突出显示。我们使用不同的颜色来表示从主题实体到达每个实体的不同推理跳数

  1. 需要在知识图谱中做多跳推理 (multi-hop reasoning):该问题主干需要两跳的推理,即“杰夫·普罗斯特秀提名的人”和“他的妻子”。

  2. 需要考虑题目中给的限制词 (constrained relations):该问题中出现的限制词“电视制片人”需要在回答问题的时候被考虑到。

  3. 需要考虑数字运算的情况 (numerical operations):该问题询问涉及序数“第一任”,因此需要对召回的实体进行排序操作。

直接将传统知识图谱问答模型运用到复杂问题上,不管是基于语义解析的方法还是信息检索的方法都将遇到新的挑战

  1. 传统方法无法支撑问题的复杂逻辑

    1. 现有的 SP-based 的方法中使用的解析器难以涵盖各种复杂的查询(例如,多跳推理、约束关系和数值运算)。

    2. 以前的 IR-based 的方法可能无法回答复杂的查询,因为它们排名是在没有可追溯推理的情况下对小范围实体进行的。

  2. 复杂问题包含了更多的实体,导致在知识图谱中搜索空间变大:复杂问题中更多的关系和主题意味着更大的潜在逻辑形式的搜索空间,这将大大增加计算成本。同时,更多的关系和主题可能会阻止 IR-based 的方法检索所有相关实体进行排名。3.两种方法都将问题理解作为首要步骤:这两种方法都将问题理解视为首要步骤。当问题在语义和句法方面变得复杂时,模型需要具有强大的自然语言理解和泛化能力。

  3. 通常 Complex KBQA 数据集缺少对正确路径的标注对于复杂的问题,将真实路径标记为答案是很昂贵的。一般只提供问答对。这表明 SP-based 的方法和 IR-based 的方法必须分别在没有正确逻辑形式和推理路径注释的情况下进行训练。这种微弱的监督信号给这两种方法带来了困难。

三、KBQA benchmark datasets


表 1:几个复杂的 KBQA 基准数据集。“LF”表示数据集是否提供 Logic Forms,“NL”表示数据集是否包含 crowd workers 以重写 Natural Language 中的问题

参考

  1. A Survey on Complex Knowledge Base Question Answering:Methods, Challenges and Solutions

  2. 複雜知識庫問答:方法、挑戰與解決方案綜述

  3. 可能是目前最全面的知识库复杂问答综述解读

  4. [读综述] 关于知识图谱问答的神经网络方法的介绍

  5. KBQA知识库问答论文分享


浏览 54
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报