• 首页 首页 icon
  • 工具库 工具库 icon
    • IP查询 IP查询 icon
  • 内容库 内容库 icon
    • 快讯库 快讯库 icon
    • 精品库 精品库 icon
    • 问答库 问答库 icon
  • 更多 更多 icon
    • 服务条款 服务条款 icon

论文笔记02——Joint Extraction of Entities and Relations Based on a Novel Decomposition Strategy[ECAI2020]

武飞扬头像
zhkkk333
帮助1

动机

1,解决抽取过程中大量冗余的实体对
2,利用实体对之间的相互关系

摘要

本文首先将联合抽取任务分解为HE抽取和TER抽取两个相互关联的子任务,前者是区分所有可能涉及目标关系的头实体,后者是为每个抽取的头实体识别对应的尾实体和关系。
然后,基于我们提出的基于跨度的标注方案,将这两个子任务进一步解构为几个序列标签问题,并通过分层边界标签器和多跨度解码算法方便地解决这些问题。

想法

1,抽取尾实体和关系时,头实体的信息会有帮助
2,对于一个大任务来讲,分解成小任务会效果更好
3,先抽取头实体,然后抽取关系和尾实体

Methodology

标注方案

对于头实体抽取,分为两个序列标注子任务,第一个识别头实体的起始位置,第二个识别头实体的结束位置.两者的区别在于实体的类型针对尾实体进行标注.
对于关系和尾实体抽取,也是分为两个序列标注任务,第一个标注关系类型为尾实体的起始位置,第二个标注关系类型的结束位置.(相当于进行关系类型的序列标注,然后对标注结果进行最近的合并.
如图:
学新通

分层边界标记器(HBT

抽取器封装起来的一个标记器,分两步进行,第一步是提取起始位置,第二步是提取结束位置.(两步在输入上有所区别和特征的扩充)
第一步:
学新通
hi是词向量表示,
ai是句子的向量表示
第二步:
学新通
pi是位置向量,相对位置生成.
如图:
学新通

提取系统

整体框架
学新通

HE模块

类比HBT
第一步:hi是经过Bi-LSTM的词向量表示,ai是hi的maxpool结果
第二步:一致
经过HE模块,可以得到头实体及其类型

TER模块

考虑到了头实体起始位置,头实体结束位置,关系表示,起始位置和结束位置的distance,提出了
学新通
其中h[h]是该实体起始位置和结束位置的拼接
pi[ht]是相对位置向量

损失函数

两个交叉熵函数之和:Lhe Lter

trick

技巧点就在于如何利用丰富的特征.

这篇好文章是转载于:学新通技术网

  • 版权申明: 本站部分内容来自互联网,仅供学习及演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,请提供相关证据及您的身份证明,我们将在收到邮件后48小时内删除。
  • 本站站名: 学新通技术网
  • 本文地址: /boutique/detail/tanhgcjbeh
系列文章
更多 icon
同类精品
更多 icon
继续加载