论文笔记02——Joint Extraction of Entities and Relations Based on a Novel Decomposition Strategy[ECAI2020]
动机
1,解决抽取过程中大量冗余的实体对
2,利用实体对之间的相互关系
摘要
本文首先将联合抽取任务分解为HE抽取和TER抽取两个相互关联的子任务,前者是区分所有可能涉及目标关系的头实体,后者是为每个抽取的头实体识别对应的尾实体和关系。
然后,基于我们提出的基于跨度的标注方案,将这两个子任务进一步解构为几个序列标签问题,并通过分层边界标签器和多跨度解码算法方便地解决这些问题。
想法
1,抽取尾实体和关系时,头实体的信息会有帮助
2,对于一个大任务来讲,分解成小任务会效果更好
3,先抽取头实体,然后抽取关系和尾实体
Methodology
标注方案
对于头实体抽取,分为两个序列标注子任务,第一个识别头实体的起始位置,第二个识别头实体的结束位置.两者的区别在于实体的类型针对尾实体进行标注.
对于关系和尾实体抽取,也是分为两个序列标注任务,第一个标注关系类型为尾实体的起始位置,第二个标注关系类型的结束位置.(相当于进行关系类型的序列标注,然后对标注结果进行最近的合并.
如图:
分层边界标记器(HBT
抽取器封装起来的一个标记器,分两步进行,第一步是提取起始位置,第二步是提取结束位置.(两步在输入上有所区别和特征的扩充)
第一步:
hi是词向量表示,
ai是句子的向量表示
第二步:
pi是位置向量,相对位置生成.
如图:
提取系统
整体框架
HE模块
类比HBT
第一步:hi是经过Bi-LSTM的词向量表示,ai是hi的maxpool结果
第二步:一致
经过HE模块,可以得到头实体及其类型
TER模块
考虑到了头实体起始位置,头实体结束位置,关系表示,起始位置和结束位置的distance,提出了
其中h[h]是该实体起始位置和结束位置的拼接
pi[ht]是相对位置向量
损失函数
两个交叉熵函数之和:Lhe Lter
trick
技巧点就在于如何利用丰富的特征.
这篇好文章是转载于:学新通技术网
- 版权申明: 本站部分内容来自互联网,仅供学习及演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,请提供相关证据及您的身份证明,我们将在收到邮件后48小时内删除。
- 本站站名: 学新通技术网
- 本文地址: /boutique/detail/tanhgcjbeh
系列文章
更多
同类精品
更多
-
论文阅读|ViTPose
-
论文简述和翻译PSMNetPyramid Stereo Matching NetworkCVPR 2018
-
论文笔记ViT An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale
-
论文笔记ICML‘21 FedGNN: Federated Graph Neural Network for Privacy-Preserving Recommendation
-
论文笔记四影像图水体识别和提取技术研究综述
-
EGO-Planner: An ESDF-free Gradient-based Local Planner for Quadrotors论文笔记
-
photoshop保存的图片太大微信发不了怎么办
PHP中文网 06-15 -
Android 11 保存文件到外部存储,并分享文件
Luke 10-12 -
《学习通》视频自动暂停处理方法
HelloWorld317 07-05 -
word里面弄一个表格后上面的标题会跑到下面怎么办
PHP中文网 06-20 -
photoshop扩展功能面板显示灰色怎么办
PHP中文网 06-14 -
微信公众号没有声音提示怎么办
PHP中文网 03-31 -
excel下划线不显示怎么办
PHP中文网 06-23 -
excel打印预览压线压字怎么办
PHP中文网 06-22 -
怎样阻止微信小程序自动打开
PHP中文网 06-13 -
TikTok加速器哪个好免费的TK加速器推荐
TK小达人 10-01