modify somewhere

avx_docs
zhangjcqq 8 years ago committed by GitHub
parent aa0e415f96
commit 9aa88426e1

@ -1,6 +1,6 @@
# 语义角色标注教程 #
语义角色标注Semantic role labeling, SRL是浅层语义解析的一种形式其目的是在给定的输入句子中发现每个谓词的谓词参数结构。 SRL作为很多自然语言处理任务中的中间步骤是很有用的如信息提取、文档自动分类和问答。 实例如下 [1]:
语义角色标注Semantic role labeling, SRL是浅层语义解析的一种形式其目的是在给定的输入句子中发现每个谓词的谓词论元结构。 SRL作为很多自然语言处理任务中的中间步骤是很有用的如信息提取、文档自动分类和问答。 实例如下 [1]:
[ <sub>A0</sub> He ] [ <sub>AM-MOD</sub> would ][ <sub>AM-NEG</sub> nt ] [ <sub>V</sub> accept] [ <sub>A1</sub> anything of value ] from [<sub>A2</sub> those he was writing about ].
@ -12,9 +12,9 @@
- AM-MOD: 情态动词
- AM-NEG: 否定
给定动词“accept”句子中的大部分将会扮演某些语义角色。这里,标签方案来自 Penn Proposition Bank。
给定动词“accept”句子中的组块将会扮演某些语义角色。这里,标签方案来自 Penn Proposition Bank。
到目前为止大多数成功的SRL系统是建立在某种形式的解析结果之上的,其中在语法结构上使用了预先定义的特征模板。 本教程将介绍使用深度双向长短期记忆DB-LSTM模型[2]的端到端系统来解决SRL任务这在很大程度上优于先前的最先进的系统。 这个系统将SRL任务视为序列标注问题。
到目前为止大多数成功的SRL系统是建立在某种形式的句法分析结果之上的,使用了基于句法结构的预定义特征模板。 本教程将介绍使用深度双向长短期记忆DB-LSTM模型[2]的端到端系统来解决SRL任务这在很大程度上优于先前的最先进的系统。 这个系统将SRL任务视为序列标注问题。
## 数据描述
相关论文[2]采用 CoNLL-20052012 共享任务中设置的数据进行训练和测试。由于数据许可的原因,演示采用 CoNLL-2005 的测试数据集,可以在网站上找到。
@ -45,7 +45,7 @@ feature: the extracted features from data set
</center>
### 特征
两个输入特在这个流程中起着至关重要的作用predicatepred和argumentarguments。 还采用了两个其他特征谓词上下文ctx-p和区域标记mr。 因为单个谓词不能精确地描述谓词信息,特别是当相同的词在句子中出现多于一次时。 使用谓词上下文,可以在很大程度上消除歧义。类似地,如果它位于谓词上下文区域中,则使用区域标记 m<sub>r</sub> = 1 来表示参数位置,反之则 m<sub>r</sub> = 0。这四个简单的特征是我们的SRL系统所需要的。上下文大小设置为1的一个样本的特征如下[2]所示:
两个输入特在这个流程中起着至关重要的作用predicatepred和argumentarguments。 还采用了两个其他特征谓词上下文ctx-p和区域标记mr。 因为单个谓词不能精确地描述谓词信息,特别是当相同的词在句子中出现多于一次时。 使用谓词上下文,可以在很大程度上消除歧义。类似地,如果它位于谓词上下文区域中,则使用区域标记 m<sub>r</sub> = 1 来表示参数位置,反之则 m<sub>r</sub> = 0。这四个简单的特征是我们的SRL系统所需要的。上下文大小设置为1的一个样本的特征如下[2]所示:
<center>
![pic](./feature.jpg)
</center>

Loading…
Cancel
Save