lecture5-Dependency Parsing(笔记)

1.为了正确解释理解语言,首先需要理解句子的结构。例如下面的例子:

San Jose cops kill man with knife

这句话可能会有歧义,一种理解是:警察用刀杀了那个男子。

这种翻译的理解是:

  • copskillsubject (subject 指 主语)
  • mankillobject (object 指 宾语)
  • knifekillmodifier (modifier 指 修饰符)

另一种理解是:警察杀了那个有刀的男子。

在这里:knifemanmodifier (名词修饰符,简称为 nmod )

2.对于句法结构(syntactic structure)分析,主要有两种方式:Constituency Parsing与Dependency Parsing。

Constituency Parsing主要用phrase structure grammer即短语语法来不断的将词语整理成嵌套的组成成分,又被称为context-free grammers,简写做CFG。

其主要步骤是先对每个词做词性分析part of speech, 简称POS,然后再将其组成短语,再将短语不断递归构成更大的短语。

3.句法结构分析的另一种方式是Denpendency Parsing,Dependency Structure展示了词语之前的依赖关系,通常用箭头表示其依存关系,有时也会在箭头上标出其具体的语法关系,如是主语还是宾语关系等。

Dependency Structure有两种表现形式,一种是直接在句子上标出依存关系箭头及语法关系,另一种是将其做成树状机构(Dependency Tree Graph)。

Dependency Parsing可以看做是给定输入句子 [公式] (其中w0常常是fake ROOT,使得句子中每一个词都依赖于另一个节点)构建对应的Dependency Tree Graph的任务。而这个树如何构建呢?一个有效的方法是Transition-based Dependency Parsing。

Transition-based Dependency Parsing

Transition-based Dependency Parsing可以看做是state machine,对于 [公式] ,state由三部分构成 [公式]

𝜎是S中若干wi构成的stack。𝜷是S中若干wi构成的buffer。

未完待续。。。