您的位置首页  散文随感

学到了cs key(cs可以组什么词)


公众号关注 “ML_NLP”设为 “星标”,重磅干货,第一时间送达!
机器学习算法与自然语言处理出品@公众号原创专栏作者 徐啸学校 | 哈工大SCIR直博推免生最近会逐步将博

学到了cs key(cs可以组什么词)

 

公众号关注 “ML_NLP”设为 “星标”,重磅干货,第一时间送达!

机器学习算法与自然语言处理出品@公众号原创专栏作者 徐啸学校 | 哈工大SCIR直博推免生最近会逐步将博客上的 CS224n-2019 笔记搬到知乎上来,后续也会新增 CS224n-2020 里的更新部分:CS224n-2020 并未更新 Note 部分,但课程的部分课件进行了教学顺序上的调整与修改(Suggested Readings 也相应变动),需要注意的是三个 Guest Lecture 都是全新的。

本文为 Lecture 05 Linguistic Structure: Dependency Parsing 与 Notes 04 Dependency Parsing 的笔记Useful links。

课程官网:Stanford CS224n || Stanford CS224n-2019课程材料:LooperXX/CS224n-Resource || LooperXX/CS224n-Reading-Notes

课程视频:YouTube国内视频资源:2019版|英文字幕(仍在更新) || 2019版|英文字幕(全)||2017版|中英字幕如有疏漏之处,还望不吝赐教~Lecture 05 Linguistic Structure: Dependency Parsing

Lecture PlanSyntactic Structure: Consistency and DependencyDependency Grammar and TreebanksTransition-based dependency parsing

Neural dependency parsingDependency Parsing: 依存关系语法分析,简称 依存分析1. Two views of linguistic structureConstituency Parsing。

Constituency = phrase structure grammar = context-free grammars (CFGs)context-free grammars (CFGs) 无上下文语法

句子是使用逐步嵌套的单元构建的短语结构将单词组织成嵌套的成分起步单元:单词被赋予一个类别 (part of speech=pos 词性)单词组合成不同类别的短语短语可以递归地组合成更大的短语

上图中Det 指的是 Determiner,在语言学中的含义为 限定词NP 指的是 Noun Phrase ,在语言学中的含义为 名词短语VP 指的是 Verb Phrase ,在语言学中的含义为 动词短语

P 指的是 Preposition ,在语言学中的含义为 介词PP 指的是 Prepositional Phrase ,在语言学中的含义为 介词短语

中文中,介词短语会出现在动词之前Example : The cat by the large crate on the large table by the door

但是另一种观点在计算语言学中占主导地位。Dependency Parsing不是使用各种类型的短语,而是直接通过单词与其他的单词关系表示句子的结构,显示哪些单词依赖于(修饰或是其参数)哪些其他单词

 是整个句子的根源, 

 依赖于 

 (或者说 

 是 

 的依赖)

 都是 

 的依赖

 是 

 的修饰

 都是 

 的依赖

 是 

 的依赖Why do we need sentence structure?为了能够正确地解释语言,我们需要理解句子结构人类通过将单词组合成更大的单元来传达复杂的意思,从而交流复杂的思想我们需要知道什么与什么相关联

除非我们知道哪些词是其他词的参数或修饰词,否则我们无法弄清楚句子是什么意思Prepositional phrase attachment ambiguity介词短语依附歧义

警察用刀杀了那个男子cops 是 kill 的 subject (subject 指 主语)man 是 kill的 object (object 指 宾语)knife 是 kill 的 modifier

 (modifier 指 修饰符)警察杀了那个有刀的男子knife 是 man 的 modifier (名词修饰符,简称为 nmod )

from space 这一介词短语修饰的是前面的动词 count 还是名词 whales ?这就是人类语言和编程语言中不同的地方关键的解析决策是我们如何 “依存” 各种成分介词短语、状语或分词短语、不定式、协调等。

上述句子中有四个介词短语board 是 approved 的 主语,acquisition 是 approved 的谓语by Royal Trustco Ltd. 是修饰 acquisition 的,即董事会批准了这家公司的收购

of Toronto 可以修饰 approved, acquisition, Royal Trustco Ltd. 之一,经过分析可以得知是修饰 Royal Trustco Ltd. 即表示这家公司的位置

for $27 a share 修饰 acquisitionat its monthly meeting 修饰 approved ,即表示批准的时间地点面对这样复杂的句子结构,我们需要考虑 指数级 的可能结构,这个序列被称为 

Catalan numbersCatalan numbers : 

一个指数增长的序列,出现在许多类似树的环境中例如,一个 n+2 边的多边形可能的三角剖分的数量出现在概率图形模型的三角剖分中(CS228)Coordination scope ambiguity协调范围模糊

例句:Shuttle veteran and longtime NASA executive Fred Gregory appointed to board一个人:[[Shuttle veteran and longtime NASA executive] Fred Gregory] appointed to board

两个人:[Shuttle veteran] and [longtime NASA executive Fred Gregory] appointed to board

例句:Doctor: No heart, cognitive issuesAdjectival Modifier Ambiguity形容词修饰语歧义

例句:Students get first hand job experiencefirst hand 表示 第一手的,直接的,即学生获得了直接的工作经验first 是 hand 的形容词修饰语(amod)

first 修饰 experience, hand 修饰 job

免责声明:本站所有信息均搜集自互联网,并不代表本站观点,本站不对其真实合法性负责。如有信息侵犯了您的权益,请告知,本站将立刻处理。联系QQ:1640731186