基于CDTB语料库的篇章关系标注研究(2)_毕业论文

毕业论文移动版

毕业论文 > 计算机论文 >

基于CDTB语料库的篇章关系标注研究(2)

1。2 国内外研究现状 1

1。2。1 国外研究 1

1。2。2 国内研究 2

1。2。3 存在的问题 3

1。3 本文主要研究内容 3

第二章  宏观篇章关系表示体系构建及组成 4

2。1 构建基于CDTB的宏观篇章关系表示体系 4

2。2宏观篇章关系表示体系的组成 5

2。2。1 篇章主题 5

2。2。2 段落关系 6

2。2。3 段落主题 7

第三章  标注方式与方法的研究与提出 8

3。1 宏观篇章关系标注方式 8

3。2 标注内容与方法 8

3。3 标注格式 9

第四章  宏观篇章关系标注平台建设 12

4。1 系统总体架构 12

4。2 功能模块 13

4。2。1 输入系统 13

4。2。2 标注系统 14

4。2。3 输出系统 17

4。3 部分重要功能实现 18

4。3。1 预处理相关方法 18

4。3。2 可视化生成篇章结构树 19

4。3。3 二维切分递归关系树 19

4。4 系统标注实例 20

第五章  宏观篇章关系优点及局限性分析 26

5。1 表示体系及标注方法的优点 26

5。2 标注平台的优势和不足 26

5。3 篇章关系研究的设想与发展 27

结   论 28

致 谢 29

参 考 文 献 30

第一章  绪论

1。1 研究背景及意义

随着人工智能时代的来临,人们对于计算机的依赖程度日益加深。如何进行更为友好自然的人机交互,是目前计算机发展的方向之一。微软的Cortana、苹果公司的Siri越来越走进人们的生活,如何使计算机更懂用户,更加精准的匹配用户需求,为用户实时解决各种问题,是自然语言处理所面临的问题。人与计算机使用自然语言进行交互是未来人工智能发展的方向,因此自然语言处理成为如今人工智能时代的重点和难点。

篇章是继字、词、句之后的自然语言文本分析颗粒度,对篇章进行分析可以探索出篇章原有的内在结构,深度理解文本单元间的语义关系[[[]  丁彬,孔芳,李生,周国栋。 汉语显式篇章关系分析[J]。 中文信息学报。 2014,(6)文献综述

:101-106。]]。对文本单元进行上下文分析和处理,从而挖掘出文本内部丰富的结构化信息,这对自然语言理解和语言生成有着至关重要的作用。近几年来,篇章分析在自然语言处理、计算语言学及人文社科研究领域得到了前所未有的发展,是目前自然语言处理研究领域中最活跃的研究方向之一。

篇章关系是篇章分析的一个重要环节,研究篇章关系有助于构建篇章结构,有利于理解篇章的中心主题、核心重点、展开思路、论据支撑作用等。研究篇章关系能够促进理解篇章的主要思想及篇章的整体行文结构,对于理解篇章整体语义连贯及把握篇章内各部分之间的关联具有积极的作用。研究宏观篇章关系不仅能够对于微观的篇章关系有指导性作用,而且对于自然语言处理的上层应用,如自动文摘、主题抽取、问答系统等提供有力的支持和帮助。论文网 (责任编辑:qin)