文章篇章分析技术国内外研究现状
时间:2023-01-18 09:59 来源:毕业论文 作者:毕业论文 点击:次
1 国外研究 文献[[[] Van Dijk T A。 Macrostructures: An interdisciplinary study of global structures in discourse, interaction, and cognition[M]。 Lawrence Erlbaum Associates。 1980。]]的篇章宏观结构理论系统的描述了微观结构与宏观结构的层次关系,它指出微观结构是篇章中的一个句子以及两个按顺序连续排列的句子的结构,而宏观结构与微观结构相对,是篇章整体上的高层次的结构,其基本单元也被扩充到段落及章节等,其中篇章的主题思想,能够体现篇章的主要思想及其脉络。宏观篇章关系在一定程度上体现了篇章整体语义连贯,显示了篇章内各部分之间的关联。87126 文献[[[] Martin J R, Rose D。 Working with discourse: Meaning beyond the clause[M]。 Bloomsbury Publishing。 2003。]]把Halliday功能语法理论的主位概念投射到篇章分析层面,指出了篇章的每个段落往往有一个“主题”,从篇章的角度看,这个主题即段落的“超主位”,超主位之上还有“宏观主位”,在层次上更近一层,宏观主位一般是篇章的主题句,或者主题,能够代表篇章的主要思想。超主位和宏观主位,即宏观层面的主要信息,主要功能是帮助读者预测篇章的主题、目录和段落内容。 文献[[[] Joty S R, Carenini G, Ng R T, et al。 Combining Intra-and Multi-sentential Rhetorical Parsing for Document-level Discourse Analysis[C]。 ACL (1), 2013: 486-496。]]中对于篇章分析则把篇章分析的重心放在了句子内部和句子之间的关系研究,并且结合在这两个部分之间的动态条件随机场,对于篇章结构进行自动构建。该理论在宏观上结合了文献[[[] Joty S, Carenini G, Ng R T。 A novel discriminative framework for sentence-level discourse analysis[C]。 Proceedings of the 2012 Joint Conference on Empirical Methods in Natural Language Processing and Computational Natural Language Learning。 Association for Computational Linguistics, 2012: 904-915。]]中构建的微观理论的关系类型、关系重心确定方法等,借鉴了篇章修辞理论(RST)模型,把篇章结构描述成层次依赖模型,即在局部形成一个文本域,再与前后文本域进行联系。但是对于篇章级段落间关系模型,它并未作详细描述。论文网 2 国内研究 相对于英语篇章分析技术起步早、基础扎实、技术成熟等特点,汉语篇章分析技术起步较晚,无论是基础理论研究还是资源建设等方面大多数是建立在英语篇章结构分析的基础上。文献[[[] 田然。 近二十年汉语语篇研究述评[J]。 汉语学习。 2005,(1):51-55。]],文献[[[] 郑贵友。 汉语篇章分析的兴起与发展[J]。 汉语学习。 2005,(5):40-48。]],文献[[[] 聂仁发。 汉语语篇研究回顾与展望[J]。 宁波大学学报(人文科学版)。 2009,(3): 40-45。]]等对汉语篇章研究进行了较深入的分析,它们指出当前汉语篇章理论尚未形成体系,理论并不能很好的指导实践,传统的句群理论和复句理论均从汉语语法方面的进行论述,并未在篇章结构关系上进行探讨。文献[[[] 陈莉。 现代汉语字母词研究[D]。 吉林大学硕士论文。 2008。]]指出传统的句群理论可以借鉴英文RST的相关理论,加以改造后变成切实可行的汉语篇章结构分析理论,因为句群理论无论在研究对象,还是研究内容与方法上都和RST有互通之处。 文献[[[] 乐明。 汉语篇章修辞结构的标注研究[J]。 中文信息学报。 2008,(4):19-23。]]对于RST理论根据汉语相关的传统复句、句群等理论对中文进行了“本土化”的处理,标注了大量的中文篇章,形成了中文版“RST”语料库,并构建了中文版的修辞结构理论,他把篇章结构以标点符号为边界,提出了12大类47小类能够区分主次的汉语修辞关系。 (责任编辑:qin) |