TF-IDF算法文本关键词的提取及优化研究(4)_毕业论文

毕业论文移动版

毕业论文 > 计算机论文 >

TF-IDF算法文本关键词的提取及优化研究(4)


2.3.2 中文分词的常用算法
现有的分词算法可以分成三大类:基于理解的分词方法、基于字符串匹配的分词方法和基于统计的分词方法。如果考虑与词性标注的过程结合,也可以应用分词与标注和单纯分词方法互相结合的一体化方法。下面介绍下三大类分词算法 (责任编辑:qin)