1.2.2 倒排
常用的索引方式有倒排、后缀数组和签名文件等3种,其中倒排索引因为高效率并且符合人们思维习惯所以应用最为广泛[9]。倒排是一种面向词条的索引机制,他的每一项(Iterm)由词条(Term)和出现情况(位置和次数)列表信息两部分组成。在对文本实施倒排之后,信息就被以词条(Term)为单位分割出来,并辅以该词条在原书中的页数,从而构成一个倒排的基本单位