其中wqi和wdi分别表示查询和问题的特征词,|q|和|d|分别表示查询和问题的特征词个数总和。
2.4 树核模型
传统的信息检索任务采用弓或语言模型等进行检索。然而,这些纯粹的词汇基础的方法往往不足以进行精细级别的文本分析,如果该任务涉及到使用更多不同的语法结构或复杂的语义含义。为了利用更多的结构或句法信息和捕捉语法规则之间的高阶依存关系,柯林斯试图认为,发生在解析树中的所有树片段。他所定义的树片段是任何的子树,其中包括多个节点,与整个规则的制作必须包含的限制。D. Zhang and W. S. Lee通过提出一个稍微不同的定义继承它,其中所有终端符号都纳入子树,认为树内核可以背过的单词线性核。