要能适合大型文章系统的
我在网上找到一篇 “(MS SQL)如何实现相关文章功能(多关键字匹配)改进版”http:-//blog.csdn.-net/chenggongit/archive/2008/11/19/3335296.aspx
感觉不太好,因为每个关键词都要占一条记录,如果我们1千万篇文章,每篇文章有3个关键词, 那就有3千万条关键词记录,个人感觉这对服务器是不好的压力
能不能说说更好的思路
非常简单的事,用一个表保存某个关键字的对应的文章id。
到时候查询到相关的几个关键字就得到一大片id,这些都是相关文章了。
通过分词提取相关关键字
添加到关键字表,多关键字查询