2.3 网页存储器与分析索引器

  Web页面被抓取回来后需要暂时的保存起来,以方便索引器的分析,通常情况下有页面存储器和索引软件来完成这些功能。页面存储器提供了两个接口:一个是为爬虫提供存储抓取到的页面,另一个则是为索引器和分析器提供获取页面的接口。页面存储器的涉及重要考虑页面的规模、页面的访问方式和数据更新以及页面的删除问题。当网络爬虫将网页抓取后存储在页面存储器中后,分析索引软件对页面信息进行自动分析和索引,然后建立提供查询的索引数据库。

上一篇:opencv基于视觉的交叉路口分析
下一篇:基于组合导航系统的地图创建技术

微博热搜”机制的创新传...

语音信号的基音周期提取方法研究

社交网络上用户建模融合...

微博社交网络社区发现方法的研究

深度学习的图像语义提取研究

基于安卓的微博客户端设计

社交网络上用户建模融合...

LiMn1-xFexPO4正极材料合成及充放电性能研究

安康汉江网讯

网络语言“XX体”研究

张洁小说《无字》中的女性意识

ASP.net+sqlserver企业设备管理系统设计与开发

互联网教育”变革路径研究进展【7972字】

新課改下小學语文洧效阅...

麦秸秆还田和沼液灌溉对...

我国风险投资的发展现状问题及对策分析

老年2型糖尿病患者运动疗...