停止爬网:必须单击“确定”确认要停止爬网。所选内容源的“状态”栏中的值将变为“空闲”。
4、 创建或编辑爬网规则
1) 确认执行此过程的用户帐户是 Search Service 应用程序的管理员。
2) 在管理中心的“应用程序管理”部分,单击“管理服务应用程序”。
3) 在“管理服务应用程序”页上的服务应用程序列表中,单击“Search Service 应用程序”。
4) 在“搜索管理”页上的“爬网”部分,单击“爬网规则”。即会显示“管理爬网规则”页。
5) 若要创建新的爬网规则,请单击“新建爬网规则”。若要编辑现有爬网规则,请在爬网规则列表中,指向要编辑的爬网规则的名称,单击出现的箭头,然后单击“编辑”。
6) 在“添加爬网规则”页上的“路径”部分:
a) 在“路径”框中,键入将应用爬网规则的路径。可以在路径中使用标准通配符。
b) 若要使用正则表达式而非通配符,请选择“与此规则匹配时使用正则表达式语法”。
7) 在“爬网配置”部分,选择下列选项之一:
a) 排除此路径中的所有项目。如果要从爬网中排除指定路径中的所有项目,请选择此选项。如果选择此选项,则可以通过选择以下项来细化所排除的内容:排除复杂 URL(即包含问号(?)的 URL)。如果要排除的 URL 包含使用问号 (?) 符号的参数,请选择此选项。
b) 包含此路径中的所有项目。如果要对路径中的所有项目进行爬网,请选择此选项。如果选择此选项,则可以通过选择下列各项的任意组合来进一步细化所包含的内容:使用该 URL 上的链接,而不对该 URL 本身进行爬网。如果要对 URL 中包含的链接进行爬网但不对起始 URL 本身进行爬网,请选择此选项。对复杂 URL (包含问号(?)的 URL)进行爬网。如果要对包含使用问号 (?) 符号的参数的 URL 进行爬网,请选择此选项。将 SharePoint 内容作为 http 页面进行爬网。通常使用特殊协议对 SharePoint 网站进行爬网。如果要改为将 SharePoint 网站作为 HTTP 页面进行爬网,请选择此选项。使用 HTTP 协议对内容进行爬网时,不会存储项目权限。
5、 对 URL 测试爬网规则
1) 确认执行此过程的用户帐户是 Search Service 应用程序的管理员。
2) 在管理中心的“应用程序管理”部分,单击“管理服务应用程序”。
3) 在“管理服务应用程序”页上的服务应用程序列表中,单击“Search Service 应用程序”。
4) 在“搜索管理”页上的“爬网”部分,单击“爬网规则”。
5) 在“管理爬网规则”页上的“键入某个 URL,然后单击‘测试’以了解其是否符合规则”框中,键入要测试的 URL。
6) 单击“测试”,测试结果将显示在“键入某个 URL,然后单击‘测试’以了解其是否符合规则”框的下方。
6、 删除爬网规则
1) 确认执行此过程的用户帐户是 Search Service 应用程序的管理员。
2) 在管理中心的“应用程序管理”部分,单击“管理服务应用程序”。
3) 在“管理服务应用程序”页上的服务应用程序列表中,单击“Search Service 应用程序”。
4) 在“搜索管理”页上的“爬网”部分,单击“爬网规则”。
5) 在“管理爬网规则”页上的爬网规则列表中,指向要删除的爬网规则的名称,单击出现的箭头,然后单击“删除”。
上一篇:基于WCF的消息推送服务研究与实现
下一篇:基于.net的企业级系统架构的设计与实现

基于Apriori算法的电影推荐

基于PageRank算法的网络数据分析

基于神经网络的验证码识别算法

基于网络的通用试题库系...

python基于决策树算法的球赛预测

基于消费者个性特征的化...

项目管理茬软件中的應用【5351字】

AT89C52单片机的超声波测距...

志愿者活动的调查问卷表

公寓空调设计任务书

医院财务风险因素分析及管理措施【2367字】

国内外图像分割技术研究现状

神经外科重症监护病房患...

承德市事业单位档案管理...

中国学术生态细节考察《...

C#学校科研管理系统的设计

10万元能开儿童乐园吗,我...