2.1 人工复制
人工去网页中查找复制微博,这是最基础的并且能够保证数据价值的方式。然而 这与我们的初衷想悖。并且人工查找复制耗费大量的人力物力,且不适合获取微博中 的海量数据,因此暂不考虑。
2.2 API 接口技术
2.2.1 简介
API 接口是由微博提供以便开发者调用访问的开放平台,利用 API 第三方应用接 口可以一次性的批量获取用户的数据信息,不需要页面级爬取解析,可以比较方便的 获取需要的数据。
2.2.2 应用创建开发流程
在开放平台上,想要使用新浪微博提供的 API 接口的所有功能,必须创建自己的 应用。
python基于新浪微博的网络爬虫和信息采集系统设计(4):http://www.youerw.com/yanjiu/lunwen_77017.html