python爬虫国内外研究现状概况(2)

浏览器与服务器进行对话的方式，既然说道对话的方式，那么就像现实中我们人与人对话一样，我们也讲究方式方法，网路也是如此，我们的request向服务器发起请求也有几种方法，一种是get ,post ,head,HTTP1。1时代，后来有了put,options,connect,trac,delete,大家不用担心它有很多种方法我们记不住，记住get和post这两种请求方法，基本能对百分之九十九的网站接受，这好比一本漫画创江湖，会了这两种方法，我们就可以闯爬虫的江湖了，也没那么高深，大家也别紧张。

那么简单来了解一下get和post的区别，get就是我们单纯的去浏览一个网页，post就比如我们发微博，它是和网页有互动的，所以我们一般用get向静态网页发起请求，

大家看到上图get发起网页请求的步骤，前面是网页协议加上网址，就完成了，学会get我们就可以基本满足了大部分网页，它会返回给我们一个响应码告知我们是否成功,它以一个response返回给我们，就是下图的成功发回一个200响应码，不成功就发回一个403或者404。

我们来形象的看一下，这样说太抽象了，打开一个网页右键检查元素，

开发者工具里的网络里就呈现出一get 就是我们向网页发起的是get请求，右边看到了返回的响应码200,说明是成功的。

以后写爬虫我们第一步就要像这样向网页先发送请求，返回的网页进行解析，然后抓取。

python爬虫国内外研究现状概况(2):http://www.youerw.com/yanjiu/lunwen_84624.html