浏览器与服务器进行对话的方式,既然说道对话的方式,那么就像现实中我们人与人对话一样,我们也讲究方式方法,网路也是如此,我们的request向服务器发起请求也有几种方法,一种是get ,post ,head,HTTP1。1时代,后来有了put,options,connect,trac,delete,大家不用担心它有很多种方法我们记不住,记住get和post这两种请求方法,基本能对百分之九十九的网站接受,这好比一本漫画创江湖,会了这两种方法,我们就可以闯爬虫的江湖了,也没那么高深,大家也别紧张。
那么简单来了解一下get和post的区别,get就是我们单纯的去浏览一个网页,post就比如我们发微博,它是和网页有互动的,所以我们一般用get向静态网页发起请求,
大家看到上图get发起网页请求的步骤,前面是网页协议加上网址,就完成了,学会get我们就可以基本满足了大部分网页,它会返回给我们一个响应码告知我们是否成功,它以一个response返回给我们,就是下图的成功发回一个200响应码,不成功就发回一个403或者404。
我们来形象的看一下,这样说太抽象了,打开一个网页右键检查元素,
开发者工具里的网络里就呈现出一get 就是 我们向网页发起的是get请求,右边看到了返回的响应码200,说明是成功的。
以后写爬虫我们第一步就要像这样向网页先发送请求,返回的网页进行解析,然后抓取。