Python爬虫学习

论坛 期权论坛 期权     
今天努力了吗程序狗   2019-7-20 20:08   2224   0
在学习Python提前安装request包,安装方法
用win+R打开控制命令行,然后输入pip install requests(注意要求电脑联网)


Request对象的属性
安装好requests包之后就开始爬虫学习了,先测试一下我门安装的requests包是否成功,我们就以百度网站做一个测试爬取网站信息
2019年7月19日
16:06
r.status_code
HTTP请求返回状态,200表示连接成功,404表示连接失败
r.text      
HTTP响应内容的字符串形式,即,url对应页面内容
r.encoding
从HTTPheader中猜测响应内容的编码方式
r.apparent_enconding
从内容中分析响应内容编码方式(备选编码方式)
r.content
HTTP响应内容的二进制数




至此百度页面被我们抓取下来了
分享到 :
0 人收藏
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

积分:10
帖子:2
精华:0
期权论坛 期权论坛
发布
内容

下载期权论坛手机APP