- 主要是re,requests,BeautifulSoup,urllib2的使用总结
1.requests基本用法示例
使用requests加载网站
1 | # coding:utf-8 |
requests 发送请求与传递参数
1 | import requests |
requests 接口统一,使用方便
- requests.get(‘https://github.com/timeline.json’) #GET请求
- requests.post(“http://httpbin.org/post”) #POST请求
- requests.put(“http://httpbin.org/put”) #PUT请求
- requests.delete(“http://httpbin.org/delete”) #DELETE请求
- requests.head(“http://httpbin.org/get”) #HEAD请求
- requests.options(“http://httpbin.org/get”) #OPTIONS请求
###
requests使用post发送json请求
1 | import requests |
requests 定制header:
1 |
|
requests 代理访问
- 有时候为了避免封IP,或者在某些公司内网访问外网时候,需要用到代理服务器发送请求,代理的用法示例:
1 | import requests |
更多详细的用法还是需要阅读官方库,requests几乎可以代替urllib的使用
2.urllib2 使用示例
使用urllib2加载一个网页的html(方便使用Soup进行解析)
1 | import urllib2 |