• 欢迎访问金笔头博客,这是一个菜鸟(伪)程序员的自留地,欢迎访问我的github:点击进入

标签:Python模拟浏览器

python

[解决方案]Python模拟浏览器抓取网页,返回数据无法解码

[解决方案]Python模拟浏览器抓取网页,返回数据无法解码
1.问题背景:今天在使用Python的urllib2模块模拟浏览器获取http://lusongsong.com/daohang/数据的时候,返回的数据一直是乱码,而且还无法检测出返回数据的具体类型,试了各种解码方式都没有成功。2.问题分析:在http请求中,为了减少传输时的数据量,如果在请求头request header中包含了’Acc……继续阅读 »

3年前 (2015-10-18) 2526浏览