• 欢迎访问金笔头博客,这是一个菜鸟(伪)程序员的自留地,欢迎访问我的github:点击进入

标签:Python xpath

python

在网页区域内部使用xpath表达式采集信息

在网页区域内部使用xpath表达式采集信息
目标使用xpath表达式抓取如下网页数据:http://m.xiachufang.com/category/1000025/ 并返回一个包含菜谱信息的字典列表,有两种方法可以实现:1.对整个页面分别使用xpath表达式直接取到图片链接列表,标题列表,作者列表,食材列表…再组合成字典列表返回2.分块使用xpath表达式,如下图,先获取各……继续阅读 »

2年前 (2016-11-06) 1149浏览