python + request + lxml的几个例子

例子没有加入失败后重做的功能,这个也可以考虑增加。
第三个例子加入了访问频率控制
遍历图片的例子加入多线程,明显爬得快很多

解析163新闻列表的例子:

遍历糗事百科的文章,只遍历导航上面的几个分类,热门,最新,等等

遍历新浪一些博客的图片,加入了访问频率控制

上面的例子改成多线程