===================
看了其他人的博客都写的很简洁干净,我这边的排版简直要晕。图和代码一起上,小白每一步都要有讲解。。。
===================
虽然weibo的模拟登陆用http://wwwblogs/houkai/p/3487816.html的代码成功了,但是新版微博的标签太复杂,而且爬取一个用户的微博列表的时候,最底端是“正在加载”,不好模拟。因此改爬weibo。
除此之外,weibo比weibo更适合爬取的原因还有:
1、weibo的模拟登陆步骤比weibo要简单;
2、微博列表是分页显示,目前每页有5条;
3、评论,转发列表都是静态加载。
先进行模拟登陆。模拟登陆有两种方法,在pc端操作:
1、user-agent用UC浏览器,模仿手机端,如http://blog.csdn/zhaolina004/article/details/28699095,步骤简单。需要注意的是,虽然在手机端可以采用保存登陆后页面即保存cookie下次直接登陆的方式,pc端则不行。
####15年4月 登陆后地址变为http://weibo/?vt=4 不再显示gsid (事实上显示gsid的网址重定向到weibo/?vt=4,以下截图中会
更多推荐
python爬微博步骤手机_新浪微博爬取笔记(2):wap端模拟登陆 python
发布评论