源代码"/>
寻找壹心理网站内置目录源代码
寻找壹心理网站内置目录源代码
以前爬壹心理咨询师资料的时候,用到的是普通的url。翻页的时候url是会改变的,这里举觅健的例子。
在爬觅健肺癌圈子里的贴子的时候,它的每一页都有对应的url,比如圈子第三页的url是.html
第四页的url是
.html
那么在爬取帖子的时候,只需要改变url中的数字就可以实现翻页的功能。
原来壹心理咨询师页面的形式跟觅健是一样的。然而前几天我在重新爬壹心理的时候发现壹心理的网页源代码全部翻了个新。现在壹心理咨询师的url是。
现在壹心理的网页无论怎么翻页,url都是不变的。而且在查询网页源代码的时候,会发现源代码只写入了第一页咨询师的信息,也就是说网页源代码不是完整的,目录的信息被藏起来了。
下图是网页源代码的目录部分,源代码只显示了前5页的目录页数,实际上这个网址的目录有32页。
针对这样的情况,在查阅大佬的攻略(攻略链接&#
更多推荐
寻找壹心理网站内置目录源代码
发布评论