有读者问我怎么爬App,我手把手教了他(多图警告)

编程知识 更新时间:2023-04-26 01:59:13
击上方“Python爬虫与数据挖掘”,进行关注
回复“书籍”即可获赠Python从入门到进阶共10本电子书
今日鸡汤襄阳好风日,留醉与山翁。

前言

大家好,我是Kuls。

最近看见很多读者在说怎么抓取APP上的内容

为此,我打算写一些关于爬取APP方面的文章,当然APP的爬取自然是要比网页要麻烦。

但是只要我们把前期的工作做好,后面也会更加的顺利。

今天这篇文章就是来教大家如何抓取到APP数据,用什么软件,怎么配置?

Charles

首先,我们来看看百度百科是怎么介绍这款软件的

是一个HTTP代理服务器,HTTP监视器,反转代理服务器,当浏览器连接Charles的代理访问互联网时,Charles可以监控浏览器发送和接收的所有数据。它允许一个开发者查看所有连接互联网的HTTP通信,这些包括request, response和HTTP headers (包含cookies与caching信息)。

其实简单理解就是一个抓包软件,这个大家可能少见,但是fiddler和wireshack大家应该是有所耳闻。其实功能差不多类似。

为什么推荐这款呢?

其实不管是app抓包还是pc端的抓包也有其他的一些软件,但是charles它既有win版、macos版也有linux版

所以它兼容的平台是很多的。

废话不多说了,我们直接开整(此处使用macos系统演示,其他系统类似)。

准备工作:一台电脑、一部手机、一个wifi

第一步当然是把软件下载好,这里不多说,尽量去搜pj版,因为charles是需要付费,但是也会有30天的试用期。

下面我们打开软件charles,找到菜单栏Proxy->Proxy Settings

这里我们设置成8888端口,默认就是8888的不需要再次设置了。

之后,我们再进入Proxy->SSL Proxying Settings


添加一个地址为 * ,端口为443


安装证书

安装完成之后,我们可以看到如下证书

这说明我们的证书安装完成。

接下来,我们还要继续安装一个证书。

点击之后,它会弹出如下弹窗

大体的意思就是让我们去把手机的wifi中代理改了。

这里其实很简单,我们进入手机的设置,然后点击wifi后面的感叹号就能进行设置(手机有差异,自行琢磨)

进入手动配置代理,这里的服务器填写你电脑的ip(macos使用ifconfig,windows使用ipconfig可以查看),在前面的提示窗口中,我们也能够看到ip地址。

端口号填写我们之前设置的8888

点击存储,然后我们使用浏览器去访问chls.pro/ssl

如果此时访问没反应,可以看下电脑,会有一个弹窗,点击Allow即可。

这里我们点击允许

然后回到设置,我们就可以看到安装描述文件的提示了

我们这里点击安装就可以了。

最后,我们来简单测试一下,我们打开小红书app,然后可以观察到charles已经开始抓取了。

这就说明了,我们成功进行配置了。

总结

这是我们想要进行app或者小程序抓取的第一步,如果这一步没做好,后面的工作根本无法进行。

这里要说明下,每一台手机都有可能不一样,但是总体来说不会有太大差别。

------------------- End -------------------

往期精彩文章推荐:

  • 手把手教你使用Python轻松搞定发邮件

  • 手把手教你用Python制作简易小说阅读器

  • 一篇文章总结一下Python库中关于时间的常见操作

欢迎大家点赞,留言,转发,转载,感谢大家的相伴与支持

想加入Python学习群请在后台回复【入群

万水千山总是情,点个【在看】行不行

/今日留言主题/

随便说一两句吧~~

更多推荐

有读者问我怎么爬App,我手把手教了他(多图警告)

本文发布于:2023-04-19 18:27:00,感谢您对本站的认可!
本文链接:https://www.elefans.com/category/jswz/37ead4d17e576f4f8b24855dc54dba22.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
本文标签:问我   手把手   多图   读者   App

发布评论

评论列表 (有 0 条评论)
草根站长

>www.elefans.com

编程频道|电子爱好者 - 技术资讯及电子产品介绍!

  • 88589文章数
  • 21546阅读数
  • 0评论数