Python爬虫入门教程 44-100 Charles的安装与使用-手机APP爬虫部分

1. 第二款抓包工具Charles安装与使用

Charles和Fiddler一样,也是一款抓包工具,比Fiddler界面更加清晰,支持多平台

1.1 官方网址

https://www.charlesproxy.com/

1.2 下载地址

Charles工具下载地址:https://www.charlesproxy.com/download/

自己去百度一款,我找了2个百度网盘的 链接挂了就不补了啊~

  1. 链接: https://pan.baidu.com/s/1pMawsEv 密码:meuk
  2. 链接: https://pan.baidu.com/s/1kV3h0gf 密码: nqaa

下载之后,安装就比较简单了,常规操作即可

2. Charles基本操作

打开Charles在电脑上就可以使用了

2.1 PC设置抓包,包括HTTP和HTTPS

软件安装好了之后,默认是需要抓取电脑浏览器访问的,但是好多网站是https的请求,那样你访问大概率得到的是unknow

如下图,会显示一堆小锁的图标,表示加密请求,我们需要配置一些内容,将这些锁解开

2.2 安装根证书

电脑上安装根证书,只需要按照下面三个步骤就可以了,弹出来安装证书,一路下一步即可。

勾选代理里面的windows proxy即可抓包

接下来是关键的一个步骤,需要抓取本地的https包

弹出的窗口配置一下host,你直接写 * 即可
大部分人会设置Host:* port:443 ;但是如果直接点击OK也是没有问题的

这时候,在刷新一下百度,https解包了

3. Charles抓取手机APP基本操作

配置完毕了电脑抓包之后,就需要开始准备手机APP抓包了,基本操作和Fiddler是非常类似的
设置基本代理

配置如下内容,端口号一般默认8888即可

4. 夜神模拟器基本设置

打开模拟器设置,wlan,长按,选择代理设置,基本配置之后,打开默认浏览器。

在手机已经设置好代理网络后,在手机浏览器中输入http://charlesproxy.com/getssl 安装证书(如果需要抓取https数据,则证书必须安装)

或者输入 chls.pro/ssl 也是可以安装证书的

证书安装完毕,打开浏览器输入百度,查看是否安装成功

运行之后,出现百度抓取链接,表示成功。

如果想只抓取手机APP发送的请求的话,可以不勾选WindowsProxy选项,这样在测试时就不会被本机Http请求所干扰。

5. Charles 使用说明

  • 扫把按钮:点击之后可清除抓取到的所有请求
  • 图标按钮:红点亮起说明正在抓取请求,红点展示为灰色说明目前不在抓取请求状态
  • 乌龟按钮:灰色乌龟是网速设置正常,绿色乌龟指慢速网速开启了
  • 六角形图标:断点图标,灰色说明断点未开启,红色说明在使用断点
  • 钢笔图标:编辑请求,点击之后可以修改请求的内容
  • 刷新图标:重复发送请求的图标,先选定某一请求点击该图标则请求会被再次发送
  • 对号图标:
  • 扳手图标:对应于导航栏中的tools图标,有些许功能
  • 设置图标:设置charles中的情况

过滤不必要的网络包

选择Proxy->Recording Settings菜单,然后在include栏添加需要抓取包的指定服务器请求协议、地址、端口号,也可以在exclude栏添加不抓取包的地址。

在Sequence界面的Filter栏中填入需要过滤的关键字

代理转发

中文乱码

edit -> preferences -> 选择一个中文字体

其他内容就不补充了,自行体验吧

最后,给你附录几个写的不错的博客

https://blog.csdn.net/zhangxiang_1102/article/details/77855548
https://segmentfault.com/a/1190000012329292?utm_source=tag-newest
https://www.cnblogs.com/jiayuchn-test/p/8875105.html

下一篇,我们就实际应用一下Charles,期待哪一个APP被我们临幸吧。

原文地址:https://www.cnblogs.com/happymeng/p/10468786.html

时间: 2024-10-07 14:32:05

Python爬虫入门教程 44-100 Charles的安装与使用-手机APP爬虫部分的相关文章

Python爬虫入门教程:博客园首页推荐博客排行的秘密

1. 前言 虽然博客园注册已经有五年多了,但是最近才正式开始在这里写博客.(进了博客园才知道这里面个个都是人才,说话又好听,超喜欢这里...)但是由于写的内容都是软件测试相关,热度一直不是很高.看到首页的推荐博客排行时,心里痒痒的,想想看看这些大佬究竟是写了什么文章这么受欢迎,可以被推荐.所以用Python抓取了这100位推荐博客,简单分析了每个博客的文章分类,阅读排行榜,评论排行榜及推荐排行榜,最后统计汇总并生成词云.正好这也算是一篇非常好的Python爬虫入门教程了. 2. 环境准备 2.1

Android基础入门教程——1.2.2 使用Android Studio开发Android APP

Android基础入门教程--1.2.2 使用Android Studio开发Android APP 标签(): Android基础入门教程 写在前面 本节将介绍如何使用Android Studio开发Android APP,和前面Eclipse + ADT + SDK搭建Android开发环境一样,本节也只是介绍一些基本东西,深入的,比如快捷键,小技巧等会再另一篇文章中详细地介绍! 1.下载Android Studio 官网下载:Android Studio for Window - 百度云下

Android基础入门教程——1.4 Genymotion模拟器安装

Android基础入门教程--1.4 Genymotion模拟器安装 1.本节引言 如果你符合下述三种情况的话,你可以考虑安装一个Genymotion Android模拟器: 没有真机调试,只能用模拟器 嫌SDK内置的AVD启动速度,运行速度慢 电脑配置还可以,最好4G内存以上 如果你满足上述三种情况的话,那么装个比真机还快的Genymotion吧! 官方给出的介绍: 2.去哪里下Genymotion 百度"Genymotion"第一个就是了:Genymotion中文官网 3.下载Ge

Python爬虫入门教程 29-100 手机APP数据抓取 pyspider

1. 手机APP数据----写在前面 继续练习pyspider的使用,最近搜索了一些这个框架的一些使用技巧,发现文档竟然挺难理解的,不过使用起来暂时没有障碍,估摸着,要在写个5篇左右关于这个框架的教程.今天教程中增加了图片的处理,你可以重点学习一下. 2. 手机APP数据----页面分析 咱要爬取的网站是 http://www.liqucn.com/rj/new/ 这个网站我看了一下,有大概20000页,每页数据是9个,数据量大概在180000左右,可以抓取下来,后面做数据分析使用,也可以练习优

Scrapy安装、爬虫入门教程、爬虫实例(豆瓣电影爬虫)

Scrapy在window上的安装教程见下面的链接:Scrapy安装教程 上述安装教程已实践,可行.本来打算在ubuntu上安装Scrapy的,但是Ubuntu 磁盘空间太少了,还没扩展磁盘空间,暂时不想再上面装太多软件. Scrapy的入门教程见下面链接:Scrapy入门教程 上面的入门教程是很基础的,先跟着作者走一遍,要动起来哟,不要只是阅读上面的那篇入门教程,下面我简单总结一下Scrapy爬虫过程: 1.在Item中定义自己要抓取的数据: movie_name就像是字典中的“键”,爬到的数

Python学习入门教程,字符串函数扩充详解

因有用户反映,在基础文章对字符串函数的讲解太过少,故写一篇文章详细讲解一下常用字符串函数.本文章是对:程序员带你十天快速入门Python,玩转电脑软件开发(三)中字符串函数的详解与扩充. 如果您想学习并参与本教程的完善与写作.请在下方讨论区,回复相关问题.一起完善本文章教程的书写. Python字符串常用函数. 声明字符串变量: str = ‘关注做全栈攻城狮,写代码也要读书,爱全栈,更爱生活.’ 下面所有字符串函数函数,是对变量str进行操作: 求字符串长度: 函数使用: 运行结果: 值得注意

Python NLP入门教程

本文简要介绍Python自然语言处理(NLP),使用Python的NLTK库.NLTK是Python的自然语言处理工具包,在NLP领域中,最常使用的一个Python库. 什么是NLP? 简单来说,自然语言处理(NLP)就是开发能够理解人类语言的应用程序或服务. 这里讨论一些自然语言处理(NLP)的实际应用例子,如语音识别.语音翻译.理解完整的句子.理解匹配词的同义词,以及生成语法正确完整句子和段落. 这并不是NLP能做的所有事情. NLP实现 搜索引擎: 比如谷歌,Yahoo等.谷歌搜索引擎知道

Storm入门教程 第三章 Storm安装部署步骤[转]

本文以Twitter Storm官方Wiki为基础,详细描述如何快速搭建一个Storm集群,其中,项目实践中遇到的问题及经验总结,在相应章节以“注意事项”的形式给出. 3.1 Storm集群组件 Storm集群中包含两类节点:主控节点(Master Node)和工作节点(Work Node).其分别对应的角色如下: 1. 主控节点(Master Node)上运行一个被称为Nimbus的后台程序,它负责在Storm集群内分发代码,分配任务给工作机器,并且负责监控集群运行状态.Nimbus的作用类似

Python爬虫入门教程 2-100 妹子图网站爬取

前言 从今天开始就要撸起袖子,直接写Python爬虫了,学习语言最好的办法就是有目的的进行,所以,接下来我将用10+篇的博客,写爬图片这一件事情.希望可以做好. 为了写好爬虫,我们需要准备一个火狐浏览器,还需要准备抓包工具,抓包工具,我使用的是CentOS自带的tcpdump,加上wireshark ,这两款软件的安装和使用,建议你还是学习一下,后面我们应该会用到. 网络请求模块requests Python中的大量开源的模块使得编码变的特别简单,我们写爬虫第一个要了解的模块就是requests