Python爬虫入门教程 44-100 Charles的安装与使用-手机APP爬虫部分

1. 第二款抓包工具Charles安装与使用

Charles和Fiddler一样，也是一款抓包工具，比Fiddler界面更加清晰，支持多平台

1.1 官方网址

https://www.charlesproxy.com/

1.2 下载地址

Charles工具下载地址：https://www.charlesproxy.com/download/

自己去百度一款,我找了2个百度网盘的链接挂了就不补了啊~

链接: https://pan.baidu.com/s/1pMawsEv 密码:meuk
链接: https://pan.baidu.com/s/1kV3h0gf 密码: nqaa

下载之后，安装就比较简单了，常规操作即可

2. Charles基本操作

打开Charles在电脑上就可以使用了

2.1 PC设置抓包，包括HTTP和HTTPS

软件安装好了之后，默认是需要抓取电脑浏览器访问的，但是好多网站是https的请求，那样你访问大概率得到的是unknow

如下图，会显示一堆小锁的图标，表示加密请求，我们需要配置一些内容，将这些锁解开

2.2 安装根证书

电脑上安装根证书，只需要按照下面三个步骤就可以了，弹出来安装证书，一路下一步即可。

勾选代理里面的windows proxy即可抓包

接下来是关键的一个步骤，需要抓取本地的https包

弹出的窗口配置一下host，你直接写 * 即可
大部分人会设置Host:* port：443 ；但是如果直接点击OK也是没有问题的

这时候，在刷新一下百度，https解包了

3. Charles抓取手机APP基本操作

配置完毕了电脑抓包之后，就需要开始准备手机APP抓包了，基本操作和Fiddler是非常类似的
设置基本代理

配置如下内容，端口号一般默认8888即可

4. 夜神模拟器基本设置

打开模拟器设置，wlan，长按，选择代理设置,基本配置之后，打开默认浏览器。

在手机已经设置好代理网络后，在手机浏览器中输入http://charlesproxy.com/getssl 安装证书（如果需要抓取https数据，则证书必须安装）

或者输入 chls.pro/ssl 也是可以安装证书的

证书安装完毕，打开浏览器输入百度，查看是否安装成功

运行之后，出现百度抓取链接，表示成功。

如果想只抓取手机APP发送的请求的话，可以不勾选WindowsProxy选项，这样在测试时就不会被本机Http请求所干扰。

5. Charles 使用说明

扫把按钮：点击之后可清除抓取到的所有请求
图标按钮：红点亮起说明正在抓取请求，红点展示为灰色说明目前不在抓取请求状态
乌龟按钮：灰色乌龟是网速设置正常，绿色乌龟指慢速网速开启了
六角形图标：断点图标，灰色说明断点未开启，红色说明在使用断点
钢笔图标：编辑请求，点击之后可以修改请求的内容
刷新图标：重复发送请求的图标，先选定某一请求点击该图标则请求会被再次发送
对号图标：
扳手图标：对应于导航栏中的tools图标，有些许功能
设置图标：设置charles中的情况

过滤不必要的网络包

选择Proxy->Recording Settings菜单，然后在include栏添加需要抓取包的指定服务器请求协议、地址、端口号，也可以在exclude栏添加不抓取包的地址。

在Sequence界面的Filter栏中填入需要过滤的关键字

代理转发

中文乱码

edit -> preferences -> 选择一个中文字体

其他内容就不补充了，自行体验吧

最后，给你附录几个写的不错的博客

https://blog.csdn.net/zhangxiang_1102/article/details/77855548
https://segmentfault.com/a/1190000012329292?utm_source=tag-newest
https://www.cnblogs.com/jiayuchn-test/p/8875105.html

下一篇，我们就实际应用一下Charles，期待哪一个APP被我们临幸吧。

原文地址：https://www.cnblogs.com/happymeng/p/10468786.html

时间： 2024-10-07 14:32:05

Python爬虫入门教程 44-100 Charles的安装与使用-手机APP爬虫部分的相关文章

Python爬虫入门教程：博客园首页推荐博客排行的秘密

1. 前言虽然博客园注册已经有五年多了,但是最近才正式开始在这里写博客.(进了博客园才知道这里面个个都是人才,说话又好听,超喜欢这里...)但是由于写的内容都是软件测试相关,热度一直不是很高.看到首页的推荐博客排行时,心里痒痒的,想想看看这些大佬究竟是写了什么文章这么受欢迎,可以被推荐.所以用Python抓取了这100位推荐博客,简单分析了每个博客的文章分类,阅读排行榜,评论排行榜及推荐排行榜,最后统计汇总并生成词云.正好这也算是一篇非常好的Python爬虫入门教程了. 2. 环境准备 2.1

Android基础入门教程——1.2.2 使用Android Studio开发Android APP

Android基础入门教程--1.2.2 使用Android Studio开发Android APP 标签(): Android基础入门教程写在前面本节将介绍如何使用Android Studio开发Android APP,和前面Eclipse + ADT + SDK搭建Android开发环境一样,本节也只是介绍一些基本东西,深入的,比如快捷键,小技巧等会再另一篇文章中详细地介绍! 1.下载Android Studio 官网下载:Android Studio for Window - 百度云下

Android基础入门教程——1.4 Genymotion模拟器安装

Android基础入门教程--1.4 Genymotion模拟器安装 1.本节引言如果你符合下述三种情况的话,你可以考虑安装一个Genymotion Android模拟器: 没有真机调试,只能用模拟器嫌SDK内置的AVD启动速度,运行速度慢电脑配置还可以,最好4G内存以上如果你满足上述三种情况的话,那么装个比真机还快的Genymotion吧! 官方给出的介绍: 2.去哪里下Genymotion 百度"Genymotion"第一个就是了:Genymotion中文官网 3.下载Ge

Python爬虫入门教程 29-100 手机APP数据抓取 pyspider

1. 手机APP数据----写在前面继续练习pyspider的使用,最近搜索了一些这个框架的一些使用技巧,发现文档竟然挺难理解的,不过使用起来暂时没有障碍,估摸着,要在写个5篇左右关于这个框架的教程.今天教程中增加了图片的处理,你可以重点学习一下. 2. 手机APP数据----页面分析咱要爬取的网站是 http://www.liqucn.com/rj/new/ 这个网站我看了一下,有大概20000页,每页数据是9个,数据量大概在180000左右,可以抓取下来,后面做数据分析使用,也可以练习优

Scrapy安装、爬虫入门教程、爬虫实例（豆瓣电影爬虫）

Scrapy在window上的安装教程见下面的链接:Scrapy安装教程上述安装教程已实践,可行.本来打算在ubuntu上安装Scrapy的,但是Ubuntu 磁盘空间太少了,还没扩展磁盘空间,暂时不想再上面装太多软件. Scrapy的入门教程见下面链接:Scrapy入门教程上面的入门教程是很基础的,先跟着作者走一遍,要动起来哟,不要只是阅读上面的那篇入门教程,下面我简单总结一下Scrapy爬虫过程: 1.在Item中定义自己要抓取的数据: movie_name就像是字典中的“键”,爬到的数

Python学习入门教程，字符串函数扩充详解

因有用户反映,在基础文章对字符串函数的讲解太过少,故写一篇文章详细讲解一下常用字符串函数.本文章是对:程序员带你十天快速入门Python,玩转电脑软件开发(三)中字符串函数的详解与扩充. 如果您想学习并参与本教程的完善与写作.请在下方讨论区,回复相关问题.一起完善本文章教程的书写. Python字符串常用函数. 声明字符串变量: str = ‘关注做全栈攻城狮,写代码也要读书,爱全栈,更爱生活.’ 下面所有字符串函数函数,是对变量str进行操作: 求字符串长度: 函数使用: 运行结果: 值得注意

Python NLP入门教程

本文简要介绍Python自然语言处理(NLP),使用Python的NLTK库.NLTK是Python的自然语言处理工具包,在NLP领域中,最常使用的一个Python库. 什么是NLP? 简单来说,自然语言处理(NLP)就是开发能够理解人类语言的应用程序或服务. 这里讨论一些自然语言处理(NLP)的实际应用例子,如语音识别.语音翻译.理解完整的句子.理解匹配词的同义词,以及生成语法正确完整句子和段落. 这并不是NLP能做的所有事情. NLP实现搜索引擎: 比如谷歌,Yahoo等.谷歌搜索引擎知道

Storm入门教程第三章 Storm安装部署步骤[转]

本文以Twitter Storm官方Wiki为基础,详细描述如何快速搭建一个Storm集群,其中,项目实践中遇到的问题及经验总结,在相应章节以“注意事项”的形式给出. 3.1 Storm集群组件 Storm集群中包含两类节点:主控节点(Master Node)和工作节点(Work Node).其分别对应的角色如下: 1. 主控节点(Master Node)上运行一个被称为Nimbus的后台程序,它负责在Storm集群内分发代码,分配任务给工作机器,并且负责监控集群运行状态.Nimbus的作用类似

Python爬虫入门教程 2-100 妹子图网站爬取

前言从今天开始就要撸起袖子,直接写Python爬虫了,学习语言最好的办法就是有目的的进行,所以,接下来我将用10+篇的博客,写爬图片这一件事情.希望可以做好. 为了写好爬虫,我们需要准备一个火狐浏览器,还需要准备抓包工具,抓包工具,我使用的是CentOS自带的tcpdump,加上wireshark ,这两款软件的安装和使用,建议你还是学习一下,后面我们应该会用到. 网络请求模块requests Python中的大量开源的模块使得编码变的特别简单,我们写爬虫第一个要了解的模块就是requests