python爬虫13--Ajax数据爬取

1. Ajax介绍

Ajax，Asynchronous JavaScript and XML，即异步的JavaScript和XML。它不是编程语言，而是利用JavaScript在保证页面不被刷新、页面链接不改变的情况下，与服务器交换数据并更新部分网页的技术。

2. Ajax基本原理

发送Ajax请求到网页更新的过程可以分为3步：

发送请求
解析内容
渲染页面

//创建XMLHttpRequest对象
var xmlhttp;
if(window.XMLHttpRequest){
    xmlhttp=new XMLHttpRequest();
}else{
    xmlhttp=new ActiveXObject("Microsoft.XMLHTTP");
}
xmlhttp.onreadystatechange=function()
  {
  if (xmlhttp.readyState==4 && xmlhttp.status==200)
    {
    document.getElementById("myDiv").innerHTML=xmlhttp.responseText;
    }
  }

//向服务器发送数据
xmlhttp.open("GET","test.asp",true);
xmlhttp.send();

2.1 发送请求

利用JavaScript实现页面的交互功能，新建XMLHttpRequest对象，然后调用 onreadystatechange 属性设置了监听，然后用open和send方法向服务器发起请求。相当于前面python实现请求发送，此处请求发送变成JavaScript来完成。

2.2 解析内容

发送请求后， onreadystatechange 对应的方法被触发，利用xmlhttp的responseText属性可取得相应内容（html或json）。如果是json可以进行解析和转化。

2.3 渲染页面

解析完相应内容后，通过document.getElementById("myDiv").innerHTML操作，对某个元素内的源代码进行操作，元素内将呈现出服务器返回的新数据，网页内容即更新了。

整个过程实际是JavaScript向服务器发送了一个Ajax请求，然后获取新的数据，并将其解析，并将其渲染在网页中。

3.Ajax分析方法

3.1查看请求

Network中找到Type为xhr（Ajax的请求类型）的请求，该请求Request Headers中有一个信息为X-Requested-With:XMLHttpRequest，即标记了该请求为Ajax请求。

3.2 过滤请求

筛选出所有XHR请求。

4.Ajax结果提取

4.1 分析请求

分析XHR中请求的参数信息，可找到url规律。

4.2 分析响应

分析响应页面

5.案例--今日头条街拍美图下载

原文地址：https://www.cnblogs.com/rong1111/p/12184365.html

时间： 2024-10-29 09:30:41

python爬虫13--Ajax数据爬取

python爬虫13--Ajax数据爬取的相关文章

Python爬虫实战二之爬取百度贴吧帖子

爬虫1.5-ajax数据爬取

转 Python爬虫实战二之爬取百度贴吧帖子

Ajax数据爬取

Python爬虫新手教程：爬取了6574篇文章，告诉你产品经理在看什么！

python实现人人网用户数据爬取及简单分析

Python爬虫之简单的爬取百度贴吧数据

Python爬虫之利用正则表达式爬取内涵吧

Python爬虫实战教程：爬取网易新闻；爬虫精选高手技巧

Python 爬虫入门实例（爬取小米应用商店的top应用apk）