详解百度蜘蛛ip段代表的不同含义

详解百度蜘蛛ip段代表的不同含义

有时候我们在分析百度蜘蛛的时候,会发现很多的ip,这些个ip地址,根据后面的参数可以发现都是百度的。刚学习SEO不久的同学肯定要问:这些ip地址到底代表什么含义,是不是不同的ip地址所代表的含义不一样呢?对权重和抓取是否有影响?哪些是无效的蜘蛛,哪些是站长工具的蜘蛛,那些又是百度自己真正的蜘蛛?

首先,怎么判断这个蜘蛛是不是百度蜘蛛?

在这里,我教大家一个方法。

电脑上,点开始——运行——cmd——nslookup 【ip】看name值。

如判断ip地址123.125.71.95,如下图。

很明显看出是百度的蜘蛛。

如判断ip地址61.147.98.146,如下图

显示不是百度蜘蛛。

这个只要看nslookup出来的name值。没有的话就不是百度蜘蛛,有百度字样的,就是百度蜘蛛。

那么,不同的百度蜘蛛,它的功能和作用是什么呢?以下是搜集于互联网的,大家可以作为一个参考。

百度蜘蛛 功能说明
60.172.229.61 蜘蛛来访,准备抓取网页内容
61.129.45.72 蜘蛛来访,准备抓取网页内容
61.135.162.* 蜘蛛来访,准备抓取网页内容
61.135.165.134 百度竞价蜘蛛
117.34.74.66 百度竞价蜘蛛
118.122.188.194 百度竞价蜘蛛
119.63.196.9 百度竞价蜘蛛
125.39.78.185 百度竞价蜘蛛
61.135.186.* 百度联盟蜘蛛、百度统计蜘蛛
61.147.98.146 站长工具模拟百度蜘蛛
61.188.39.16 站长工具模拟百度蜘蛛
113.98.254.245 站长工具模拟百度蜘蛛
117.21.220.245 站长工具模拟百度蜘蛛
117.28.255.42 站长工具模拟百度蜘蛛
124.248.34.52 站长工具模拟百度蜘蛛
125.90.88.* 站长工具模拟百度蜘蛛
119.147.114.213 站长工具模拟百度蜘蛛
121.10.141.* 站长工具模拟百度蜘蛛
123.15.**.** 百度图片蜘蛛
123.125.71.* 抓取网站内页收录,质量不高,暂时不会放出来
159.226.50.* 考察蜘蛛(很大可能是降权蜘蛛)
180.76.5.* 考察蜘蛛(很大可能是降权蜘蛛)
180.76.5.87 考察蜘蛛(很大可能是降权蜘蛛)
220.181.158.107 考察蜘蛛(很大可能是降权蜘蛛)
183.91.40.144 新站不正常情况下的蜘蛛
203.208.60.* 新站不正常情况下的蜘蛛
210.72.225.* 打酱油的百度蜘蛛
123.125.68.* 如果发现下面这几个ip段每天只增不减的话,那就很危险了,
很有可能会进入沙盒或者有被K站的现象。
218.30.118.102 如果发现下面这几个ip段每天只增不减的话,那就很危险了,
很有可能会进入沙盒或者有被K站的现象。
220.181.68.* 如果发现下面这几个ip段每天只增不减的话,那就很危险了,
很有可能会进入沙盒或者有被K站的现象。
123.125.66.* 代表百度蜘蛛IP来过了,准备抓取你网站上的东西!
220.181.7.*
121.14.89.* 百度蜘蛛作为度过新站考察期的一个ip段
220.181.108.95 此ip段爬过的文章或首页正常情况下基本在24小时都会放出来
220.181.108.92 此ip段爬过的文章或首页正常情况下基本在25小时都会放出来
220.181.108.91 此ip段爬过的文章或首页正常情况下基本在26小时都会放出来
220.181.108.75 此ip段爬过的文章或首页正常情况下基本在27小时都会放出来
123.125.71.95 抓取内页收录的,权重相对比较低,爬过此段的内页文章不会很快被放出来,
因它怀疑不是原创文章或者怀疑是采集来的文章。
123.125.71.97 抓取内页收录的,权重相对比较低,爬过此段的内页文章不会很快被放出来,
因它怀疑不是原创文章或者怀疑是采集来的文章。
123.181.108.77 抓取内页收录的,权重相对比较低,爬过此段的内页文章不会很快被放出来,
因它怀疑不是原创文章或者怀疑是采集来的文章。
123.125.71.106 抓取内页收录的,权重相对比较低,爬过此段的内页文章不会很快被放出来,
因它怀疑不是原创文章或者怀疑是采集来的文章。
220.181.108.89 专用抓取网站首页的,也属于权重段,
一般返回代码304 0 0就代表网站未更新
220.181.108.94 专用抓取网站首页的,也属于权重段,
一般返回代码304 0 1就代表网站未更新
220.181.108.97 专用抓取网站首页的,也属于权重段,
一般返回代码304 0 2就代表网站未更新
220.181.108.80 专用抓取网站首页的,也属于权重段,
一般返回代码304 0 3就代表网站未更新
220.181.108.77 专用抓取网站首页的,也属于权重段,
一般返回代码304 0 4就代表网站未更新
220.181.108.83 专用抓取网站首页的,也属于权重段,
一般返回代码304 0 5就代表网站未更新
220.181.108.86 专用抓取网站首页的,也属于权重段,
一般返回代码304 0 6就代表网站未更新

原文地址:https://www.cnblogs.com/cuihongyu3503319/p/12176200.html

时间: 2024-07-29 13:43:04

详解百度蜘蛛ip段代表的不同含义的相关文章

百度蜘蛛ip段代表的不同含义

有时候我们在分析百度蜘蛛的时候,会发现很多的ip,这些个ip地址,根据后面的参数可以发现都是百度的.刚学习SEO不久的同学肯定要问:这些ip地址到底代表什么含义,是不是不同的ip地址所代表的含义不一样呢?对权重和抓取是否有影响?哪些是无效的蜘蛛,哪些是站长工具的蜘蛛,那些又是百度自己真正的蜘蛛?首先,怎么判断这个蜘蛛是不是百度蜘蛛? 在这里,我教大家一个方法. 电脑上,点开始--运行--cmd--nslookup [ip]看name值. 如判断ip地址123.125.71.95,如下图. 判断百

【深入蜘蛛】百度蜘蛛IP段详解

大家进行网站日志分析的时候,常见到很多不同IP段的百度蜘蛛,为了方便大家更好的进行日志分析,下面列举了百度不同IP段常见蜘蛛的一些详情情况,及所谓的降权蜘蛛,沙盒蜘蛛,高权重蜘蛛等等 下面的百度蜘蛛IP造访,准备抓取你东西,抓取网页的百度蜘蛛. 60.172.229.61 61.129.45.72 61.135.162.* 百度竞价蜘蛛 61.135.165.134 117.34.74.66 118.122.188.194 119.63.196.9 125.39.78.185 (百度联盟爬虫),

详细解析百度蜘蛛ip段的含义

www.baidu.com/p/%E9%BB%84%E5%8D%97%E6%89%BE%E6%9C%8D%E5%8A%A1%E5%A6%B9%E7%BA%B8%2Fdetail www.baidu.com/p/%E5%92%8C%E7%94%B0%E6%89%BE%E6%9C%8D%E5%8A%A1%E5%A6%B9%E7%BA%B8%2Fdetail www.baidu.com/p/%E5%90%B4%E5%BF%A0%E6%89%BE%E6%9C%8D%E5%8A%A1%E5%A6%B9%E

TCP/IP详解学习笔记——IP协议

一 概述 IP协议是TCP/IP协议簇中最核心的协议,所有的TCP.UDP.ICMP以及IGMP数据都以IP数据报格式传输.IP协议提供不可靠.无连接的数据传输服务.不可靠的意思是它不能保证IP数据报能成功到达目的地.IP仅仅提供最好的传输服务.意思就是,我尽我所能传输数据,实在没传过去,也不要怪我.当发生某种错误时,比如某个路由器的缓冲区慢了,此时路由器不能接收新的数据,直接丢弃处理,然后发送ICMP消息给信源端,告诉他我尽力了.如果需要可靠的传输,必须由上层协议来提供,比如TCP协议.无连接

获取百度地图POI数据一(详解百度返回的POI数据)

POI是一切可以抽象为空间点的现实世界的实体,比如餐馆,酒店,车站,停车场等.POI数据具有空间坐标和各种属性,是各种地图查询软件的基础数据之一.百度地图作为国内顶尖的地图企业,其上具有丰富的POI数据,要获取其上的POI数据可以根据百度地图提供的API,但是这种方式有限制,能获取的数据极少.本文将详细介绍通过模拟HTTP请求的方式获取其上的POI数据. 当我们在百度地图的搜索框中通过输入关键字进行搜索时,这其实就是发送一个HTTP请求到百度的服务器,然后服务器返回数据. 打开网页的调试面板可以

TCP/IP详解之:IP选路 动态选路协议

第九章 IP选路 netstat -rn 显示路由表 初始化路由表的两种方法: 方法1:在配置文件中指定静态路由(不常用) 方法2:运行路由守护程序 或者 使用ICMP路由器发现报文 没有到达目的地的路由的处理: 此时的结果取决于该IP数据报是由主机产生的还是被转发的. 若是由本地主机产生的,那么就给发送该数据报的应用程序返回一个差错(“主机不可达差错”或“网络不可达差错”): 若是被转发的IP数据报,那么就给原始发送端发送一份ICMP主机不可达差错报文 ICMP主机与网络不可达差错 当路由器收

[二] java8 函数式接口详解 函数接口详解 lambda表达式 匿名函数 方法引用使用含义 函数式接口实例 如何定义函数式接口

函数式接口详细定义 package java.lang; import java.lang.annotation.*; /** * An informative annotation type used to indicate that an interface * type declaration is intended to be a <i>functional interface</i> as * defined by the Java Language Specificat

百度蜘蛛(BaiduSpider)IP段详细情况介绍

123.125.68.*这个蜘蛛经常来,别的来的少,表示网站可能要进入沙盒了,或被者降权. 220.181.68.*每天这个IP 段只增不减很有可能进沙盒或K站. 220.181.7.*.123.125.66.* 代表百度蜘蛛IP造访,准备抓取你东西. 121.14.89.*这个ip段作为度过新站考察期. 203.208.60.*这个ip段出现在新站及站点有不正常现象后. 210.72.225.*这个ip段不间断巡逻各站. 125.90.88.* 广东茂名市电信也属于百度蜘蛛IP 主要造成成分,

《Linux高性能服务器编程》学习总结(二)——IP协议详解

第二章      IP协议详解 IP协议是TCP/IP协议族中的核心协议,也是socket网络编程的基础之一.IP协议的特点是为上层提供无状态.无连接.不可靠的服务. 无状态是指IP通信双方不同步传输数据的状态信息,通俗一些说就是双方发送的IP数据报是相互独立的,没有任何上下文关系.这样的特性缺点在于无法处理重复和乱序的IP数据报,举个例子,假设由于网络原因或者IP选路的原因导致第N个数据报比第N+1个数据报晚到达目的主机或同一个IP数据报经过不同的路径多次到达目的端,此时接收端的IP模块无法检