兔子IP教你解决日常使用过程中ip被封锁IP被限制的几种方法

兔子IP解决日常使用过程中ip被封锁IP被限制的几种方法

方法1
使用多IP:
1.IP必须需要,比如ADSL。如果有条件,其实可以跟机房多申请外网IP。
2.在有外网IP的机器上,部署代理服务器。
3.你的程序,使用轮训替换代理服务器来访问想要采集的网站。
好处:
1.程序逻辑变化小,只需要代理功能。
2.根据对方网站屏蔽规则不同,你只需要添加更多的代理就行了。
3.就算具体IP被屏蔽了,你可以直接把代理服务器下线就OK,程序逻辑不需要变化。

方法2.
有小部分网站的防范措施比较弱,可以伪装下IP,修改X-Forwarded-for(貌似这么拼。。。)即可绕过。 、
大部分网站么,如果要频繁抓取,一般还是要多IP。
我比较喜欢的解决方案是国外VPS再配多IP,通过默认网关切换来实现IP切换,比HTTP代理高效得多,估计也比多数情况下的ADSL切换更高效?

方法3.
ADSL + 脚本,监测是否被封,然后不断切换 ip 设置查询频率限制
正统的做法是调用该网站提供的服务接口。?

?

方法4.
国内ADSL是王道,多申请些线路,分布在多个不同的电信区局,能跨省跨市更好,自己写好断线重拨组件,自己写动态IP追踪服务,远程硬件重置(主要针对ADSL猫,防止其宕机),其余的任务分配,数据回收,都不是大问题。?

?

方法5.
1 user agent 伪装和轮换
2 使用代理 ip 和轮换
3 cookies 的处理,有的网站对登陆用户政策宽松些
友情提示:考虑爬虫给人家网站带来的负担,be a responsible crawler :)?

?

方法6.
尽可能的模拟用户行为:
1、UserAgent经常换一换;
2、访问时间间隔设长一点,访问时间设置为随机数;
3、访问页面的顺序也可以随机着来 。?

?

方法7.
网站封的依据一般是单位时间内特定IP的访问次数.
我是将采集的任务按 目标站点的IP进行分组
通过控制每个IP 在单位时间内发出任务的个数,来避免被封.
当然,这个前题是你采集很多网站.如果只是采集一个网站,那么只能通过多外部IP的方式来实现了。?

?

方法8.
对爬虫抓取进行压力控制;可以考虑使用代理的方式访问目标站点。
降低抓取频率,时间设置长一些,访问时间采用随机数
频繁切换UserAgent(模拟浏览器访问)
多页面数据,随机访问然后抓取数据 -更换用户IP。?????
需要兔子IP可以加企鹅167737487。

原文地址:http://blog.51cto.com/14089690/2324378

时间: 2024-08-10 08:47:26

兔子IP教你解决日常使用过程中ip被封锁IP被限制的几种方法的相关文章

解决安装AutoCAD2006过程中遇到的问题

问题: 当我们在安装CAD过程中,任何系统(Windows7.Windows2003.WindowsXP均适用)有时候会出现“CAD 出现致命错误 UNABLE TO LOAD ACDB RESOURCR FILE”和“ 无法启动此程序,因为计算机中丢失ac1st16.dll.acdb16.dll.acge16.dll”的问题. 解答: 这是因为AutoCAD在使用acad.msi安装时没有将文件拷贝至对应目录. 解决: 1.修改系统变量中的Path变量的值包含如下的路径名:“C:\Progra

爬虫过程中如何有效的应对IP限制?

大数据时代,营销推广的主要依据就是大数据:根据大数据去抓取用户习惯,去抓取竞争对手的信息,却或许同类产品的相关资料等等.数据采集推动着数据分析,数据分析推动发展.但是在这个过程中会出现很多问题.拿最简单最基础的爬虫采集数据为例,过程中就会面临,IP被封,爬取受限.违法操作等多种问题,所以在爬去数据之前,一定要了解好预爬网站是否涉及违法操作,找到合适的代理IP访问网站等一系列问题. 我们都知道如果一个固定的IP在短暂的时间内,快速大量的访问一个网站,那自然会引起注意,管理员可以通过一些手段把这个I

网络-数据包在路由转发过程中MAC地址和IP地址,变与不变

关于MAC地址和IP地址在传输过程中变与不变的问题: 结论:MAC地址在同一个广播域传输过程中是不变的,在跨越广播域的时候会发生改变的:而IP地址在传输过程中是不会改变的(除NAT的时候),总结为 路由转发MAC不变,IP变. 我们知道的几个概念: 首先我们要知道,MAC地址是用于同意物理或逻辑第2层网络上的设备间进行通信的: 而第三层地址(IP地址)是可以在多个网络设备之间通信的. 下面我们来分析一下: MAC地址是在同一个广播域有效的,那么去了另外一个广播域(网段)MAC地址肯定要改变的:

源代码加密软件-如何解决文件流转过程中的安全问题的?

开发企业内部的数据安全得到有效保障的同时,要关注到环境外部数据安全的流转问题,现在市场上的多数安全加密产品在企业环境外的数据安全防护力度不足,导致具有软件开发知识的人员可以轻松将其破解,获取涉密数据.从安全的角度来分析,环境外部涉及到数据的安全问题解决方案分为两种,一种是在加密环境内进行加密导出,一种是在外部环境内进行加密存储,每一种解决方案都会对加密产品的安全性有较高的要求,要有完整的加密方法,安全的文件加密逻辑,总而言之,不能因涉密文件在外流转时造成涉密的情况发生.下面给大家详细叙述这两种实

log4j 日志信息的引入(通用版)——解决项目运行过程中的日志信息

定义 log4j是Apache的一个开放源代码项目,通过使用Log4j,我们可以控制日志信息输送的目的地是控制台.文件.GUI组件,甚至是套接口服务器.NT的事件记录器.UNIX Syslog守护进程等:我们也可以控制每一条日志的输出格式:通过定义每一条日志信息的级别,我们能够更加细致地控制日志的生成过程.最令人感兴趣的就是,这些可以通过一个配置文件来灵活地进行配置,而不需要修改应用的代码. 一.log4j.properties 的使用详解 1.输出级别的种类 ERROR.WARN.INFO.D

解决https 请求过程中SSL问题

最近一个项目中用到了https的请求,在实际调用过程中发现之前的http方法不支持https,调用一直报错. 查询了一下,添加几行代码解决问题. public string HttpPost(string Url, string postDataStr, string useragent = null)        {            ServicePointManager.ServerCertificateValidationCallback += (s, cert, chain, s

解决VMware中虚拟机(centos7)无法上网的一种方法

本文记录使用VMware搭openstack环境中遇到的问题和解决方法.作为一个熟练拼写openstack和只知道怎么创建虚拟机的新手,原本搭openstack就是一个不断爬坑的过程,结果VMware上又出问题,让自己原本就饱受openstack摧残的信心渣都不剩,整个人都烦躁起来了.但各种找原因查资料解决问题之后,整个人的感觉非常棒.所以记录下来加强自己的印象和方便别人.闲话至此,上干货! 使用的软件环境:win10+VMware14 Pro+centos7 VMware中具体配置:2台虚拟机

解决jsp编写过程中换另一个jsp可以忽视登录过程

在编写web大作业时发现,如果直接更换jsp地址,可以直接进入管理员界面. 为了解决这一问题,首先编写一个check文档: <% HttpSession sessi= request.getSession(); String login = (String) sessi.getAttribute("login"); if( !"login".equals(login)){ request.setAttribute("err","未

解决在onCreate()过程中获取View的width和Height为0的4中方法

很经常当我们动态创建某些View时,需要通过获取他们的width和height来确定别的view的布局,但是在onCreate()获取view的width和height会得到0.view.getWidth()和view.getHeight()为0的根本原因是控件还没有完成绘制,你必须等待系统将绘制完View时,才能获得.这种情况当你需要使用动态布局(使用wrap_content或match_parent)就会出现.一般来讲在Activity.onCreate(...).onResume()方法中