随着大数据的应用越来越广泛,应用的行业也越来越多,我们每日都可以看到大数据的一些新颖的应用,从而帮助人们从中获取到真正有用的价值,随着很多工作的开展,我们需要大量的IP操作,这时为了避免IP被封,使用代理IP是个很好的选择。
而IP代理按匿名度可分为透明代理、匿名代理和高度匿名代理。
高度高匿代理会将我们的数据包原封不动的转发,在服务端看来就好像真的是一个普通客户端在访问,记录的IP是代理服务器的IP。
普通匿名代理会在数据包上做一些改动,服务端上有可能发现这个是代理服务器,也有一定记录追查到你的真实IP。
透明代理不但改动了我们的数据包,还会告诉服务器你的真实IP。这种代理除了能改用缓存技术帮你提高浏览速度,能用内容过滤提高你的安全性之外,并无其他显著作用。
代理请求的示例,参考:
1.使用透明代理,对方服务器可以知道你使用了代理,并且也知道你的真实IP。
透明代理访问对方服务器所带的HTTP头信息如下:
透明代理还是将你的真实IP发送给了对方服务器,因此无法达到隐藏身份的目的。
2.使用匿名代理,对方服务器可以知道你使用了代理,但不知道你的真实IP。
匿名代理访问对方服务器所带的HTTP头信息如下:
匿名代理隐藏了你的真实IP,但是向访问对象透露了你是使用代理服务器访问他们的。
3.使用高匿名代理,对方服务器不知道你使用了代理,更不知道你的真实IP。
高匿名代理访问对方服务器所带的HTTP头信息如下:
高匿名代理隐藏了你的真实IP,同时访问对象也不知道你使用了代理,因此隐蔽度最高。
所以建议在爬虫过程中建议是用高匿IP代理,能更好的保护自身隐私。
原文地址:http://blog.51cto.com/14062184/2315723
时间: 2024-10-03 15:27:45