PHP防采集方法代码

<?php
/**
* FileName:test.php
* Summary: 防采集
*/
$HTTP_REFERER = $_SERVER["HTTP_REFERER"];
$HTTP_USER_AGENT = $_SERVER["HTTP_USER_AGENT"];
$SERVER_NAME = $_SERVER["SERVER_NAME"];
$CompCharArr =explode(",","Baiduspider,Scooter,ia_archiver,Googlebot,FAST-WebCrawler,MSNBOT,Slurp");
$CompCharArrSize = sizeof($CompCharArr);
$CheckSign = "";
for($i=0;$i<$CompCharArrSize;$i++)
{
$ComChar = trim($CompCharArr[$i]);
if($CompChar<>"" && eregi($CompChar,$HTTP_USER_AGENT))
{
$CheckSign = "T";
}
}
$SERVER_NAME_M = "http://".$SERVER_NAME;//strlen
$EndLenth = strlen($SERVER_NAME_M) + 1;
$CompServerName = "http://".$SERVER_NAME."/";
if(empty($CheckSign) &&($HTTP_REFERER == "" or substr($HTTP_REFERER,0,$EndLenth) <>$CompServerName ))
{
?>
<html>
<body>
<form action=‘ name=checkrefer id=checkrefer method=post></form>
<script>
document.all.checkrefer.action=document.URL;
document.all.checkrefer.submit();
<?php }?>

时间： 2024-10-31 13:50:45

PHP防采集方法代码的相关文章

PHP 采集大全采集原理分析禁用采集各种采集方法详解采集的攻于防采集性能应用协议分析

//py by http://my.oschina.net/cart 做了N年的PHP,采集了N家数据,由初学者菜鸟,到现在的熟手,采集天猫.淘宝.腾讯.京东.敦煌.Lightinthebox.大龙.zencart.magento.prestashop.opencart.xcart.踏踏....对采集颇有诸多的理解. 现在给大家分析下,如有误,请指出. 我能想到的常用采集方法: 1. file 支持应用层协议,返回的数据是以数组形式返回,需要开启allow_url_fopen. 长处:擅长处理本

防采集与反爬虫常见的策略以及解决思路

1.限制IP单位时间访问次数还有频率背景:没有哪个常人一秒钟内能访问相同网站N次(不管是不是同一个网页) 解决办法:一般遇到这种情况我们就放缓采集频率,不管你写代码添加Sleep,或者在我们八爪鱼里面设置间隔时间都可以解决进化1:有些高级点的防采集策略,他甚至监控到每个请求的频率,如果一直处于同一个频率,比如一秒一次,他也是会封. 解决办法:这种情况一般就需要我们在采集间隔里面加上随机数,每次访问的频率相对随机. 进化2:有些更残忍的防采集策略,他甚至会监控每IP每天或每时段请求网页的数

php防攻击方法

php防攻击方法更多答案请参考 @如何有效防止XSS攻击/AJAX跨域攻击我说下防止非法用户的一些常用手段吧 1 前端的js验证: 我认为js验证只是一种用户体验的提升,对普通用户群体的简单限制,所以后台必须要有相应的验证.. 2表单中的隐藏域 : 相信大家都遇到过这样的问题,如: 用户从 A 页面点如 B 页面,B页面是个表单,这个表单中有个隐藏域,用来记录从A页面带来的数据(像id等),用户提交时在后台修改,新增数据都是依赖这个隐藏域的值,如果这里不做好验证的话,很可能被用户修改隐

.NET软件防破解方法源码混淆

其实我们只要在软件设计的关键几个环节,利用专业的控件进行保护,就可以保证软件的安全.我们可以在软件设计时和运行时对软件代码进行保护.在设计时的保护,主要的保护手段是,混淆源码:在运行时的保护主要的手段是加壳程序和授权控制.下面我们分别对混淆.加壳.授权控制的方法和采用的控件做一一讲解. 源码混淆源码混淆就是通过对程序源码的分析,改变源码的原始面貌,降低源码可读性,可对函数甚至流程进行混淆.虽然目前很多开发工具都能进行简单的混淆,不过实用性不大,采用专业的混淆控件对程序源码能起到有效的保护,有些

linux 防爆破方法

利用pam 认证模块锁定多次登陆失败的用户 pam 模块存放在 /lib/security/pam_*****.so 编辑 /etc/pam.d/sshd 添加以下内容 auth required pam_tally2.so deny=5 lock_time=60 当用户通过ssh 尝试登陆系统密码输错5次,系统就锁定该账户60S 验证: 手动解除锁定命令 pam_tally2 --reset -u 用户 linux 防爆破方法,布布扣,bubuko.com

nginx+lua+redis实现验证码防采集

之前介绍过在nginx里如何嵌入lua模块,利用nginx+lua可以很好的开发开发nginx的业务逻辑,并且达到高并发的效果. 下面我们就来介绍下利用nginx+lua+redis实现防采集的功能. 现象: 网站在为用户提供服务的同时也在被搜索引擎.采集器不断的抓取,可能会造成网站不堪重负,导致页面放回5XX错误.针对此种情况,我们就要对采集器及搜索引擎来进行访问控制,当然对搜索引擎的控制可能会影响网站的收录. 功能描述: nginx+lua在前端实现客户端的访问控制,将客户端的访问信息记入r

Java中替换HTML标签的方法代码

这篇文章主要介绍了Java中替换HTML标签的方法代码,需要的朋友可以参考下 replaceAll("\\&[a-zA-Z]{0,9};", "").replaceAll("<[^>]*>", "\n\t") 源码如下: /** * 字符串替换 */ package com.you.model; /** * HTML标签替换 * @author YHD * @version */ public cla

C++ - goto的使用方法代码

goto的使用方法代码本文地址: http://blog.csdn.net/caroline_wendy goto语句是无条件转移语句, 不建议使用, 但需要掌握语法. goto可以跳过一些语句, 直接执行其他语句, 可以用于循环. 代码: /* * main.cpp * * Created on: 2014.9.12 * Author: Spike */ /*eclipse cdt, gcc 4.8.1*/ #include <iostream> using namespace std;

CMDB3 完善采集端代码(ssh方案的多线程采集), 异常处理, 服务端目录结构的设计(django的app), API数据分析比对入库

完善一下采集端代码 ssh方案的多线程采集线程和进程,协程的区别 (90% 问到) 提高并发的话,使用多线程 python2 多进程有多线程没有 python3 多进程有多线程有 from concurrent.futures import ThreadPoolExecutor,ProcessPoolExecutor p = ThreadPoolExecutor(10) def test(i): time.sleep(1) print(i) for i in range(100): p.s

猜你喜欢

---------------------------------------------------------------------------- 转载:http://blog.csdn.net ...

5233杨光--第七周实验报告

学习时间:5小时学习任务:<深入理解计算机系统>第六章——存储技术及高速缓存部分 (一)存储技术 ***存储器系统是一个具有不同容量.成本和访问时间的存储设备的层次结构.CPU寄存器保存 ...

ycb的ACM进阶之路二进制多重背包

ycb的ACM进阶之路发布时间: 2017年5月22日 14:30 最后更新: 2017年5月22日 14:31 时间限制: 1000ms 内存限制: 128M 描述 ycb是个天资聪颖 ...

类的基本概念

类就像是一个加强版的struct 类的成员包括:(1)数据成员,(2)成员函数也就是在struct的计算出上增加了函数一个类的基本组成是 class first_lei { private: // ...

gopath环境变量设置

#在国内镜像下载二进制包 wget -c http://www.golangtc.com/static/go/go1.4.1.linux-amd64.tar.gz tar -C /usr/local ...

AJAX状态

下面是 XMLHttpRequest 对象的三个重要的属性: 属性描述 onreadystatechange 存储函数(或函数名),每当 readyState 属性改变时,就会调用该函数. read ...

struts2 知识梳理

一:struts.xml配置详解: 1.<include> 表示引入其他配置文件 2.<constant> 定义常量 3.<package>: 属性是否必需描 ...

安卓简单应用试水以及真机测试的问题解决

对着书上敲了一波简单的安卓应用,主要是通过年龄性别来给出婚姻建议,po一下代码: .java文件: package com.example.admin.experiment; import andro ...

转自go_with_wind的博客Oracle逻辑读详解

原文地址:http://blog.sina.com.cn/s/blog_6ceed3280100x0om.html 1.物理读(physical read) 当数据块第一次读取到,就会缓存到buffe ...

java.lang.RuntimeException: Unable to instantiate activity ComponentInfo异常总结

java.lang.RuntimeException: Unable to instantiate activity ComponentInfo异常总结做android开发的可能都碰到"j ...

Python老王视频习题答案

基础篇2:一切变量都是数据对象的引用sys.getrefcount('test') 查看引用计数变量命名不能以数字开头编码:ascii.unicode.utf-81.阅读str对象的help文档,并解 ...

ORACLE中的FTP例子代码

http://blog.csdn.net/mashengwang/article/details/5982663 CREATE OR REPLACE DIRECTORY my_docs AS '/u0 ...

VS2010 VC++目录已被否决？

问题引入下载了一个开源项目RTMP Server,对齐编译时提示没有找到openssl/bn.h文件.于是下载了最新的openssl(openssl-1.0.0d)后,对openssl编译.生成了头 ...

磁盘读写测试

物理机系统基本信息 OS 名称 Microsoft Windows Server 2008 R2 Enterprise 版本 6.1.7601 Service Pack 1 内部版本 7601 ...

ArcGIS Android SDK 中文标注乱码

Android使用如下代码添加标注: TextSymbol ts = new TextSymbol(12, "名称", Color.RED);Graphic gp = new Gr ...

PHP发送请求头和接收打印请求头

一.发送请求头 //发送地址 $url = 'http://127.0.0.1/2.php'; //请求头内容 $headers = array( 'Authorization: '.$basic, ...

RedHat 7配置VNC服务

安装了kvm后通过ssh远程管理虚拟化宿主机感觉不太方便,因此安装VNC Server以实现图形界面的远程管理.本文介绍VNC Server的安装配置. 本文原始出处:江健龙的技术博客 http:// ...

人工智能搜索算法（深度优先、迭代加深、一致代价、A*搜索）

搜索算法问题求解一.需求分析分别用深度优先.迭代加深.一致代价.A*搜索算法得到从起始点Arad到目标点Bucharest的一条路径,即为罗马尼亚问题的一个解,在求解的过程中记录每种算法得到的解, ...

#include<stdio.h>#include<string.h>int l[100001];int n;int lowbit(int x){ return (x)& ...

DetailsView控件弹出删除确认对话框

方法一:添加事件代码 protected void DetailsView1_ItemCreated(object sender, EventArgs e) { int cc = DetailsVie ...

专题

随机推荐

© 2024 憋错料 | info#biecuoliao.com | 10 q. 0.022 s.