屏蔽百度搜索二级域名的限制

如果某些二级域名不愿意被收入，如果这些二级域名可以不访问的，那就直接对特定域名做301重定向到主域名上，或者把这几个二级域名单独绑定到新的目录或者子目录里面，然后用robots做目录限制抓取。

如果二级域名还需要用，那就牺牲一段时间，把域名单独做解析到新目录或新服务器下，然后做404，再向百度站长平台提交死链

还有一种思路，那就用php来判断是否是蜘蛛访问，如果是蜘蛛访问就做301、404、或者跳转都是可以的

下面是用robots 的方式来禁止搜索引擎抓取的方式，以及robots.txt 的命名规范

User-agent: * 这里的*代表的所有的搜索引擎种类，*是一个通配符

Disallow: /admin/ 这里定义是禁止爬寻admin目录下面的目录

Disallow: /require/ 这里定义是禁止爬寻require目录下面的目录

Disallow: /ABC/ 这里定义是禁止爬寻ABC目录下面的目录

Disallow: /cgi-bin/*.htm 禁止访问/cgi-bin/目录下的所有以".htm"为后缀的URL(包含子目录)。

Disallow: /*?* 禁止访问网站中所有包含问号 (?) 的网址

Disallow: /.jpg$ 禁止抓取网页所有的.jpg格式的图片

Disallow:/ab/adc.html 禁止爬取ab文件夹下面的adc.html文件。

Allow: /cgi-bin/　这里定义是允许爬寻cgi-bin目录下面的目录

Allow: /tmp 这里定义是允许爬寻tmp的整个目录

Allow: .htm$ 仅允许访问以".htm"为后缀的URL。

Allow: .gif$ 允许抓取网页和gif格式图片

Sitemap: 网站地图告诉爬虫这个页面是网站地图

这里做一个例子：Disallow: /test.baidu.com

一种是用php方式来屏蔽掉搜索引擎

if(getrobot())//如果蜘蛛
{
    header(‘HTTP/1.1 301 Moved Permanently‘);//发出301头部
    header(‘Location:http://www.baidu.com‘);//需要跳转的地址
}else{
    echo ‘不是蜘蛛访问‘;
}

/**
* 判断是否为搜索引擎蜘蛛
*
* @return bool
*/
function getrobot() {
    $isrobot = FALSE;
    $kw_spiders = ‘Bot|Crawl|Spider|slurp|sohu-search|lycos|robozilla‘;
    $kw_browsers = ‘MSIE|Netscape|Opera|Konqueror|Mozilla‘;
    if(!strexists($_SERVER[‘HTTP_USER_AGENT‘], ‘http://‘) && preg_match("/($kw_browsers)/i", $_SERVER[‘HTTP_USER_AGENT‘])) {
    } elseif(preg_match("/($kw_spiders)/i", $_SERVER[‘HTTP_USER_AGENT‘])) {
        $isrobot = TRUE;
    } else {
        $isrobot = FALSE;
    }
    return $isrobot;
}
function strexists($string, $find) {
    return !(strpos($string, $find) === FALSE);
}

时间： 2024-10-07 08:44:33

屏蔽百度搜索二级域名的限制的相关文章

如何屏蔽百度搜索推广

这几天大家都在说百度推广的事.笔者没什么好说的,毕竟已经很久没有见过百度推广了. 不过说实话,很多时候谷歌搜出来的东西才是我想要的. 今天就讲一下如何使用插件屏蔽百度推广. 一.工具 1.chrome浏览器 2.Tampermonkey 插件(chrome版) Tampermonkey 是一款免费的浏览器插件和最为流行的用户脚本管理器,它适用于基于 Blink 和 WebKit 的浏览器,像是 Chrome, Opera Next 和 Safari. 3.去百度搜索置顶推广脚本(基于Tampe

跟我一起屏蔽百度搜索页面右侧的内容

苦恼百度搜索热点等冗杂信息很久了,然后今天下定决心解决这个问题了. 第一步:搜索,并安装插件Adblock Plus 第二步:使用拦截器 1.打开拦截器 2.具体使用点击这一块添加原文地址:https://www.cnblogs.com/smart-girl/p/11058774.html

写个屏蔽百度搜索广告的Chrome插件

工作生活都用百度比较多,毕竟它是目前为止感觉最好的国内PC搜索引擎.我纵使已经差不多炼成了一眼过滤广告的眼力,但始终觉得碍眼,感觉还是写个插件把它屏蔽了吧.这个插件开发的门槛其实非常低,只是一开始做不知道哪里查插件开发的资料才折腾了半天. 一.找一个百度网页出来分析. 1.推广链接有三种:上部无底色,上部有底色和下部有底色:通常是一开始上部的广告是无底色的,刷新多几次后就会变成有底色: 2.查看CSS可以看到,主搜索结果和广告都在一个id为content_left的div容器里(见图左上方红框)

Chrome谷歌浏览器屏蔽百度搜索右侧广告推荐方法

先上图百度广告,其实屏蔽广告很简单主要分成以下三步: 下载Adblock Plus插件安装Adblock Plus插件开启屏蔽一.下载Adblock Plus插件(官网离线版) 二.安装Adblock Plus插件下载完成之后,得到一个crx文件,也可以直接点击安装 ,下载不了的这边提供了压缩包:链接: https://pan.baidu.com/s/1P30UN1IfsmtT2lX8rLDCHQ 提取码: r4cz 下载解压到 C:\Users\用户名\AppData\Loca

屏蔽百度搜索热点

屏蔽baidu右边栏垃圾信息方法谷歌浏览器使用adblock plus插件,过滤列表中添加: 屏蔽搜索热点 www.baidu.com##div[tpl="right_toplist"] 屏蔽右侧内容 www.baidu.com###content_right 当然,防止以后其他问题的最好办法是换个良心的搜索引擎,必应这方面做得不错. 原文地址:https://www.cnblogs.com/zjfjava/p/9201776.html

二级域名seo与一级目录seo的区别

近期有许多客户咨询小卒有关二级域名seo与一级目录seo的区别与联系,小卒认为在实际工作中,只有正确的认识了二级域名seo与一级目录seo之间的关系,我们才更好的去利用它们,那么小卒seo今天就分享一下自己对二级域名seo与一级目录seo一些拙见供大家参考. 二级域名seo与一级目录seo之权重传递: 从长远来看,二级域名的权重要比一级目录的权重要高很多.但搜索引擎会把二级域名当成是一个新站点来看待,所以二级域名会经历新域名的考验,而且会分散主站权重,而一级目录就是将权重都集中到主域名上面,增加

『Python』爬行搜索引擎结果获得指定主机所有二级域名

0x 00 前言前天自己在玩的时候,自己通过百度搜索主机的二级域名感觉好麻烦,自已要一页页的去翻而且人工识别是否是重复的二级域名也够蛋疼的,正好最近在学正则表达式,权当练手了 0x 00 代码 # coding=utf-8 # author:Anka9080 import urllib import urllib2 import cookielib import re url = 'http://www.haosou.com/s?src=360sou_newhome&q=site:tjut.

二级域名怎么做优化

二级域名介绍二级域名,也可以称为网站的内页.这些二级域名并不是seo要优化的重点,因此很多人都会只偏爱优化顶级域名,而把二级域名置于千里.这种习惯其实是非常不好的,二级域名也有它独特的优势,只要能够优化上来,对网站的流量是绝对能起到一个质的飞跃. 在百度上搜索关键词,细心的人不能发现,排在前面的不少都是二级域名,这就说明,二级域名的优化容易度比顶级域名的低,并且能够具有抢先别人一步进首页的优势. 优化方法二级域名的内容建设也需要细致化很多人认为,优化二级域名没有优化顶级域名那么多工作,只

如何免费注册使用虚拟主机和二级域名建站

相信还是有不少程序员不知道怎么把自己创建的网站发布到网络上去,其实这个并不复杂,只要你有域名和服务器,一切都那么简单. 域名和服务器到哪里去弄?当然是去域名和服务器提供商那里去申请了.大部分的域名和服务器都是收费的,当然也有免费的虚拟主机和二级域名.如果仅仅是个人学习研究或者建立自己的博客论坛,免费的二级域名和虚拟主机就OK了,没必要去购买域名和服务器的. 对于免费域名,一般只有二级域名,而且是国外的,国内很少.免费虚拟主机国内也有,本人用过的最好的一个是1个月的使用期限,到期之前要发帖给他们打