网站屏蔽搜索引擎的方法

有的时候我们的网站可能还在调试阶段，或者只对部分告知用户或内部人使用，可能不想让搜索引擎抓取我们的网站，以下介绍几种屏蔽搜索引擎的抓取：

1.在网站的根目录下创建robots.txt，添加内容：

User-agent:* Disallow:/ 禁止某一搜索引擎，如百度：

User-agent:baiduspider Disallow:/

各大搜索引擎代号：

google蜘蛛： googlebot

百度蜘蛛：baiduspider

yahoo蜘蛛：slurp

alexa蜘蛛：ia_archiver

msn蜘蛛：msnbot

有道蜘蛛：YodaoBot和OutfoxBot

搜狗蜘蛛：sogou spider

SOSO蜘蛛：sosospider

360：PeopleRank

2.在网站单页的<head></head>之间添加Meta信息：

CONTENT=INDEX,FOLLOW：可以抓取本页，而且可以顺着本页继续索引别的链接

CONTENT=NOINDEX,FOLLOW：不许抓取本页，但是可以顺着本页抓取索引别的链接

CONTENT=INDEX,NOFOLLOW：可以抓取本页，但是不许顺着本页抓取索引别的链接

CONTENT=NOINDEX,NOFOLLOW：不许抓取本页，也不许顺着本页抓取索引别的链接。

还可以用以下语句禁止搜索引擎为页面建立快照：

3.在网站的根目录下建一个.htaccess文件，这样比robots更加严密（仅适合技术人员），文件内容：

RewriteEngine on

RewriteCond %{HTTP_USER_AGENT} ^Baiduspider [NC]

RewriteRule .* - [F]

时间： 2024-11-02 18:34:20

网站屏蔽搜索引擎的方法的相关文章

浅谈屏蔽搜索引擎爬虫（蜘蛛）抓取/索引/收录网页的几种思路

网站建设好了,当然是希望网页被搜索引擎收录的越多越好,但有时候我们也会碰到网站不需要被搜索引擎收录的情况. 比如,你要启用一个新的域名做镜像网站,主要用于PPC 的推广,这个时候就要想办法屏蔽搜索引擎蜘蛛抓取和索引我们镜像网站的所有网页.因为如果镜像网站也被搜索引擎收录的话,很有可能会影响官网在搜索引擎的权重,这肯定是我们不想看到的结果. 以下列举了屏蔽主流搜索引擎爬虫(蜘蛛)抓取/索引/收录网页的几种思路.注意:是整站屏蔽,而且是尽可能的屏蔽掉所有主流搜索引擎的爬虫(蜘蛛). 1.通过 rob

网站推广的基本方法转载

1.搜索引擎推广方法搜索引擎推广是指利用搜索引擎.分类目录等具有在线检索信息功能的网络工具进行网站推广的方法.由于搜索引擎的基本形式可以分为网络蜘蛛型搜索引擎(简称搜索引擎)和基于人工分类目录的搜索引擎(简称分类目录),因此搜索引擎推广的形式也相应地有基于搜索引擎的方法和基于分类目录的方法,前者包括搜索引擎优化.关键词广告.竞价排名.固定排名.基于内容定位的广告等多种形式,而后者则主要是在分类目录合适的类别中进行网站登录.随着搜索引擎形式的进一步发展变化,也出现了其他一些形式的搜索引擎,不过大

外链专员常用建设网站外链的方法

通常情况下,SEO站长在网站建设初期,就会通过建设网站外链来提高网站权重及网站关键词的排名.如果能够做好网站外链的建设,一方面能够提高网站知名度,增加流量,同时也能够影响网站在搜索引擎的排名.那么外链专员常用的建设网站外链的方法有哪些呢?一.友情链接友情链接是网站外链中一种最好的外链方式,一般显示在首页的底部.好的站长一般手上都是有十几个甚至更多的高权重网站,通过这些站去做新站的网站外链,一段时间内可以提高网站的权重及关键词的排名.当然在做友情链接的过程中也是存在很多注意事项.友情链接注意事项,

不修改代码就能优化ASP.NET网站性能的一些方法

阅读目录开始配置OutputCache 启用内容过期解决资源文件升级问题启用压缩删除无用的HttpModule 其它优化选项本文将介绍一些方法用于优化ASP.NET网站性能,这些方法都是不需要修改程序代码的.它们主要分为二个方面:1. 利用ASP.NET自身的扩展性进行优化.2. 优化IIS设置. 回到顶部配置OutputCache 用缓存来优化网站性能的方法,估计是无人不知的. ASP.NET提供了HttpRuntime.Cache对象来缓存数据,也提供了OutputCache指

php实现网站插件机制的方法

php实现网站插件机制的方法这些天想作一个在网站中实现插件的功能,谷歌了一下,发现一篇文章感觉对我帮助很大,帖出来和大家分享,废话不多说,直接帖出代码供大家分析. 首先是插件的管理类的实现: 复制代码代码如下: <? /** * STBLOG PluginManager Class * * 插件机制的实现核心类 * * @package STBLOG * @subpackage Libraries * @category Libraries * @author Saturn * @link

网站内部搜索引擎简单实现

(原创,转载请注明) 不久前接手一个java web开发的活,网站是一个学术期刊的发布和共享平台.支持在线搜索网站内部期刊.以前没接触过搜索引擎,觉得搜索是一门高深的学问,后来折腾了两天写了一个简单的,不包含权重排序.爬虫和大型数据库和全文搜索(貌似中文不支持全文搜索),不涉及自然语言处理相关的语义.分词等的搜索引擎.就是大概完成了搜索的大体流程,适合初学者了解搜索的大体步骤. 我的简单搜索引擎实现以下工作: 用户可根据标题.作者.关键字和全面检索,来搜寻相关期刊: 暂时只支持单个词的搜索,如果

Web Deploy发布网站及常见问题解决方法(图文)

Web Deploy发布网站及常见问题解决方法(图文) Windows2008R2+IIs7.5 +Web Deploy 3.5 Web Deploy 3.5下载安装 http://www.iis.net/downloads/microsoft/web-deploy 点 Install this extension 也可直接点下面链接 http://go.microsoft.com/?linkid=9817356 全部点下一步进行安装直至完成, Web Deploy 安装完毕后,便可进行下一

大型网站负载均衡解决方法

你知道大型网站是如何做负载均衡的吗:大型网站负载均衡解决方法 http://www.ltesting.net/ceshi/ceshijishu/xncs/xingnendiaoyou/2014/0626/207357.html 几种软负载均衡策略分析 CSDN 关于Web应用负载均衡及数据共享的几个问题 http://bbs.csdn.net/topics/390850017

总结的一些网站利于搜索引擎优化的小常识及SEO优化

网站利于搜索引擎优化的小常识 1. 尽量用独立IP和空间原因:同IP下其他网站受罚,可能会对你站有影响.如果你的站和很多垃圾.色情站同在一个服务器,搜索引擎会喜欢吗? 2. 做不同内容网站时,避免使用二级域名和免费域名.原因:当主域名或其他二级域名被惩罚,会牵连你的站.而且搜索引擎会规定每个域名下的收录数 3. 以复合关键字作域名,都应该用短横线隔开.如:www.made-in-china.com原因:如果用www.madeinchina.com 搜索引擎会把madeinchina认为是一个词,