网页取消快照、禁止抓取等meta标签功能

<meta name="robots" content="noarchive">

  以上的一段代码限制了所有的搜索引擎建立你的网页快照。如果我们需要仅仅限制一个搜索引擎建立快照的话,就可以像如下这样去写

  <meta name="Baiduspider" content="noarchive">

  需要注意的是,这样的标记仅仅是禁止搜索引擎为你的网站建立快照,如果你要禁止搜索引擎索引你的这个页面的话,请参照后面的办法。

  第二种情况:禁止搜索引擎抓取本页面。

  在SEO中,禁止搜索引擎抓取本页面或者是允许搜索引擎抓取本页面是经常会用到的。因此我们需要对这一部分重点做一次讨论。

  为了让搜索引擎禁止抓取本页面,我们一般的做法是在页面的元标记中加入如下的代码:

  <META NAME="ROBOTS" CONTENT="NOINDEX,FOLLOW">

  在这里,META NAME="ROBOTS"是泛指所有的搜索引擎的,在这里我们也可以特指某个搜索引擎,例如META NAME="Googlebot"、META NAME="Baiduspide"等。content部分有四个命令:index、noindex、follow、nofollow,命令间以英文的“,”分隔。

  INDEX命令:告诉搜索引擎抓取这个页面

  FOLLOW命令:告诉搜索引擎可以从这个页面上找到链接,然后继续访问抓取下去。

  NOINDEX命令:告诉搜索引擎不允许抓取这个页面

  NOFOLLOW命令:告诉搜索引擎不允许从此页找到链接、拒绝其继续访问。

  根据以上的命令,我们就有了一下的四种组合

  <META NAME="ROBOTS" CONTENT="INDEX,FOLLOW">:可以抓取本页,而且可以顺着本页继续索引别的链接

  <META NAME="ROBOTS" CONTENT="NOINDEX,FOLLOW">:不许抓取本页,但是可以顺着本页抓取索引别的链接

  <META NAME="ROBOTS" CONTENT="INDEX,NOFOLLOW">:可以抓取本页,但是不许顺着本页抓取索引别的链接

  <META NAME="ROBOTS" CONTENT="NOINDEX,NOFOLLOW">:不许抓取本页,也不许顺着本页抓取索引别的链接。

  这里需要注意的是,不可把两个对立的反义词写到一起,例如

  <META NAME="ROBOTS" CONTENT="INDEX,NOINDEX">

  或者直接同时写上两句

  <META NAME="ROBOTS" CONTENT="INDEX,FOLLOW">

  <META NAME="ROBOTS" CONTENT="NOINDEX,FOLLOW">

  这里有一个简便的写法,如果是

  <META NAME="ROBOTS" CONTENT="INDEX,FOLLOW">的形式的话,可以写成:

  <META NAME="ROBOTS" CONTENT="ALL">

  如果是

  <META NAME="ROBOTS" CONTENT="NOINDEX,NOFOLLOW">的形式的话,可以写成:

  <META NAME="ROBOTS" CONTENT="NONE">

  当然,我们也可以把禁止建立快照和对于搜索引擎的命令写到一个命令元标记中。从上面的文章中我们得知,禁止建立网页快照的命令是noarchive,那么我们就可以写成如下的形式:<META NAME="ROBOTS" CONTENT="INDEX,FOLLOW,noarchive">

  如果是对于单独的某个搜索引擎不允许建立快照,例如百度,我们就可以写成:

  <META NAME=" Baiduspider" CONTENT="INDEX,FOLLOW,noarchive">

  如果在元标记中不屑关于蜘蛛的命令,那么默认的命令即为如下

  <META NAME="ROBOTS" CONTENT="INDEX,FOLLOW, archive">

  因此,如果我们对于这一部分把握不准的话,可以直接写上上面的这一行命令,或者是直接留空。

  在SEO中,对于蜘蛛的控制是非常重要的一部分内容,所以希望各位看官准确把握这部分的内容。

原文地址:https://www.cnblogs.com/webwangjie/p/8324616.html

时间: 2024-08-04 17:37:51

网页取消快照、禁止抓取等meta标签功能的相关文章

网页调试技巧:抓取马上跳转的页面POST信息或者页面内容

http://www.qs5.org/Post/625.html 网页调试技巧:抓取马上跳转的页面POST信息或者页面内容 2016/02/02 | 心得分享 | 0 Replies 有时候调试网页或者抓别人网页的POST包的时候. 总会遇到这样的尴尬,我们需要抓取POST提交的信息. 或者获取POST完成页面返回的代码. 但是,目标页却马上就跳转了,导致,还没来得及Esc呢,页面就已经刷新了. 这种情况,起码谷歌浏览器的F12是搞不了了... 比如下面的情况 我把密码放在 被Post页面的源码

C#语言实现对网页图片的随机抓取。基础办法,但还有一点小问题,欢迎大家指正

//当点击读取的时候,抓取网页源代码        string wangzhi;        string respHtml;        private void 读取网页源代码ToolStripMenuItem_Click(object sender, EventArgs e)        {            textBox2.Clear();  //读 取之前清空            wangzhi = comboBox1.Text;            HttpWebR

H5各种头部meta标签功能大全

<!DOCTYPE html>  H5标准声明,使用 HTML5 doctype,不区分大小写 <head lang=”en”> 标准的 lang 属性写法 <meta charset=’utf-8′>    声明文档使用的字符编码 <meta http-equiv=”X-UA-Compatible” content=”IE=edge,chrome=1″/>   优先使用 IE 最新版本和 Chrome <meta name=”description”

html meta标签使用总结(转)

之前学习前端中,对meta标签的了解仅仅只是这一句. <meta charset="UTF-8"> 但是打开任意的网站,其head标签内都有一列的meta标签.比如我博客的. 但是自己却很不熟悉,于是把meta标签加入了寒假学习计划的最前方. 简介 在查阅w3school中,第一句话中的"元数据"就让我开始了Google之旅.然后很顺利的在英文版的w3school找到了想要的结果.(中文w3school说的是元信息,Google和百度都没有相关的词条.但

HTML meta标签总结与属性使用介绍

之前学习前端中,对meta标签的了解仅仅只是这一句. <meta charset="UTF-8"> 但是打开任意的网站,其head标签内都有一列的meta标签.比如我博客的. 但是自己却很不熟悉,于是把meta标签加入了寒假学习计划的最前方. 简介 在查阅w3school中,第一句话中的"元数据"就让我开始了Google之旅.然后很顺利的在英文版的w3school找到了想要的结果.(中文w3school说的是元信息,Google和百度都没有相关的词条.但

HTML meta标签使用介绍

简介 在查阅w3school中,第一句话中的"元数据"就让我开始了Google之旅.然后很顺利的在英文版的w3school找到了想要的结果.(中文w3school说的是元信息,Google和百度都没有相关的词条.但元数据在Google就有详细解释.所以这儿采用英文版W3school的解释.) The <meta> tag provides metadata about the HTML document. Metadata will not be displayed on

HTML中的meta标签及其使用方法

组成 meta标签共有两个属性,分别是http-equiv属性和name属性. 1. name属性 name属性主要用于描述网页,比如网页的关键词,叙述等.与之对应的属性值为content,content中的内容是对name填入类型的具体描述,便于搜索引擎抓取.meta标签中name属性语法格式是: <meta name="参数" content="具体的描述">. 其中name属性共有以下几种参数.(A-C为常用属性) A. keywords(关键字)

用Python进行网页抓取

引言 从网页中提取信息的需求日益剧增,其重要性也越来越明显.每隔几周,我自己就想要到网页上提取一些信息.比如上周我们考虑建立一个有关各种数据科学在线课程的欢迎程度和意见的索引.我们不仅需要找出新的课程,还要抓取对课程的评论,对它们进行总结后建立一些衡量指标.这是一个问题或产品,其功效更多地取决于网页抓取和信息提取(数据集)的技术,而非以往我们使用的数据汇总技术. 网页信息提取的方式 从网页中提取信息有一些方法.使用API可能被认为是从网站提取信息的最佳方法.几乎所有的大型网站,像Twitter.

Asp.net 使用正则和网络编程抓取网页数据(有用)

Asp.net 使用正则和网络编程抓取网页数据(有用) /// <summary> /// 抓取网页对应内容 /// </summary> /// <param name="strUrl">採集地址</param> /// <param name="Begin">開始字符</param> /// <param name="End">结束字符</param&g