网站出现重复内容 百度收录重复页面怎么办

在搜索引擎收录中时我们可能会发现,同样的内容搜索引擎收录了不止一次,其中有“静态页面,也有动态或伪静态页面。看似增加了网站的收录量是好事,实则“重复内容”的收录对SEO优化并不好,最后所带来的结果,轻则重复快照被回收删除,重则直接影响网站权重。


  今天为你详细分析:
  1.为什么网站同一个页面会被重复收录?
  2.重复收录对SEO优化有什么影响?
  3.我们该如何应对网站重复收录的问题?
  
  从以上的例子,我们可以看出网站的首页除了静态页面收录以外,还有很多后缀带“?qz_gdt=”的动态页面的收录,但打开链接我们可以发现,都是指向网站的首页。那么面对网站页面重复收录的问题,我们该怎么办呢?

  我们必须弄清楚以下三点:

  一:网站页面重复收录的原因是什么?
  在网站优化过程中,搜索引擎并不喜欢重复内容的收录,一直强调的也是原创,那为什么网站同一页面还会重复收录呢?
  一般后缀出现了一个问号或者其他的字符串,是因为百度收录文章的同时,会给该篇文章加一个标签,但是访问网站的时候,会自动跳转回来原来的网站,首页或者内页,至于内页的链接被收录到首页有可能是因为该篇文章设置在首页上显示,所以最终的链接地址指向了首页。
  1.搜索引擎识别问题—搜索引擎毕竟只是人为编写的一套规则,做不到充分的识别,所以导致部分URL地址的内容重复收录。
  2.程序设计问题—有些程序在设计中为了“预览”方便在后台存在动态页面。但因设计不当,导致搜索引擎依旧通过目录的索引便可发现这一存在,进而对其索引收录。
  3.模板问题—在模板制作中常常易忽视这一问题,最后模板完成后既存在动态页面,又存在静态页面,如此怎能不被搜索引擎重复收录呢?
  4.网站改版—网站改版可能会导致一些URL地址的重复收录,这个可以看一下之前的《如何进行网站改版》这篇文章。

  二:网站页面重复收录会有什么影响?
  在许多时候站长都希望自己的网站收录多,但是同一个页面重复多次的被收录,短期内看似增加了收录量,但是过不了多久重复收录的页面的就会被删除,毕竟一样的内容存在搜索引挚数据库中只会占用空间。所以,特别是一些新站会发现今天收录了很多,明天再看就少了很多。
  一般来说在搜索引擎收录后会将多余的动态页面剔除,但若频繁如此反复的收录剔除、剔除收录,可能会直接影响蜘蛛爬行频率,降低网站页面的收录,从而影响关键词的排名。SEO优化不建议网站存在相同内容的多重URL地址链接。

  三:网站页面重复收录该如何处理?
  我们可以从以下四个方面着手:

1.URL标准化
  在网站建设过程中尽量统一URL地址,勿使用动态页面进行链接,一来是搜索引擎青睐静态页面,另一方面也可以防止相同内容被搜索引擎重复收录。

2.利用robots.txt屏蔽动态文件
  利用robots.txt进行动态文件的屏蔽,如:“Disallow: /?”即屏蔽了根目录下带”?”的页面,这个可以自己灵活设置。

3.及时的清除缓存
  每个网站都会带有两个网址,一般网站更新文章后都需要生成静态的网址,本身就存在一个动态的,自然生成静态后就会多出一个网址,这样的话,如果没及时清除缓存,就可能使得同一个页面的静态,动态URL网址都被收录,因为这搜索引挚把同一篇文章的两个网址看作是独立的,自然就两个都被收录了。所以,及时清除缓存可以很大程度上减少网页被重复收录。

4.利用网站地图引导蜘蛛
  网站地图的作用不单单是把整站的内容进行归纳,而且还可以让蜘蛛爬行更加的顺畅无阻,有序的抓取网站内的各个页面,从而也能减少蜘蛛对网站页面重复收录的概率。

时间: 2024-11-12 05:57:28

网站出现重复内容 百度收录重复页面怎么办的相关文章

博客园查询自己网站二级目录被百度收录的情况

现在最大的技术博客论坛莫非<博客园>和<CSDN>,假如我们想知道自己的博客技术站是否收到欢迎,可以通过查看百度收录来查看,假设直接把自己的网址复制到百度收录统计官网,只能看到博客园官网的收录数据. 下面教大家一条命令,直接在百度首页搜索即可 site:www.cnblogs.com inurl:chenliuxiao 展示的便都是收录的页面,滑到最后一页 可以看到自己的博客园被百度收录了10页 原文地址:https://www.cnblogs.com/chenliuxiao/p/

百度收录查询

很多没有入门的seo新手都听说过百度收录,但是不知道怎么查看百度收录,下面分享两种查看百度收录的方法. 工具/原料 网站地址 网站查询工具 方法/步骤 1 使用site命令查看百度收录 site命令是查询网站在百度收录的一个命令,使用方法是:“site+:+域名”,如:见下图 2 使用网站查询工具查询百度收录 目前市面上的站长工具很多,我们就以工具为例,直接在查询框中输入域名,点击综合查询即可. 3 注意 由于各大工具均为采集site命令查询的结果,偶尔会出现查询结果与site命令查询不一致的现

导致重复内容收录的因素

重复内容是什么因素致使如何发生的? 第一:标准化的疑问也将是自己站点其间内容的副本. 第二:转载从商品制造商和零售商的信息商品,这个本来没有错,生产者也赞同,不是有版权的疑问.而是内容副本不修正的情况下而咱们运用即是一样的商品阐明, 电子商务 是充斥着许多的重复的内容,录入也就重复,也会致使你站点不受查找引擎的友爱. 第三:除了正常的对象查看页面,以及隐藏在模版或许程序中的动态与静态一起录入,假如没有禁止查找引擎就会准确抓取. 动态版本页内容将被仿制.静态所知也会录入.站点创立页面都是有着不一样

网站内容不被百度收录的原因反思及解决方法!

大发迹创业项目网有个网站百度已经没有一个月收录,站长也是着急,于是想着应该怎么解决这个问题.其实网站出了问题,站长应该是最清楚的,所以不要急,仔细回想一下最近操作了什么,然后一个一个去排查就可以找出问题所在,对症下药就ok了. 比如我的这个网站,想要找出问题所在就很简单.回想一下网站也没有做什么优化,建成之后就是单纯的发布内容,网站主要是推荐一些小项目,围绕着项目写文章. 网站几乎是天天更新,终于没有灵感,不知道怎么写了,就开始犯愁了.某一天灵机一动,想着以项目推项目,利用其它的项目来推荐自己操

提高网站权重,快速增加百度收录量

首先,大家应该明白,收录量是一个网站大小的体现,其次是权重的表现.还应该注意的问题,权重的表现并不是收录量决定的,而是收录率决定.一个网站总共的页面数量和被收录的页面数量决定了你的网站在百度的权重多少.也跟排名有关系了.上面的几个朋友的网站,google收录多,baidu收录少,可见,网站页面很多的,但是在百度的权重低,很多页面不会收录. 其次,百度的收录数量如何提纲的方法.既然百度的收录率跟权重是挂钩的,我们不妨也逆向思维.先提高权重,收录自然会跟着上去,这个思路已经被笔者证实过了,非常有效果

ASP.NET的SEO:使用.ashx文件&mdash;&mdash;排除重复内容

本系列目录 不同的链接指向的页面如果具有大量相同的内容,这种现象就会被称为"重复内容",如果一个网站的重复内容很多,搜索引擎就会认为这个网站的价值不高.所以我们应尽量避免各种重复内容. 动态网站的重复内容常常是由URL参数引起的,而URL重写会恶化这一现象(比较耐人寻味哟,呵呵).因为如果使用的是原始的URL参数的话,搜索引擎可能会进行适当的判断,而得知重复内容是由URL参数引起的,自动的进行相应的处理:而URL重写会掩盖URL参数,反而使得搜索引擎无法识别URL参数.比如: 原始的U

如何让百度收录自己的网站?

很多做新站的朋友遇到的瓶颈就是网站一时半会儿不会被百度收录,最后因为网站不收录而放弃了这个网站的发展,我倒感觉非常可惜,一个那么小的细节就让一个未来的辉煌失败了.今天咱就来说说,我是如果让百度一天内收录我的网站的. 先建站后上线 80%的程序员在写程序的时候,会先上线网站,然后一边做程序,一边做网站优化,其实这是导致网站不被收录的主要原因. 试想一下,一个刚刚上线的网站而且经常出现改版,百度敢收录你的网站吗,如果今天你是装修网站,给你收录了,明天你又变成家具网站,那给你收录后,出现在百度搜索结果

百度索引量、百度收录、网站排名和关键词流量

数天前,百度站长平台发布"正确理解索引量工具"一文,称索引量仅指被百度搜索引擎建立了索引的网页总量,表示网站中有多少页面可以作为搜索候选结果,不同网页因内容重要性.稀缺性不同,被展现的几率有很大差别.换句话说,既使你的网站有1亿个网页被建立索引,也许真正能获得流量的仅有100个页面. 该文章一经发布,就引起业界热议,那么百度索引量真正的意义是什么呢?百度限于是代表百度搜索引擎官方,有些事情可能无法说透彻?SEO营销大师为大家分析一下. 首先:百度索引值仅仅是网站在百度数据库中的一个指标

网站内容不收录,你是否陷入这些禁区

在此先介绍搜索引擎收录必经的四个步骤:抓取.过滤.索引.展现.通常意义的收录量,指的就是被搜索引擎展现出来的网站网页的数量. 这些SEO禁区导致网站内容不收录 1.网站SEO作弊,或有黑帽SEO历史 网站存在SEO作弊情况,如最常见的关键词堆砌,内链堆砌,快速排名等;或者网站域名曾经有过黑帽SEO历史,正处于被搜索引擎惩罚阶段.这种情况可能导致网站内容不被收录. 2.robots.txt曾经屏蔽搜索引擎抓取 在搜索引擎收录必经的四个步骤中,抓取是第一步骤.Robots文件禁止搜索引擎抓取,网站内