夺命雷公狗—玩转SEO---63---页面相似度算法原理

度娘在2009年申请了一款专利技术,专利文档下载地址:https://files.cnblogs.com/files/leigood/%E7%BD%91%E9%A1%B5%E7%BB%93%E6%9E%84%E7%9B%B8%E4%BC%BC%E6%80%A7%E7%A1%AE%E5%AE%9A%E6%96%B9%E6%B3%95%E5%8F%8A%E8%A3%85%E7%BD%AE.zip

模板相似度,比如我们想仿造一个网站,标签内容什么都一样的,但是名字不同,产品不同,如下所示:

别人出售的是切割机,我们用来出售拖拉机,而且所有使用的标签都一样,就是名词不同,这种方式就称之为:“模板一致”,这样是不利于网站优化的~~!

如果想要仿不是不可以,不过需要做一些改动,不能全部一样,除非域名很厉害,否则不要这样玩了,因为搜索引擎会判断为抄袭别人的网站,虽然产品不同,但是属于天生盗用了别人的骨架,因为只是将别人网站的骨架来用,只是替换了一下产品而已,没有原创度在里面,对于新站而已,搜索引擎不太喜欢的~~!

度娘模板专利可以总结如下几点:

1、根据DOM树确定模板的特征问题,跟数据库中的模板进行比对。

2、每个标签的组合都可以当成一个单元,度娘他会有自己的库,来存放模板的特征,可以理解为我们网站的源码<div>test。。。。。</div>没块都是有特征在里面的:

3、多节点的特征单元决定模板的特征问题~ ~!

4、节点在列表特征中占据一点的比值,如果一大串代码,那么我们的关键词就需要布局进入li 标签中去,如下所示:

这里其实就是布局了长尾词进去而已,而且嵌入关键词达到60%(如10个li其中6个都做了关键词布局)左右基本都可以了,不用全部都加~~!

5、特征单元的深度越深,权重越低

6.重复得兄弟节点权重递减,且影响节点下的单元

<div>
    <div><ol><li>拖拉机哪里好</li></ol></div>
    <div><ol><li>拖拉机哪里贵</li></ol></div>
    <div><ol><li>拖拉机维修费用<div><a>test</a></div></li></ol></div>
</div>

也就是说拖拉机哪里好的这个  li 的权重是最最高的,下面div的会层层递减~~!

7、无用标签尽量少用,而且还有可能降低网站权重

8、网站模板多样化,比如每个栏目下的模板都是不同的

内容相似度和模板相似度都是各占50%左右的评分的,但是还是建议自己开发一套模板,或者大改,否则基本木有啥卵用,度娘还是挺强大的~~!

原文地址:https://www.cnblogs.com/leigood/p/11267520.html

时间: 2024-07-30 02:43:51

夺命雷公狗—玩转SEO---63---页面相似度算法原理的相关文章

夺命雷公狗—玩转SEO---56---query需求分析与搜索意图研究

做排名4大核心因素: 域名 页面质量 链接 用户行为 我们需要了解什么是query: 我们直接百度一个词,然后F12键盘,进入审查的界面然后进入network,然后找一个jQuery的反馈,如下所示: 他木有出来,然后点击一下清理按钮,然后鼠标再放到输入框中即可见到,如下所示: 然后我们将获取到的数据保存出来,然后在进行二次编辑: 原本: https://www.baidu.com/sugrec?pre=1&p=3&ie=utf-8&json=1&prod=pc&f

夺命雷公狗—玩转SEO---58---全站title与description深层次玩法,首页篇

title:标题 度娘的标题其实是有实际的标题规范的,大家可以参考:   https://ziyuan.baidu.com/college/articleinfo?id=2728 ,大家按照度娘最新发布出来的规范要求来玩即可,站长平台查看: 在这里可以找到度娘对标题的要求,而以下官方这段话是特别需要重视的点: 度娘官方中对标题有了一个很明显的规范,而且关键词堆积这个反面例子,现在都改成这样了,所以我们如果是做新站,那就按照他们官方的要求来玩好了: 那么我们就按照他的要求来写标题即可,而且网站标题

夺命雷公狗—玩转SEO---79---移动端页面规范

整体布局 1.按照闪电算法的要求,所有标签的加载速度在3秒以内 2.手机版面必须适合在手机端进行浏览,要排版靠谱 3.第一映像(首屏)要看到主题业务,如果有广告,不能挡着主题内容 内容规范 1.不要分页 2.分段得体,阅读方便 3.纯文本字体号要控制在14px或者16px 4.上下两个如果都是A标签,如果字号是14px,那么A标签的上下间距需要给13,如果字号是16px,那么上下间距就要给14 5.img图片的width宽度最好是100% 6.如果是视频或者音频,不能设置成为下载播放器才可以进行

夺命雷公狗—玩转SEO---71---百度平台与统计工具的玩法

百度站长平台地址是:https://ziyuan.baidu.com 链接提交,大家可以参考:https://ziyuan.baidu.com/linksubmit/index   这里面有详细的玩法~~! 移动适配 这里面值是适用  独立网站(如:  m.baidu.com)   如果  自适应的网站   而且匹配规则尽量规定出来即可~ ~! MIP&AMP 也是针对独立手机站(如:m.baidu.com)的,自适应站点不适应.对移动端网站加速还是有一点小作用而已,因为有一个算法(闪电算法)所

夺命雷公狗—玩转SEO---51---建库,正排索引与倒排索引和浅入关键词密度

搜索引擎其实和我们书本上的目录原理是一样的,书本上我们是可以通过目录找到我们相应的内容, 比如导航站其实也就是一个索引的结构: 正排索引: 网站001   =   关键词A  +   关键词B   如此类推...... 网站002   =   关键词A  +   关键词B   如此类推...... 像这种页面被分成一个个的关键词就是正排索引 倒排索引: 1.文档 就像一个网站,里面分成一个个文件(如 TXT.RAR.JS.CSS.EXE.JPG),这就称呼为文档 2.文档集合 有很多的文档组成的

夺命雷公狗—玩转SEO---17---收录

收录,页面被搜索引擎蜘蛛发现发现,且分析了,进行收录到搜索引擎中去了,如: 这个是大站的,这里的收录数据多得有点吓人,真心佩服天涯~~! 而我们的新站,百度只是收录了5个页面,木事,迟点将收录页面和大伙们一起提上来,嘻嘻 原文地址:https://www.cnblogs.com/leigood/p/11155132.html

夺命雷公狗—玩转SEO---40---提升网站出图率的技巧

出图,他分为两种,首页和内容页出图~~! 首页我们最常见的就是LOGO图片了,我们的LOGO如果可以,尽量按照百度的要求上的规则来玩: 我们可以进入百度站长平台进行查询一下规则来玩,PC站点的LOGO比率一般都是:121X75的,更是jpg或PNG都可以,图片内容尽量简洁,轮廓分明,简单大气即可 因此我们的大小尽量页改成他要求的来玩咯 内容页的玩法 图片最佳是按照LOGO的要求来玩   121X75  然后我们将这个数X2,X3这样即可,图片最好限制在800px宽度以内的,这个对网站来说是有好处

夺命雷公狗—玩转SEO---78---手机排名优先索引---MIP改造

MIP闪电算法,主要应用在独立手机站,m.baidu.com,主要功能是缓存网站上的   图片   js   css   到百度的mip服务器中. 我们可以查看下mip规范 上面就已经很明确的标注出来了,我们传统的     <html>   标签需要改造成<html mip>  ,然后到   https://www.mipengine.org/validator/validate/   网站上即可将自己网站的代码放进去进行校验了,而且网站上还有一个例子: <!DOCTYPE

夺命雷公狗—玩转SEO---14---空间和服务器的区别

空间和服务器常常都是使用过来放置我们网站的源码程序的,不过是一台放置于远方的24小时不关机的电脑 空间:就是服务器上分出来的一点点空间 我们可以理解成为我们生活中超市的货柜: 上图每个地方都分割出一块块的空间提供超市的货物放置,但是我们所说的空间就是放置网站源码的而已 服务器:可以理解成为整个货架 这里面可以繁殖很多不同的商品,因此我们可以理解为,在服务器上我们可以存放很多不同的网站 原文地址:https://www.cnblogs.com/leigood/p/11155101.html