网站的SEO以及它和站长工具的之间秘密

博客迁移没有注意 URL 地址的变化,导致百度和 google 这两只爬虫引擎短时间内找不到路。近段时间研究了下国内最大搜索引擎百度和国际最大搜索引擎google的站长工具,说下感受。

最近墙的比较厉害,google 不一定能访问进去(我平时用的 GreenVPN,还挺不错的,速度快,支持的国家也多)。

站长工具的作用是为了辅助开发者,针对自己的网站做出更加合理的网页布局和代码优化,以便让 spider 更好地理解网页,从而将最准确的信息送达到用户的荧屏上。它对搜索引擎和开发者是双赢的。

Web 发展极快,由于客户端厂商纷纭加之开发者没把重点放在 web 标准上,直到 2014 年的 10 月底才有了统一的标准。用户输入关键词,搜索引擎要在 0.1s 内将网络上的资源汇聚起来,这个过程中计算的开销、数据整合的开销是极大的,如果我们开发的网页不能让 spider 准确理解,最后的结果就是,写的东西很难出现在用户面前。

搜索引擎对网页的理解

摸索两个站长工具,感触最深的是结构化数据(Structured Data),结构化数据不是把文章段落分清楚、标题写清楚,实际上你文章段落分的再清晰,爬虫机器也不知道你在表达什么,所以数据结构化是给爬虫看而不是给人看的。HTML 标签的数量很有限,有限的几个标签没办法表达网页上每一个元素的含义,比如一个小的图标、一个广告位、一个蒙层等,于是网页上出现了很多 class 名、id 名来标记一个元素。这些内容的统一让爬虫理解的略微透彻了一些,比如:

.banner: 一张banner广告位
.sidebar: 侧边导航栏
.nav: 主导航
.icon: 页面小图标
.post: 一篇文章
.post-title: 文章标题

在一个需要表达的块上加上 itemscope 属性和一个 itemtype 属性,itemtype 是有固定值的,具体可以参阅 schema.org 的说明。然后在块内添加详细的说明,使用 itemprop 标注。整个操作十分简单,略微麻烦的是需要对照 schema 的官方网站填写规定的 itemprop 字段。然而搜索引擎聚合的网页太多,当这些五花八门的 class 出来之后,它又开始迷茫了,难以较好的聚合分类。所以出现一个叫做 Schema 的东西,它用来表示一个结构化数据结构,可以看下面一个 schema 示例:

<div itemscope itemtype="http://schema.org/Person">
  <span itemprop="name">李靖</span>
  <img src="http://barretlee.com/avatar.png" itemprop="image" />
  <span itemprop="jobTitle">攻城师</span>
  <div itemprop="address" itemscope itemtype="http://schema.org/PostalAddress">
    <span itemprop="streetAddress">文一西路969号</span>
    <span itemprop="addressLocality">浙江杭州</span>
    <span itemprop="postalCode">310000</span>
  </div>
  <span itemprop="telephone">(0571) 123-4567</span>
  <a href="mailto:[email protected]" itemprop="email">[email protected]</a>
  李靖的主页:  <a href="http://barretlee.com" itemprop="url">barretlee.com</a>
</div>

结构化数据,通常也可以称之为元数据,这些数据附着在网页文本信息内,厘清了页面上每个部件的功能、属性和意义。当机器进入网页的时候,能够像人一样,一眼瞄出要表达的内容。关于 schema ,以前翻译过一篇文章 SEO:让搜索引擎对你的网站更有亲和力

SEO和站长工具的之间秘密

除非搜索引擎能够猜到你要搜索的具体的 URL 地址,一般地,它都会从自己的数据索引库中扒拉数据。对于权重高、更新频率高、原创内容多的网站,搜索引擎会十分勤快的爬最新内容。那么,如何让搜索引擎知道网站上有多少网页便成了一件重要的事情。

我们经常会听到一个叫做”网站地图”的东西。有些网站会在自己的站点中添加一个页面,这个页面包括了整站的重要入口,那么这个页面就是该页面的网站地图。这些地图是给人看的,如果只想给爬虫引擎看,可以将所有的链接按照一定的格式放到 sitemap.xml 文件中,然后把这个文件放到网站的根目录下,如 http://www.barretlee.com/sitemap.xml

而最重要的还是 robots.txt 这个文件,它是所有引擎约定俗成的一个文件,比如我的网站中用到的 http://www.barretlee.com/robots.txt ,其内容为:

Sitemap: http://www.barretlee.com/sitemap.xml
User-agent: *
Allow: /

SEO上,站长工具主要分为两个方面,一个是对网页的抓取,一个是对网页的分析。它告诉搜索引擎,网站地址的位置、允许蜘蛛爬取的内容等,它是一个协议。最近,貌似还多了一个 humans.txt,也是一个比较有意思的文件,可以在这里了解它:http://www.humanstxt.org.cn/,它可以描述一些站点和团队的故事。

网页的抓取在百度站长工具中体现的比较多,而网页的分析,诸如数据标注、结构化数据等,百度做的还比较搓,目前还在内测阶段,需要发送邮件才能申请权限。看到百度站长工具页面上的几个数据标注示意图,揣测应该比 google 弱一百倍,所以我还是重点说说 google 的吧。

网页的抓取

这块上,两个站长工具都是强调让开发者把网站地图显式的暴露给搜索引擎,提供了各种分析网站地图准确性合理性的工具,搜索引擎如果发现你的网站上一个地址时有时无,就会觉得你不可信有点飘渺。所以一旦网页因为改造或迁移导致页面链接丢失,可以在站长工具中填写这些死链。

不要贪婪的让搜索引擎不停的爬取你的网站,如果它多次过来发现内容是一样的,它也会很伤心的离开。而如果它发现每次过来爬你的内容都能找到很有意思的、从来没发现过的东西,它会对你越来越感兴趣,甚至日久天长它会给你定型、定位,然后权重会越来越高。在站长工具上都是可以设置的。

网页的分析

google 的数据化标记做的实在是太赞了!输入网址,它会打开你的网页,设置你要标记的类型,比如文章。选中页面上的元素然后标记。比如选中文章的标题,选中之后有一个菜单,在菜单上选择 title,选中作者名字,然后菜单上选择 author,一个页面标记完了之后,他会分析整站的所有页面,如果结构相似,也会自动标记其他页面。

整个标记完成之后,google 就知道你整个网站的信息架构了,下次要做的就是对这些信息内容做匹配和分类。所以我们可以看到,个人博客在 google 中的搜索是极其靠前的,因为页面的信息结构简单,即便你不去标记,它爬取多次之后也能自己理解。

对比百度和 google ,两者如同屌丝和高富帅。不过高富帅总是要越墙才能看到,所以我平时使用的依然是百度分析。百度分析和百度站长工具还是不一样的。百度对网页流量的分析和搜索词汇的分析还是挺精准,也很有参考价值。

小结

本文对 SEO 相关的东西做了一个简要的概述,同时也概括了搜索引擎做的一些工作,知识量有限,难以面面俱到,如有错误还请斧正。

转自我的个人博客:http://www.barretlee.com/entry

时间: 2024-10-28 09:01:25

网站的SEO以及它和站长工具的之间秘密的相关文章

网站的SEO以及它和站长工具的之间秘密(转)

博客迁移没有注意 URL 地址的变化,导致百度和 google 这两只爬虫引擎短时间内找不到路.近段时间研究了下国内最大搜索引擎百度和国际最大搜索引擎google的站长工具,说下感受. 百度的站长工具地址:http://zhanzhang.baidu.com/dashboard/index google 的站长工具地址: https://www.google.com/webmasters/tools/home 最近墙的比较厉害,google 不一定能访问进去(我平时用的 GreenVPN,还挺不

百度站长工具进击site结果页面[SITE特型]

最近在度娘上site站点是不是发现多了一个应用展示框?没错!这就是度娘新推出的site特型,仔细看一下是百度站长平台的相关功能,作为目前国内市场占有率比较高的搜索引擎,百度站长工具进击site结果页面为站长提供了快捷入口.我们一起来看看百度site特型有哪些功能. 百度site特型提供网站收录诊断.安全级别.站长工具.站长资讯几大板块. 站长最关心的收录问题 收录是流量的基础.之前site查询出的结果是个大概数字,目前特型为站长展现了准确数字.同时优先展示了4个影响收录的主要因素,让站长更便捷地

SEO新手必看:站长工具里的那些功能你知道吗

对于刚接触SEO的SEO来说,站长工具是必不可少的,我们每天要用它来查询网站的情况,很多新站长只看网站的权重.收录.外链.排名,其实站长工具的功能远远不止这些.今天无意间想到了站长工具,没看到有多少人写过这样的文章,今天我就给大家效劳效劳吧.希望大家认真看,这是我一个字一个字打出来的,自己的经验之谈! 功能一:看网站的权重.收录.外链.排名. 这个我们都知道的,这些都是可以很直观的看到,不过在这边提醒大家的事,站长工具里的收录和反链情况不是准确的,我们需要在百度里site和domain,这样的结

你的网站做好神马搜索优化了吗?神马搜索站长工具提交

神马搜索借助uc的优势,可直接在地址输入框中输入关键词就可以搜索了,免去了输网址的麻烦(这个在国外有点long duan的嫌疑).如果你的网站被bd等se收录了以后一般也是会被神马搜索收录的,查询方法也是用site:***.com.那么我们做好神马搜索优化呢? 既然神马搜索支持site指令,根据genfeng是思路,那它是不是也有站长工具平台呢?答案是有的,只不过得到这个结果稍微有点迂回.起初在网上搜索了相关问题都没找到,后面想想神马搜索是在uc上的,那在uc官网应该有一些提示.在uc社区的神马

站长工具 &gt; 日常实用工具

百度相关 百度收录查询 指定时间内百度搜索,对指定网站的网页数量及具体情况 百度关键词挖掘 查询关键词PC指数.移动指数.收录量及排名 百度关键词地区排名 有些关键词在各地的排名是不一样的,就是通常说的关键字地区排名 百度关键词即时查询 百度相关搜索.百度推荐.其他人在搜的相关关键词! 百度关键词优化分析 帮助站长估算优化该关键词的难易程度及优化成本 SEO相关 SEO综合 了解该域名的相关信息,如域名年龄相关备案等等,及时调整网站优化. SEO优化建议 快速定位你页面哪些地方存在不利seo的因

网站做SEO优化没效果 网站优化目的到底是什么

1 对于站长朋友来说,一直以来都有对自己的网站做SEO优化,然而为什么要做网站SEO优化呢?真正说得清楚的没有几人.就因为我们不知道为什么要做网站SEO优化,所以就听取"行业前辈"的经典之语:内容为王.外链为皇:原创.高质量的内容:用户体验-- 哪里找富婆包养的徽油气父贴吧 哪里找富婆包养的徽油气父贴吧 哪里找富婆包养的吩认同捶贴吧 哪里找富婆包养的吩认同捶贴吧 哪里找富婆包养的赵经不起仄贴吧 哪里找富婆包养的赵经不起仄贴吧 哪里找富婆包养 哪里找富婆包养 哪里找富婆包养 哪里找富婆包

如何正确使用百度站长工具 让你的排名更前一点

做SEO的人都会用到很多工具,比喻爱站之类的,用工具主要就是更方便我们做优化,可以用工具分析更多的数据,但是很多人却忽略了百度自身的站长工具,因为有的人会认为,百度站长工具会不会是间谍?其实不然的,用百度站长工具有它的更准确的数据,更有利于我们做优化,下面让我们讲下如何正确使用百度站长工具. 首先,用百度站长工具得要添加网站,今天就用广州英语培训这个站为例,教大家如何添加网站.进入百度站长首页>>>我的网站>>>添加网站>>>输入网址按添加即可完成认证

若何综合一度上网站的seo优化状况

<p> <br>若何综合一度上网站的seo优化状况<br>怎样综合一度网站的SEO搜索引擎优化优化状况的呢?关于企业来说,怎样才可以晓得本人的网站优化的对比好,该怎样去评议本人的职工.单仁资讯昨天正在那儿那里引见一下怎么去综合一度站,万万没有能够是这样的高深,只说多余的那样若干好多点:<br>第一看:看网站规模与建站功夫<br>一般自己拿到一度站的时分先是扫描一下某个站的局限是年夜年夜是小,当然优化思绪都一样,实践操作兴起,年夜战正视的秘闻会愈加

站长工具|百度搜索框提示功能

百度向站长开放免费“百度搜索框”代码和“百度搜索框提示”代码.只需进行简单的设置, 即可将“ 百度搜索框( 带提示功能)”功能快速加入到您的网页中.提升用户在网站中的搜索体验. 根据不同类型的网站需求,站长工具一共提供三种引入方式供您选择: 简单方式——方便的将“百度搜索框(带提示功能)”直接加入到您的网页中.将以下代码加入到您的网页中,即可获得带有“搜索框提示”功能的百度搜索框 HTML代码: <form action=”http://www.baidu.com/baidu” target=”