死链检测

工具:xenu

1、下载xenu中文版

下载地址:http://dx1.duoxa.com:888/down/xenu.rar

2、查询所有被收录的页面

打开软件,填入简版百度site网站地址,之所以用简版是可以减少链接查询时间和内容。(请把exam.tigtag.com换成你的网址)

http://www.baidu.com/s?ie=utf-8&tn=baidulocal&wd=site%3Aexam.tigtag.com

3、检测完成后,导出为制表符分隔的文件

4、导出的文件格式

导出的文件,格式是:网址 + 空格 + 状态码 + ......

5、提取网站死链

可以利用正则表达式提取,如:

# egrep ‘404[[:space:]]+‘ silian.txt |awk ‘{print $1}‘ > deadlink.txt

此处给出的提取方法只是一个参考,可以根据你自己的情况想方法提取。

时间: 2024-10-27 08:04:05

死链检测的相关文章

11款网站死链检测工具

网站中出现断链或死链,会导致部分资源无法访问,出现404报错,影响SEO.我们可以通过下面的11款链接检测工具(包括在线检测工具)帮助我们检查网站失效链接的情况. 1.Link Checkers 在线工具.可以抓取网站内容来检查网页死链,准确定位有问题的超链位置. 2.Google Webmaster 需要登录Google账户才能使用该工具,并需要将验证文件上传到要管理的站点进行验证. 3.Link tiger 在线工具,需登录账号.可以免费使用,不过也可以提供多种收费服务.检测报告可以以饼图等

网站检测空链、死链工具(Xenu)

网站常用检测空链.死链工具 网站的链接一般都成千上万,如果存在大量的空链接将大大的影响用户体验,怎样有效检测无效链接.下面是比较常用的几种简单工具. 一.Xenu(Xenu's Link Sleuth) 1.文件→检测网址,打开如下图,输入根网址,点击确定即可.如果想检测本地html文件可点击本地文件然后导入. 2.点击确定,开始自动检测,当右下角100%时则检测完毕,绿色为正常连接,红色为有问题的链接,我们可以点击查看→仅显示失效的链接. 3.检测完了之后会提示是否保存:我们可以根据检测出来的

服务器_网站结构_死链情况

1. 服务器 现有问题:服务器出现宕机,网站加载缓慢甚至出现无法访问,直接导致客户流量损失. 问题分析: 1.1.1分析服务器宕机问题原因,一方面是服务器问题,另一方面是网站程序问题. 1.1.2服务器问题大部分是硬件问题:服务器磁盘的存储量.网络带宽等问题: 少部分软件问题:服务器网站IIS配置.服务器安全攻击.服务器系统内存碎片整理等问题. 1.1.3网站程序问题属于软件问题,也是关键性问题,尤其是当程序运行时需要与服务器进行多次链接,并消耗大量服务器内存时,会导致服务器内存消耗资源过多,程

使用selenium的方式获取网页中图片的链接和网页的链接,来判断是否是死链(二)

上一篇使用Java正则表达式来判断和获取图片的链接以及跳转的网址,这篇使用selenium的自带的API(getAttribute)来获取网页中指定的内容 实现内容:获取下面所有图片的链接地址以及跳转地址,使用get请求判断是否有死链 页面内容如图: 页面的源码,需要获取页面的href后的地址,以及src后的地址,: 代码实现可以看出图片都在一个div中,实现的思想为:获取控件集合,在获取每一个li下的元素,在获取,在取出数据下的属性名的属性值 public void new_classific

什么是死链接,为什么要检查死链?

什么是网站死链?为什么要检查死链?首先我们先介绍什么是网站死链?网站死链被分为二种类型,协议死链与内容死链,协议死链是指TCP协议,HTTP协议状态出现了问题,例如:常见的403,404状态:内容死链是指网站内容发生的变更已经打不开,无法访问到网页信息内容. 网站死链为什么要检查? 一.蜘蛛角度:网站死链会对蜘蛛的抓取造成一定的干扰,影响网页的正常收录: 二.用户角度:网站死链如果太多,就会影响用户点击,用户就会关闭你的网页,破快了用户体验: 结论:网站死链检查非常重要,如果一个网站有太多的死链

死链对网站的影响

在了解死链接对网站有什么影响前,我们先来看看什么是死链接?死链接就是指的失效的链接.错误的链接,原本它是正常的,但是由于一些变动就变成无效的链接,使得网页打开这个链接地址,服务器回应打不开或404错误页面. 程序员人生温馨提示:什么情况下会出现死链接? 1.如果你的网站是静态网站,当你的网站对框架,html代码进行更改之后,可以会是某个地址对应的文件发生转移,这样它的链接就会变成死链接. 2.如果你的网站是动态的网站的话,那么你的链接都其实是动态的链接,当你的动态链接在数据库方面已经不支持的话,

Apache下通过shell脚本提交网站404死链

网站运营人员对于死链这个概念一定不陌生,网站的一些数据删除或页面改版等都容易制造死链,影响用户体验不说,过多的死链还会影响到网站的整体权重或排名. 百度站长平台提供的死链提交工具,可将网站存在的死链(协议死链.404页面)进行提交,可快速删除死链,帮助网站SEO优化.在提交死链的文件中逐个手动填写死链的话太麻烦,工作中我们提倡复杂自动化,所以本文我们一起交流分享Apache服务中通过shell脚本整理网站死链,便于我们提交. 1.配置Apache记录搜索引擎 Apache是目前网站建设最为主流的

ECSHOP站内页面跳转,避免死链

2.x版本域名重定向: # For ISAPI_Rewrite 2.x RewriteCond Host: ^steveluo\.name$ RewriteRule (.*) http\://www\.steveluo\.name$1 [I,RP] 3.x版本域名重定向: # For ISAPI_Rewrite 3.x RewriteCond %{HTTP:Host} ^steveluo\.name$ RewriteRule (.*) http\://www\.steveluo\.name$1

Xenu-web开发死链接检测工具应用

Xenu 是一款深受业界好评,并被广泛使用的死链接检测工具. 时常检测网站并排除死链接,对网站的SEO 非常重要,因为大量死链接存在会降低用户和搜索引擎对网站的信任,web程序开发人员还可通过其找到死链接和访问相应时间长的Url地址进行改进优化. 我们推荐的死链接检测工具 Xenu 主要具有以下特征: 需要下载安装,不到1M大小,用户界面非常简洁,操作简单. 检测彻底:能够检测到图片.框架.插件.背景.样式表.脚本和 java 程序中的链接. 报告形式合理多样,死链接一目了然. 提供出现死链接的