工具:xenu
1、下载xenu中文版
下载地址:http://dx1.duoxa.com:888/down/xenu.rar
2、查询所有被收录的页面
打开软件,填入简版百度site网站地址,之所以用简版是可以减少链接查询时间和内容。(请把exam.tigtag.com换成你的网址)
http://www.baidu.com/s?ie=utf-8&tn=baidulocal&wd=site%3Aexam.tigtag.com
3、检测完成后,导出为制表符分隔的文件
4、导出的文件格式
导出的文件,格式是:网址 + 空格 + 状态码 + ......
5、提取网站死链
可以利用正则表达式提取,如:
# egrep ‘404[[:space:]]+‘ silian.txt |awk ‘{print $1}‘ > deadlink.txt
此处给出的提取方法只是一个参考,可以根据你自己的情况想方法提取。
时间: 2024-10-27 08:04:05