有时候网站被黑或者改版而产生了很多乱七八糟的死链被百度收录了一大片,特别影响SEO
百度
有专门的死链提交入口,可以批量删除,但是我们不可能一个网址一个网址去填写提交
这时候我们需要一个可以批量检测并且导出死链,方便我们一次性提交给百度的方法。
这里推荐使用一款小工具Xenu1.3.8
当然这款工具只是第一个步骤。我们需要先用这款工具查询所有被收录的页面,导出一堆数据,然后再进行规则提取。
第一步:
下载Xenu1.3.8

第二步:
打开软件,填入简版百度site网站地址,之所以用简版是可以减少链接查询时间和内容。(请把www.idedecms.com换成你的网址)

http://www.baidu.com/s?ie=utf-8&tn=baidulocal&wd=site%3Awww.idedecms.com

点击最下面的【开始检查】,然后等待所有连接查询完毕

当然因为本站的死链早就提交删除了,所以这里清一色的结果都是OK,绿色的。如果有死链的话,会显示红色。
这个不管,你看你的结果就可以。接下来我们导出TXT的一堆数据

导出来随便命名,存在桌面或者什么地方。一会儿还要对它进行处理。因为里面的数据还包含了其他百度链接,
我们需要通过PHP程序正则提取一下。这里我保存为idedecms.txt到桌面了

接下来新建一个php文件,复制代码如下:

<?php
header("Cintent-type: text/html; charset=utf-8");
$file=$_GET["file"];
$head="http://www.idedecms.com";
$state="404";
preg_match_all("/".str_replace("/","/",$head)."(.*?)s".$state."/i",file_get_contents($file),$result);
foreach($result[1] as $row){
echo $head.$row." ";
}?>

你需要把http://www.idedecms.com改成你的网址之后保存为.php文件

这里命名为404url.php
然后把之前导出的idedecms.txt和404url.php这两个文件上传到网站根目录。
idedecms.txt就是我们刚刚用工具导出的一堆链接数据
404url.php就是用来处理这一堆数据,把你网址的404状态链接全部提取出来。
这两个文件上传之后。我们在浏览器地址栏输入
http://www.idedecms.com/404url.php?file=idedecms.txt
之后就会把你网站被收录的死链全部列举出来了。你只需要保存为txt文档。提交给百度即可。
或者你都不用保存。直接把http://www.idedecms.com/404url.php?file=idedecms.txt
这个链接提交给百度就可以了。
百度提交入口:http://zhanzhang.baidu.com/dashboard/index
需要用到的Xenu工具和404url.php我已经打包好了
下载地址:http://pan.baidu.com/s/1geIskD1
ok,教程到此结束。有什么不懂的,可以加群进行讨论。织梦站长交流群

发表回复

后才能评论