星期三, 四月 07, 2010

检查网站失效链接

失效链接是指那些指向并不存在页面的链接。当点击失效链接时,你到达的页面被称为 404 错误页面,它是当url请求不存在时,服 务器返回的一个 HTTP 标准响应。
当你突然碰到 404 错误,你会怎么做呢?绝大多数人最直接的反应就是离开,去另外一个站点,因为无论用户还是搜索引擎都会把失效链接看作一种不专业的表现。
404 和失效链接对于你的搜素引擎排名也有负面影响,因此主动避免失效链接可以有效提高网站曝光率,增加网站流量。
注意:有些术语和方法针对 WordPress 博主,不过与所有站长都有关系。博主更新博客内容比其他站长更频繁,对于他们而言,网站上出现失效接链接几率更高。



WordPress 博客可以使用下面两种插件处理这类失效链接。
1、检测失效链接的插件,如 Broken Links Checker
2、自动管理 301 跳转的插件,如 Redirection

作为一个插件简约主义者,我总是坚持手动操作,避免使用和安装插件。而可以确定的是,应对这类问题时插件效率 更高,因此值得安装。不管用不用插件,我还强烈推荐你时常手动检查失效链接和 404 错误。



使用 Google 网站管理员工具检测并移除无效链接

为什么即便页面不存在,Google会索引呢?原因有下面两个。
1、输入出错,致使你错误的引用了一个无效的内部链接。这里推荐一个简单的插件 Link to Post 来避免这类错误。
2、在 Google 索引了你发布文章原先的链接后,把文章的永久链接给修改了。

检测此类错误的最佳方式就是使用 Google 网站管理员工具(GWT)。这是站长的必备工具。还没有接触过的站长们请尽快注册体验。

GWT 的网址删除工具,可以从 Google 搜索结果中移除无效页面。下面是具体步骤说明。

检测被Google索引的无效页面


首先注册 GWT 并添加您的网站。这里有使用入门介绍

1,在左侧菜单点击故障诊断 - "抓取错误"。
2,选择"找不到"门类。
3,如果有,点击查看哪些页面包含失效链接。
4,确定这些网址的确已被 Google 索引,可以把网址复制到 Google 搜索,看是不是有结果。

Detecting invalid pages that are indexed by Google

从Google的搜索结果中移除这些网址链接

1,点击网站配置 - 抓取工具权限
2,选择删除网址
3,点击新添删除请求
Removing URLs from Google's search results
选择第一项,将页面从 Google 搜索结果中完全移除。

或者

如果你想在搜索结果中保留这个页面,你可以选择第四项,这会删除该页面在 Google 服务器上的任何缓存版本。这招可以防止 Google 以"网页快照"的形式显示过期的页面版本。

5,点击下一步

Removing URLs from Google's search results

6,输入你想让 Google 删除的网址。
7,选择第一项,然后点击添加
8,要删除的网址应该会出现在列表中。可以添加其他要删除的网址。
9,点击提交删除请求
Removing URLs from Google's search results

你的请求现在就等待处理了――多数情况下,Google 需要2到3天删除链接。

10,点击网站配置 - 抓取工具权限
11,选择移除网址
12,确认你要请求删除的网址没有出现在待处理请求的列表上。
13,现在在列表中可以看到这个网址了。

要确认网址的确已经从 Google 上删除,可以把该网址复制到搜索框中,查看是否有结果。

Removing URLs from Google's search results
使用Xenu Link Sleuth来检测失效链接

另一款检测网站失效链接的优秀工具是Xenu Link Sleuth,这里下载

Xenu 是一个 Windows 程序,可以输出网站的所有链接――有效或失效――将其按照便于阅读的方式分组。



安装后的指南:

1,点击文件(File) - 检查网址(Check Url)
2,输入你网站的网址(比如:http://www.sixrevisions.com/)。
3,等待程序检查所有链接。
4、当Xenu问你是否需要一份报告时,点击是(Yes)



你可以输入FTP详细信息,不过可以点击取消,然后在本地生成一个XHTML报告(它会自动打开一个对话框)。

在报告中,点击失效链接(Broken links)。在目录中按照链接排序,查看哪些页面包含失效链接。

最后,访问上述页面,删除或者修正这些链接。

没有评论: