404状态码是一种http状态码,其意思是: 所请求的页面不存在或已被删除。通俗的讲就是当用户输入了错误的链接时,返回的页面。主要是用来告诉用户这个页面是不存在了一种标识信息。
http状态码
http状态码是当用户试图通过HTTP或文件传输协议(FTP)访问一台正在运行Internet信息服务(IIS)的服务器上的内容时,IIS返回一个表示该请求的状态的数字代码。该状态代码记录在IIS日志中,同时也可能在Web浏览器或FTP客户端显示。状态代码可以指明具体请求是否已成功,还可以揭示请求失败的确切原因。
404错误页面返回“200”或“302”状态码:
从严格的技术角度,网站对404错误的处理策略,并不是一个SEO方面的工作,而属于网站可用性(usability)方面的问题。——当然,如果从广义的SEO范畴来看,提高网站可用性也属于SEO的基本操作。——但是,如果自定义404错误页面设置不当,则会极大地影响网站的SEO效果。
在许多朋友的印象中,自定义404错误页面只要能正确显示,只要能输入网站内某个并不存在的网页地址,在浏览器中能看到自定义的错误信息,便说明设置没问题。一个正确设置的404页面,不仅应当正确地显示,同时,应该能够正确返回“404”错误代码,而不是“200”或“302”。虽然对访问的用户而言,HTTP状态码究竟是“404”还是“200”来说并没有什么区别,但对搜索引擎而言,这则是相当重要的。
原因就让我们先来回顾一下搜索引擎收录与索引网页的过程:搜索引擎的爬虫向网站服务器发送请求,要求读取某个网页,网站服务器接到请求后返回HTTP状态码响应请求,这些返回的HTTP状态码决定着搜索引擎的下一步行动:将该网页收录到索引数据库或者将其从索引数据库删除等。
当然,HTTP状态码有很多种,分别对应不同的情况,下面就与本文内容相关的几种作一简单介绍,更详细的信息可参考W3C规范:
404:请求的网页不存在(不排除日后该链接有效的可能性);
410:请求的网页不存在(永久);
200:服务器成功返回网页;
302:网址临时重定向(跳转);
301:网址永久重定向。
需要说明的是,大部分搜索引擎将“404”与“410”状态同等对待,如Google。参见MattCutts的说明
当搜索引擎在请求某个url时得到“404”状态回应时,便会知道该网页在网站内不复存在,从而在索引数据库中将其删除,——当然,这个删除过程有可能需要很长时间——而当搜索引擎得到“200”状态回应时,则会认为该url是有效的,并将其回到到索引数据库中。