HTTP状态码是什么意思?
当服务器收到某项请求时,例如,用户通过浏览器访问你的网页,服务器会向这个浏览器返回一个代码以响应请求。
一个代码就称为:HTTP状态码。
同样道理,当搜索引擎的Robot(机器人)或Crawler(爬行器)抓取你的网页时,服务器也会返回HTTP状态码相应请求。
此HTTP状态码提供关于请求状态的信息,告诉访问的浏览器、搜索引擎机器人:baiduspider、Googlebot等关于你的网站和请求的网页的信息。
日志中的HTTP状态码都代表什么?
做SEO时,我们经常会在日志上看到类似这样的代码:
61.135.166.232--[31/Dec/2007:02:30:11+0800]"GET/category21.htmlHTTP/1.1"20010968"-""Baiduspider+(+http://www.baidu.com/search/spider.htm)"
66.249.70.172--[31/Dec/2007:03:36:10+0800]"GET/32_10_zh.htmlHTTP/1.1"20018395"-""Mozilla/5.0(compatible;Googlebot/2.1;+http://www.google.com/bot.html)"
这里面需要知道的,就是那个奇怪的数字“200”(另外那个数字表示抓取的文件大小)。
“200”就是HTTP状态码。
SEO过程中最常见的HTTP状态码有:
200-服务器成功返回网页
404-请求的网页不存在
503-服务器超时
其他经常碰到的HTTP状态码列表如下:
HTTP状态码摘要说明
成功2××成功处理了请求的状态码。
200 服务器已成功处理了请求并提供了请求的网页。
204 服务器成功处理了请求,但没有返回任何内容。
重定向3××每次请求中使用重定向不要超过5次。
301 请求的网页已永久移动到新位置。当URLs发生变化时,使用301代码。搜索引擎索引中保存新的URL。
302 请求的网页临时移动到新位置。搜索引擎索引中保存原来的URL。
304 如果网页自请求者上次请求后没有更新,则用304代码告诉搜索引擎机器人,可节省带宽和开销。
客户端错误4××表示请求可能出错,妨碍了服务器的处理。
400 服务器不理解请求的语法。
403 服务器拒绝请求。
404 服务器找不到请求的网页。服务器上不存在的网页经常会返回此代码。
410 请求的资源永久删除后,服务器返回此响应。该代码与404(未找到)代码相似,但在资源以前存在而现在不存在的情况下,有时用来替代404代码。如果资源已永久删除,应当使用301指定资源的新位置。
服务器错误5××表示服务器在处理请求时发生内部错误。这些错误可能是服务器本身的错误,而不是请求出错。
500 服务器遇到错误,无法完成请求。
503 服务器目前无法使用(由于超载或停机维护)。通常,这只是暂时状态。