HTTP状态码速查
常见状态码含义与使用场景(中文速查)
信息响应
请求已收到,客户端应继续发送请求体。
很少用于 SEO。
服务器按请求切换协议。
对 SEO 无影响。
请求已收到,正在处理中(WebDAV)。
长任务场景;SEO 无影响。
成功
请求成功,返回正常内容。
爬虫最需要的标准响应。
资源已创建(常见于 POST)。
API 创建成功;非爬虫页面。
请求已接受,处理尚未完成。
异步任务;SEO 无影响。
响应由代理转换后返回。
少见;SEO 价值不大。
成功但无响应体。
常用于 API。
客户端应重置表单。
非 SEO 场景。
返回部分内容(Range)。
媒体/大文件;非 SEO。
WebDAV 多状态响应。
非 SEO。
WebDAV 避免重复报告。
非 SEO。
服务器应用了差分编码。
少见;非 SEO。
重定向
资源有多个选项。
可能让爬虫困惑;尽量避免。
资源永久重定向。
SEO 友好重定向。
临时重定向。
不建议长期使用;可考虑 301。
将请求引导为 GET 到新地址。
常用于表单提交后的跳转。
资源未修改,可使用缓存。
减少爬虫负载。
必须通过代理访问(已废弃)。
可忽略。
临时重定向,保留请求方法。
临时迁移;不做长期 SEO。
永久重定向,保留请求方法。
可作为 301 替代。
客户端错误
请求语法错误。
检查日志并修复。
需要认证。
可能误拦爬虫。
保留字段。
非 SEO。
服务器拒绝请求。
确保重要页面未被限制。
资源不存在。
可重定向或自定义页面。
请求方法不被允许。
检查 API 路由。
无法返回请求的格式。
少见;非 SEO。
需要代理认证。
非 SEO。
服务器等待超时。
可能影响爬虫抓取。
请求冲突(编辑冲突等)。
Web 应用常见;非 SEO。
资源已永久移除。
告知搜索引擎内容已下线。
缺少 Content-Length。
少见;非 SEO。
前置条件未满足。
API/WebDAV。
请求体过大。
非 SEO。
URL 过长。
避免超长 URL。
媒体类型不支持。
非 SEO。
Range 无效。
非 SEO。
无法满足 Expect。
少见。
玩笑状态码。
无 SEO。
请求被发送到错误的服务器。
CDN/代理配置问题。
语义错误(WebDAV)。
非 SEO。
资源被锁定(WebDAV)。
非 SEO。
依赖失败(WebDAV)。
非 SEO。
需要升级协议。
非 SEO。
必须提供前置条件。
少见。
请求过多,被限流。
可能阻挡爬虫。
请求头过大。
可能阻挡爬虫。
连接被直接关闭(nginx)。
排查 WAF/CDN 误拦。
法律原因不可用。
表示内容因法律原因下线。
客户端提前断开(nginx)。
排查 TTFB 与超时。
服务器错误
服务器内部错误。
需尽快修复,影响 SEO。
未实现功能。
少见。
上游响应无效。
检查主机/CDN。
服务不可用或超载。
计划停机可使用。
上游超时。
检查主机/CDN。
HTTP 版本不支持。
少见。
内容协商配置错误。
少见。
存储不足(WebDAV)。
非 SEO。
检测到循环(WebDAV)。
非 SEO。
需要扩展。
少见。
需要网络认证。
非 SEO。
网络连接超时(HAProxy/部分 CDN)。
提示上游不稳定,影响抓取可靠性。