HTTP/1.0：扩展协议

Souloss

公告

欢迎来到我的博客！这是一条示例公告

Learn More

标签

Souloss

公告

欢迎来到我的博客！这是一条示例公告

Learn More

标签

Souloss

公告

欢迎来到我的博客！这是一条示例公告

Learn More

标签

3905 字

11 分钟

HTTP/1.0：扩展协议

2023-01-29

web

HTTP

/

网络

/

协议

/

Web

在上一篇实验中，我们亲手实现了一个 HTTP/0.9 服务器，体验了它「极简到极致」的设计哲学：客户端发一行 GET /path，服务器返回原始文档内容，然后关闭连接。这种设计在 1991 年的 Web 诞生之初是合理的——毕竟当时 Tim Berners-Lee 只是想在 CERN 内部共享文档。

然而，随着 Web 的迅速普及，HTTP/0.9 的局限性开始暴露无遗。想象一下：你是一个早期的浏览器开发者，用户访问了一个图片网站。服务器返回了一串二进制字节，但浏览器完全不知道这是什么类型的文件——是 JPEG？PNG？还是 GIF？浏览器只能靠「猜」，或者让用户自己选择。这显然不是一个好的用户体验。

更棘手的问题是错误处理。当请求的资源不存在时，HTTP/0.9 的服务器只能返回一个自定义的 HTML 页面（比如写着「404 Not Found」），但客户端无法从协议层面区分「这是正常的 HTML 页面」还是「这是一个错误页面」。机器无法自动判断，只能靠人眼阅读。

1996 年，HTTP/1.0 作为 RFC 1945 正式发布，它对 HTTP/0.9 进行了全面升级，解决了以下核心问题：

元信息的缺失：HTTP/1.0 引入了请求头和响应头，客户端可以告诉服务器自己能接受什么类型的内容，服务器也可以告诉客户端返回内容的 MIME 类型、长度、编码方式等。这就像在寄快递时，不仅寄出物品本身，还附上一份清单说明「这是照片，A4 大小，共 10 页」。

状态表达的缺失：HTTP/1.0 引入了状态码体系，服务器用三位数字明确告诉客户端请求的处理结果——成功了？重定向了？还是出错了？这让客户端程序能够自动化地处理各种情况。

方法的单一：HTTP/1.0 定义了 GET、POST、HEAD 三种方法，不再局限于「获取文档」，还支持「提交数据」「只获取头信息」等操作。这为 Web 应用的发展奠定了基础。

一、新增特性详解#

1.1 请求行与请求头#

HTTP/1.0 的请求格式发生了重大变化。首先是请求行：现在包含了 HTTP 版本号。

1
GET /index.html HTTP/1.0\r\n

紧接着请求行之后，可以附加多行请求头，每个头占一行，格式为 Header-Name: Header-Value。请求头与请求行之间、请求头与请求体之间都用空行分隔。

1
GET /index.html HTTP/1.0\r\n
2
Host: localhost:8080\r\n
3
User-Agent: MyBrowser/1.0\r\n
4
Accept: text/html\r\n
5
\r\n

注意最后的 \r\n —— 这是空行，表示请求头结束。如果请求有 body（比如 POST 请求），body 就跟在空行后面。

这种设计让协议具备了「协商能力」。客户端通过 Accept 头告诉服务器「我能接受 HTML 格式」，服务器通过检查这个头来决定返回什么内容。如果客户端发送 Accept: application/json，服务器就知道应该返回 JSON 而不是 HTML。

1.2 响应头与状态行#

HTTP/1.0 的响应也变得结构化了。首先是状态行：

1
HTTP/1.0 200 OK\r\n

状态行由三部分组成：HTTP 版本号、状态码（三位数字）、状态描述（人类可读的短语）。状态码是机器处理的关键，状态描述则是给人看的。

状态行之后是响应头，格式与请求头相同：

1
HTTP/1.0 200 OK\r\n
2
Content-Type: text/html\r\n
3
Content-Length: 1234\r\n
4
Server: MyServer/1.0\r\n
5
\r\n
6
<html>...

响应头结束后是一个空行，然后才是响应体。

这里最关键的两个头是 Content-Type 和 Content-Length。Content-Type 告诉客户端返回内容的 MIME 类型，浏览器据此决定是渲染 HTML、显示图片、还是下载文件。Content-Length 则告诉客户端响应体有多少字节，客户端可以据此判断是否接收完整，而不再依赖 TCP 连接关闭来判断结束。

1.3 状态码体系#

HTTP/1.0 定义了状态码的分类规则，第一位数字表示类别：

| 类别 | 范围 | 含义 | 常见例子 | | 1xx | 100-199 | 信息性响应 | 100 Continue（HTTP/1.1 才有） | | 2xx | 200-299 | 成功 | 200 OK, 201 Created, 204 No Content | | 3xx | 300-399 | 重定向 | 301 Moved Permanently, 302 Found | | 4xx | 400-499 | 客户端错误 | 400 Bad Request, 404 Not Found, 403 Forbidden | | 5xx | 500-599 | 服务器错误 | 500 Internal Server Error, 503 Service Unavailable |

这套状态码体系是 HTTP 协议最具前瞻性的设计之一。浏览器看到 301 就知道要自动跳转，看到 404 就显示「页面未找到」，看到 500 就提示「服务器错误」。程序可以自动处理，无需人工干预。

1.4 三种请求方法#

HTTP/1.0 定义了三种请求方法：

GET：获取资源。这是最常用的方法，请求体通常为空。GET 请求应该是「幂等」的，即多次请求同一资源应该得到相同结果，且不会改变服务器状态。

POST：提交数据。客户端可以在请求体中发送数据给服务器处理。比如提交表单、上传文件。POST 请求可能会改变服务器状态（比如创建新记录）。

HEAD：只获取响应头。与 GET 类似，但服务器只返回状态行和响应头，不返回响应体。这在检查资源是否存在、获取文件大小、验证缓存是否有效等场景非常有用。

二、实验一：用 Python 实现 HTTP/1.0 服务器#

现在我们来实现一个支持 HTTP/1.0 的服务器。相比上一篇的 HTTP/0.9 服务器，这个版本需要解析请求头、生成响应头、正确处理状态码。

源码（保存为 http10_server.py）：

1
#!/usr/bin/env python3
2
# http10_server.py -- HTTP/1.0 server for learning
3
import socket
4
import threading
5
import os
6
from datetime import datetime
7

8
HOST = '0.0.0.0'
9
PORT = 8080
10
WWW = 'www'
11

12
def parse_request(data):
13
    """解析 HTTP/1.0 请求，返回 (method, path, headers, body)"""
14
    try:
15
        # 分离请求头和请求体
16
        if b'\r\n\r\n' in data:
17
            header_part, body = data.split(b'\r\n\r\n', 1)
18
        else:
19
            header_part = data
20
            body = b''
21

22
        lines = header_part.decode('iso-8859-1').split('\r\n')
23
        if not lines:
24
            return None, None, {}, b''
25

26
        # 解析请求行：GET /path HTTP/1.0
27
        request_line = lines[0]
28
        parts = request_line.split()
29
        if len(parts) < 2:
30
            return None, None, {}, b''
31

32
        method = parts[0].upper()
33
        path = parts[1]
34
        # HTTP 版本号（可能是 HTTP/1.0 或 HTTP/0.9 无版本）
35
        version = parts[2] if len(parts) > 2 else 'HTTP/0.9'
36

37
        # 解析请求头
38
        headers = {}
39
        for line in lines[1:]:
40
            if ': ' in line:
41
                key, value = line.split(': ', 1)
42
                headers[key.lower()] = value
43

44
        return method, path, headers, body
45
    except Exception as e:
46
        print(f"Error parsing request: {e}")
47
        return None, None, {}, b''
48

49
def build_response(status_code, status_text, headers, body):
50
    """构建 HTTP/1.0 响应"""
51
    response = f"HTTP/1.0 {status_code} {status_text}\r\n"
52
    for key, value in headers.items():
53
        response += f"{key}: {value}\r\n"
54
    response += "\r\n"
55
    return response.encode('iso-8859-1') + body
56

57
def get_mime_type(path):
58
    """根据文件扩展名返回 MIME 类型"""
59
    ext = os.path.splitext(path)[1].lower()
60
    mime_types = {
61
        '.html': 'text/html',
62
        '.htm': 'text/html',
63
        '.css': 'text/css',
64
        '.js': 'application/javascript',
65
        '.json': 'application/json',
66
        '.png': 'image/png',
67
        '.jpg': 'image/jpeg',
68
        '.jpeg': 'image/jpeg',
69
        '.gif': 'image/gif',
70
        '.ico': 'image/x-icon',
71
        '.txt': 'text/plain',
72
    }
73
    return mime_types.get(ext, 'application/octet-stream')
74

75
def handle_conn(conn, addr):
76
    try:
77
        # 读取请求数据（简单实现：读取直到遇到空行）
78
        data = b''
79
        while b'\r\n\r\n' not in data:
80
            chunk = conn.recv(1024)
81
            if not chunk:
82
                break
83
            data += chunk
84

85
        if not data:
86
            return
87

88
        method, path, headers, body = parse_request(data)
89

90
        if method is None:
91
            response = build_response(400, "Bad Request",
92
                {"Content-Type": "text/html", "Content-Length": "11"},
93
                b"Bad Request")
94
            conn.sendall(response)
95
            return
96

97
        print(f"[{addr}] {method} {path} HTTP/1.0")
98

99
        # 处理路径
100
        if path == '/':
101
            path = '/index.html'
102

103
        # 安全处理：防止路径遍历攻击
104
        safe_path = os.path.normpath(path).lstrip(os.sep)
105
        full_path = os.path.join(WWW, safe_path)
106

107
        # 处理 HEAD 请求
108
        if method == 'HEAD':
109
            if os.path.isfile(full_path):
110
                mime = get_mime_type(full_path)
111
                size = os.path.getsize(full_path)
112
                response = build_response(200, "OK",
113
                    {"Content-Type": mime, "Content-Length": str(size)},
114
                    b'')
115
            else:
116
                response = build_response(404, "Not Found",
117
                    {"Content-Type": "text/html", "Content-Length": "9"},
118
                    b'')
119
            conn.sendall(response)
120
            return
121

122
        # 处理 GET 请求
123
        if method == 'GET':
124
            if os.path.isfile(full_path):
125
                with open(full_path, 'rb') as f:
126
                    content = f.read()
127
                mime = get_mime_type(full_path)
128
                response = build_response(200, "OK",
129
                    {"Content-Type": mime, "Content-Length": str(len(content))},
130
                    content)
131
            else:
132
                body = b'<html><body><h1>404 Not Found</h1><p>The requested resource was not found.</p></body></html>'
133
                response = build_response(404, "Not Found",
134
                    {"Content-Type": "text/html", "Content-Length": str(len(body))},
135
                    body)
136
            conn.sendall(response)
137
            return
138

139
        # 处理 POST 请求（简单示例）
140
        if method == 'POST':
141
            # 这里只是演示，返回收到的数据
142
            response_body = f"<html><body><h1>POST Received</h1><p>Path: {path}</p><p>Body length: {len(body)}</p></body></html>".encode()
143
            response = build_response(200, "OK",
144
                {"Content-Type": "text/html", "Content-Length": str(len(response_body))},
145
                response_body)
146
            conn.sendall(response)
147
            return
148

149
        # 不支持的方法
150
        body = b'<html><body><h1>501 Not Implemented</h1></body></html>'
151
        response = build_response(501, "Not Implemented",
152
            {"Content-Type": "text/html", "Content-Length": str(len(body))},
153
            body)
154
        conn.sendall(response)
155

156
    except Exception as e:
157
        print(f"Error handling connection: {e}")
158
    finally:
159
        conn.close()
160

161
def main():
162
    os.makedirs(WWW, exist_ok=True)
163

164
    # 创建测试文件
165
    idx = os.path.join(WWW, 'index.html')
166
    if not os.path.exists(idx):
167
        with open(idx, 'w') as f:
168
            f.write('<!DOCTYPE html>\n<html>\n<head><title>HTTP/1.0 Demo</title></head>\n'
169
                    '<body>\n<h1>HTTP/1.0 Demo Server</h1>\n'
170
                    '<p>This is a simple HTTP/1.0 server for learning.</p>\n'
171
                    '<ul>\n<li><a href="/page1.html">Page 1</a></li>\n'
172
                    '<li><a href="/data.json">JSON Data</a></li>\n</ul>\n</body>\n</html>')
173

174
    page1 = os.path.join(WWW, 'page1.html')
175
    if not os.path.exists(page1):
176
        with open(page1, 'w') as f:
177
            f.write('<!DOCTYPE html>\n<html>\n<head><title>Page 1</title></head>\n'
178
                    '<body>\n<h1>Page 1</h1>\n<p><a href="/">Back to index</a></p>\n</body>\n</html>')
179

180
    json_file = os.path.join(WWW, 'data.json')
181
    if not os.path.exists(json_file):
182
        with open(json_file, 'w') as f:
183
            f.write('{"name": "HTTP/1.0 Demo", "version": "1.0", "items": ["a", "b", "c"]}')
184

185
    s = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
186
    s.setsockopt(socket.SOL_SOCKET, socket.SO_REUSEADDR, 1)
187
    s.bind((HOST, PORT))
188
    s.listen(5)
189
    print(f"HTTP/1.0 server listening on {HOST}:{PORT}")
190
    print(f"Serving files from: {os.path.abspath(WWW)}")
191

192
    try:
193
        while True:
194
            conn, addr = s.accept()
195
            threading.Thread(target=handle_conn, args=(conn, addr), daemon=True).start()
196
    except KeyboardInterrupt:
197
        print("\nShutting down.")
198
    finally:
199
        s.close()
200

201
if __name__ == '__main__':
202
    main()

代码要点说明：

parse_request 函数负责解析 HTTP 请求。它首先根据 \r\n\r\n 分离请求头和请求体，然后逐行解析请求行和各个头字段。注意使用 iso-8859-1 编码，这是 HTTP 协议的默认编码，可以安全处理任意字节。

build_response 函数负责构建标准格式的 HTTP 响应。它将状态行、响应头和响应体组合成符合 HTTP/1.0 规范的字节序列。特别注意最后的空行 \r\n 必不可少，它分隔响应头和响应体。

get_mime_type 函数是一个简单的 MIME 类型映射表。实际生产环境中应该使用 mimetypes 标准库模块，但这里手动实现有助于理解原理。

handle_conn 函数是请求处理的核心。它解析请求后根据方法类型分发处理：HEAD 请求只返回头部，GET 请求返回完整内容，POST 请求演示了如何接收请求体。每个响应都包含 Content-Type 和 Content-Length，这正是 HTTP/1.0 相比 0.9 的关键进步。

三、实验二：用 nc 观察请求/响应的完整格式#

启动服务器后，用 nc（netcat）来手动发送 HTTP/1.0 请求，观察完整的协议格式。

实验 2.1：GET 请求获取 HTML 页面

1
printf 'GET /index.html HTTP/1.0\r\nHost: localhost:8080\r\n\r\n' | nc localhost 8080

你会看到类似这样的输出：

1
HTTP/1.0 200 OK
2
Content-Type: text/html
3
Content-Length: 212
4

5
<!DOCTYPE html>
6
<html>
7
<head><title>HTTP/1.0 Demo</title></head>
8
<body>
9
<h1>HTTP/1.0 Demo Server</h1>
10
<p>This is a simple HTTP/1.0 server for learning.</p>
11
<ul>
12
<li><a href="/page1.html">Page 1</a></li>
13
<li><a href="/data.json">JSON Data</a></li>
14
</ul>
15
</body>
16
</html>

注意观察：响应的第一行是状态行 HTTP/1.0 200 OK，接着是两个响应头 Content-Type 和 Content-Length，然后是一个空行，最后是 HTML 内容。

实验 2.2：GET 请求获取 JSON 文件

1
printf 'GET /data.json HTTP/1.0\r\nHost: localhost:8080\r\nAccept: application/json\r\n\r\n' | nc localhost 8080

输出：

1
HTTP/1.0 200 OK
2
Content-Type: application/json
3
Content-Length: 63
4

5
{"name": "HTTP/1.0 Demo", "version": "1.0", "items": ["a", "b", "c"]}

这里的 Content-Type 是 application/json，浏览器看到这个头就会按照 JSON 格式处理内容。

实验 2.3：HEAD 请求（只获取响应头）

1
printf 'HEAD /index.html HTTP/1.0\r\nHost: localhost:8080\r\n\r\n' | nc localhost 8080

输出：

1
HTTP/1.0 200 OK
2
Content-Type: text/html
3
Content-Length: 212

HEAD 请求的响应只有状态行和响应头，没有响应体。这在检查文件是否存在、获取文件大小、验证缓存是否有效时非常有用。

实验 2.4：POST 请求（发送数据）

1
printf 'POST /submit HTTP/1.0\r\nHost: localhost:8080\r\nContent-Type: application/x-www-form-urlencoded\r\nContent-Length: 19\r\n\r\nname=test&value=123' | nc localhost 8080

输出：

1
HTTP/1.0 200 OK
2
Content-Type: text/html
3
Content-Length: 86
4

5
<html><body><h1>POST Received</h1><p>Path: /submit</p><p>Body length: 19</p></body></html>

POST 请求需要在请求头中指定 Content-Type 和 Content-Length，请求体跟在空行后面。我们的演示服务器会返回收到的数据信息。

实验 2.5：404 错误

1
printf 'GET /nonexistent.html HTTP/1.0\r\nHost: localhost:8080\r\n\r\n' | nc localhost 8080

输出：

1
HTTP/1.0 404 Not Found
2
Content-Type: text/html
3
Content-Length: 89
4

5
<html><body><h1>404 Not Found</h1><p>The requested resource was not found.</p></body></html>

状态码 404 明确告诉客户端资源不存在，客户端程序可以根据这个状态码自动处理错误情况，而不用依赖解析 HTML 内容来判断。

实验 2.6：用 curl 验证

现代的 curl 默认使用 HTTP/1.1，但可以通过参数指定 HTTP/1.0：

1
# GET 请求
2
curl --http1.0 http://localhost:8080/index.html
3

4
# HEAD 请求
5
curl --http1.0 -I http://localhost:8080/index.html
6

7
# POST 请求
8
curl --http1.0 -X POST -d "name=test" http://localhost:8080/submit

curl -I（或 curl --head）会发送 HEAD 请求并只显示响应头。

实验 2.7：用 tcpdump 观察网络包

在另一个终端运行 tcpdump，观察完整的 HTTP 请求和响应：

1
sudo tcpdump -A -s 0 'tcp port 8080'

然后在第一个终端发送请求。你会清晰地看到请求和响应的完整格式：请求行/状态行、请求头/响应头、空行、请求体/响应体。这对于理解 HTTP 协议的工作原理非常有帮助。

四、局限性：每次请求重新建立 TCP 连接#

HTTP/1.0 虽然相比 0.9 有了巨大进步，但它仍然有一个严重的性能问题：每个请求都需要建立新的 TCP 连接。

在 HTTP/1.0 中，默认的行为是 Connection: close。这意味着：

客户端建立 TCP 连接（三次握手）
发送 HTTP 请求
接收 HTTP 响应
服务器关闭连接
如果需要请求另一个资源，重复步骤 1-4

想象一下，一个网页有 10 张图片、3 个 CSS 文件、2 个 JavaScript 文件。加载这个页面需要建立 16 次 TCP 连接！每次 TCP 连接都需要三次握手，这增加了显著的延迟。

你可以用 time 命令来观察这个行为：

1
# 连续请求两个资源
2
time (printf 'GET /index.html HTTP/1.0\r\n\r\n' | nc localhost 8080 > /dev/null && \
3
      printf 'GET /data.json HTTP/1.0\r\n\r\n' | nc localhost 8080 > /dev/null)

你会发现每次请求都是独立的 TCP 连接。

HTTP/1.0 有一个非标准的扩展 Connection: keep-alive，允许复用 TCP 连接。但这是可选的，不同实现之间可能不兼容。这个问题直到 HTTP/1.1 才真正解决——HTTP/1.1 默认使用持久连接（persistent connection），一个 TCP 连接可以发送多个请求。

五、观察总结#

通过这次实验，你应该能够：

理解 HTTP/1.0 的协议格式：请求由请求行、请求头、空行、请求体组成；响应由状态行、响应头、空行、响应体组成。每一部分都有其特定作用。

掌握状态码的意义：状态码让客户端程序能够自动判断请求的处理结果。2xx 表示成功，3xx 表示重定向，4xx 表示客户端错误，5xx 表示服务器错误。

理解请求头和响应头的作用：Content-Type 告诉客户端内容的类型，Content-Length 告诉客户端内容的长度，Host 指定目标主机……这些头字段让 HTTP 成为一种真正可扩展的协议。

能用 Python 实现一个支持 HTTP/1.0 的服务器：解析请求、生成响应、处理不同方法、返回正确的状态码和头信息。

能用 nc 手动发送 HTTP 请求并观察响应格式：通过手工构造请求来深入理解协议的每一个细节。

认识到 HTTP/1.0 的局限性：每个请求都需要新建 TCP 连接，这在现代网页（包含大量资源）的场景下效率低下。这也解释了为什么后来 HTTP/1.1 要引入持久连接。

HTTP/1.0 虽然有局限，但它奠定了现代 Web 的基础。请求头/响应头、状态码、多种方法——这些设计至今仍在使用。理解 HTTP/1.0，是理解后续 HTTP/1.1、HTTP/2、HTTP/3 的。

六、HTTP/1.0 特性速查表#

6.1 从 HTTP/0.9 到 HTTP/1.0 的演进#

6.2 HTTP/1.0 新增的核心请求头#

6.3 HTTP/1.0 新增的核心响应头#

6.4 HTTP/1.0 状态码速查#

6.5 HTTP/1.0 vs HTTP/1.1 关键差异预览#

参考#

RFC 1945 — Hypertext Transfer Protocol — HTTP/1.0

支持与分享

如果这篇文章对你有帮助，欢迎支持作者或分享给更多人

赞助

HTTP/1.0：扩展协议

https://blog.souloss.com/posts/web/http-1-0/

作者

Souloss

发布于

2023-01-29

许可协议

CC BY-NC-SA 4.0

部分信息可能已经过时

Go map 底层实现：从 hmap 到桶的完整解析

PostgreSQL 查询优化器：如何选择最优执行计划