写 Go Web 服务久了,很容易把入口简化成一句话:
http.ListenAndServe(":8080", nil)或者在 Gin、Kratos、Chi 这些框架里写一个 handler,就觉得请求自然会进来、自然会返回。
但线上很多问题都卡在这条“自然”的路径上:慢请求为什么把连接占住了?客户端断开后数据库查询为什么还在跑?服务重启时为什么有些请求直接断了?读超时、写超时、优雅关闭到底管哪一段?
所以这一篇不先聊框架,先把一个 HTTP 请求在 Go 服务里的生命周期捋清楚。
最小的服务长这样:
package mainimport ( "errors" "log" "net/http")func main() { mux := http.NewServeMux() mux.HandleFunc("/ping",func(w http.ResponseWriter, r *http.Request) { _, _ = w.Write([]byte("pong")) }) if err := http.ListenAndServe(":8080", mux); err != nil && !errors.Is(err, http.ErrServerClosed) { log.Fatal(err) }}ListenAndServe 做了两件事:
1. 监听 TCP 地址,比如 :80802. 调用 Server.Serve处理进入的连接
Go 官方对 Server.Serve[1] 的描述很直接:它会在 listener 上接收连接,并为每个连接创建服务 goroutine;这些 goroutine 读取请求,再调用 Server.Handler 生成响应。
画成一条线大概是这样:
客户端 │ │ TCP connect ▼ Listener.Accept │ │ 得到 net.Conn ▼ 每条连接一个服务 goroutine │ │ 读取请求行、Header、Body ▼ 调用 Handler.ServeHTTP │ │ 写 Header 和 Body ▼ 响应返回 / 连接复用 / 连接关闭这里有个容易说错的点:不要简单说“每个请求一个 goroutine”。
对 HTTP/1.1 keep-alive 来说,一个 TCP 连接可以连续处理多个请求。Go 文档保证的是 Serve 会给每条连接创建服务 goroutine,连接里的请求再由它读取并交给 handler。HTTP/2 内部还有 stream 的调度,不要拿 HTTP/1.1 的连接模型硬套过去。平时写业务 handler 时你可以把每次 ServeHTTP 当成一次请求的边界,但排查连接、超时、优雅关闭时,脑子里要有“连接”和“请求”两层。
http.Server 才是服务的配置中心
很多 demo 用 http.ListenAndServe,生产代码最好直接写 http.Server:
srv := &http.Server{ Addr: ":8080", Handler: mux, ReadHeaderTimeout: 5 * time.Second, ReadTimeout: 30 * time.Second, WriteTimeout: 30 * time.Second, IdleTimeout: 60 * time.Second, MaxHeaderBytes: 1 << 20,}if err := srv.ListenAndServe(); err != nil && !errors.Is(err, http.ErrServerClosed) { log.Fatal(err)}这些字段不是摆设。
ReadHeaderTimeout
ReadHeaderTimeout 限制“读完请求头”的时间。
它主要防慢连接攻击。比如客户端连上来以后,一个字节一个字节地发 header,迟迟不把请求头发完。如果没有限制,服务端就会一直占着这个连接等。
这个值我一般会先配上,比直接配一个很激进的 ReadTimeout 更稳。
ReadTimeout
ReadTimeout 限制读取整个请求的时间,包括 header 和 body。
如果你的服务会接收大文件上传,不能随便把这个值设得太短。因为它不理解业务,不知道哪个接口应该允许慢一点、哪个接口应该立刻拒掉。Go 官方文档也提醒过,多数场景会更偏向先用 ReadHeaderTimeout,再由 handler 自己决定 body 怎么读、读多久。
WriteTimeout
WriteTimeout 限制写响应的时间。
它从读完请求头之后开始算。handler 里计算太久、下游太慢、客户端读取响应太慢,都可能撞到这个边界。
但它不是业务超时的替代品。比如你调用第三方 API,还是要用 context.WithTimeout 控制那次调用,不要指望最后写响应时才发现超时。
IdleTimeout
IdleTimeout 限制 keep-alive 连接在两个请求之间能空闲多久。
请求处理完以后,连接不一定马上关闭。HTTP/1.1 默认可以复用连接。客户端可能过一会儿再发下一个请求。IdleTimeout 管的就是这段“等下一个请求”的时间。
这几个 timeout 可以这样理解:
建连 │ ├─ 读 Header ─────────────── ReadHeaderTimeout │ ├─ 读 Header + Body ──────── ReadTimeout │ ├─ Handler 执行 + 写响应 ─── WriteTimeout │ └─ 请求结束后等下一次请求 ── IdleTimeoutHandler 是真正的业务入口
Go 的 handler 接口就一个方法:
type Handler interface { ServeHTTP(http.ResponseWriter, *http.Request)}http.HandlerFunc 只是一个适配器,让普通函数满足这个接口:
func hello(w http.ResponseWriter, r *http.Request) { _, _ = w.Write([]byte("hello"))}mux.Handle("/hello", http.HandlerFunc(hello))框架做了很多路由、参数绑定、中间件、错误封装,但最底层还是回到这个接口。理解这一点以后,中间件也不神秘了:它就是接收一个 handler,返回一个新的 handler。
func logging(next http.Handler) http.Handler { return http.HandlerFunc(func(w http.ResponseWriter, r *http.Request) { start := time.Now() next.ServeHTTP(w, r) log.Printf("%s %s %s", r.Method, r.URL.Path, time.Since(start)) })}多个中间件就是一层层包起来:
handler := logging(auth(mux))srv := &http.Server{ Addr: ":8080", Handler: handler,}请求进来后的调用顺序:
logging │ ▼ auth │ ▼ mux │ ▼ 具体业务 handler所以中间件里有两个原则:
1. 能在调用 next.ServeHTTP前拒绝的,就直接返回2. 调了 next.ServeHTTP之后,不要再假装自己还能安全改响应
ResponseWriter 不是一个随便改的 buffer。底层可能已经把 header 或 body 写给客户端了。想记录状态码,应该包一层 writer,在 WriteHeader 里记下来,而不是请求结束后再凭空改。
Request Context 是请求的生命线
前面第六篇已经聊过 Context。放到 HTTP 服务里,r.Context() 就是每个请求自带的生命周期信号。
Go 官方 Request.Context[2] 文档里说得很清楚:对服务端收到的请求,客户端连接关闭、HTTP/2 请求被取消,或者 ServeHTTP 返回时,这个 context 会被取消。
业务代码里最常见的错误是:handler 里拿到了请求 context,但往下游调用时没传。
func handleUser(w http.ResponseWriter, r *http.Request) { ctx := r.Context() user, err := queryUser(ctx, r.PathValue("id")) if err != nil { http.Error(w, err.Error(), http.StatusBadGateway) return } if err := json.NewEncoder(w).Encode(user); err != nil { log.Printf("write response: %v", err) }}func queryUser(ctx context.Context, id string) (User, error) { row := db.QueryRowContext(ctx, ` SELECT id, name FROM users WHERE id = ? `, id) var u User if err := row.Scan(&u.ID, &u.Name); err != nil { return User{}, err } return u, nil}客户端都断了,数据库查询还在跑,通常就是这里断链了。
调第三方 API 也一样:
func callAPI(ctx context.Context, endpoint string) ([]byte, error) { req, err := http.NewRequestWithContext(ctx, http.MethodGet, endpoint, nil) if err != nil { return nil, err } resp, err := http.DefaultClient.Do(req) if err != nil { return nil, err } defer resp.Body.Close() if resp.StatusCode < 200 || resp.StatusCode >= 300 { return nil, fmt.Errorf("api status %d", resp.StatusCode) } return io.ReadAll(resp.Body)}这里没有 panic,也没有“先忽略 err”。网络、数据库、客户端断开,都是正常世界的一部分。正常错误就正常返回。
Handler 返回以后,请求就结束了
ServeHTTP 返回是一个明确边界。
官方 Handler[3] 文档里有一句话很关键:ServeHTTP 返回表示请求已经结束;返回后继续使用 ResponseWriter 或继续读取 Request.Body 都不是有效用法。
这类代码就很危险:
func bad(w http.ResponseWriter, r *http.Request) { gofunc() { time.Sleep(time.Second) _, _ = w.Write([]byte("late write")) }() w.WriteHeader(http.StatusAccepted)}handler 返回后,后台 goroutine 还拿着 w 写响应。它可能写不出去,也可能和连接复用撞在一起。想做异步任务,应该把任务数据投递到队列里,不要把请求对象和响应 writer 带出 handler 生命周期。
如果你确实要做流式响应,那就让 handler 自己在生命周期内持续写,并监听 context:
func stream(w http.ResponseWriter, r *http.Request) { ctx := r.Context() ticker := time.NewTicker(time.Second) defer ticker.Stop() flusher, ok := w.(http.Flusher) if !ok { http.Error(w, "streaming unsupported", http.StatusInternalServerError) return } for { select { case <-ctx.Done(): return case t := <-ticker.C: if _, err := fmt.Fprintf(w, "data: %s\n\n", t.Format(time.RFC3339)); err != nil { return } flusher.Flush() } }}优雅关闭不是 close 一下端口
服务发布、机器重启、容器滚动更新时,你希望发生的是:
1. 不再接收新连接 2. 已经空闲的连接关掉 3. 正在处理的请求给一点时间跑完 4. 超过时间还没结束,再退出
这就是 Server.Shutdown 要做的事。官方 Shutdown[4] 文档的核心语义是:先关闭 listener,再关闭 idle 连接,然后等待活跃连接变成 idle;如果传入的 context 超时,就返回 context 的错误。
一个比较完整的写法:
func main() { mux := http.NewServeMux() mux.HandleFunc("/ping",func(w http.ResponseWriter, r *http.Request) { _, _ = w.Write([]byte("pong")) }) srv := &http.Server{ Addr: ":8080", Handler: mux, ReadHeaderTimeout: 5 * time.Second, ReadTimeout: 30 * time.Second, WriteTimeout: 30 * time.Second, IdleTimeout: 60 * time.Second, } serverErr := make(chan error, 1) gofunc() { err := srv.ListenAndServe() if err != nil && !errors.Is(err, http.ErrServerClosed) { serverErr <- err return } serverErr <- nil }() ctx, stop := signal.NotifyContext(context.Background(), os.Interrupt, syscall.SIGTERM) defer stop() select { case err := <-serverErr: if err != nil { log.Fatal(err) } case <-ctx.Done(): shutdownCtx, cancel := context.WithTimeout(context.Background(), 10*time.Second) defer cancel() if err := srv.Shutdown(shutdownCtx); err != nil { log.Printf("shutdown: %v", err) } if err := <-serverErr; err != nil { log.Fatal(err) } }}这里有两个细节:
第一,ListenAndServe 在 Shutdown 后会返回 http.ErrServerClosed,这不是异常事故,别把它当 fatal。
第二,调用 Shutdown 后主 goroutine 不能立刻退出。文档也提醒了:ListenAndServe 会很快返回,你要等 Shutdown 自己返回,程序才算真的完成收尾。
还有一个边界:WebSocket 这种 hijacked connection 不归 Shutdown 自动等待。你要自己通知这些长连接退出,比如用 RegisterOnShutdown 做广播。
把这条线记住
一个请求在 Go HTTP 服务里,大致走完这条线:
TCP accept │ ▼ connection goroutine │ ▼ read request with timeout │ ▼ Handler / middleware chain │ ▼ request context controls downstream work │ ▼ write response │ ▼ keep-alive idle / close │ ▼ graceful shutdown waits for active work理解这条线以后,很多线上问题就不再是“框架怎么了”。
慢连接,先看 header/body timeout。
客户端断开后任务还在跑,先看 context 有没有一路传下去。
发布时请求被硬断,先看是不是只关了进程,没有走 Shutdown。
handler 返回后还想写响应,那是生命周期已经越界。
但知道生命周期还不够。下一篇该聊测试了:HTTP handler、中间件、context 取消、超时和并发代码,不能只靠手点接口证明没问题。
引用链接
[1] `Server.Serve`: https://pkg.go.dev/net/http#Server.Serve[2] `Request.Context`: https://pkg.go.dev/net/http#Request.Context[3] `Handler`: https://pkg.go.dev/net/http#Handler[4] `Shutdown`: https://pkg.go.dev/net/http#Server.Shutdown
夜雨聆风