用 Go 写了个 AI 代理网关,让 Cowork 随意切换国产大模型

前言
最近在用 Cowork(Anthropic 的协作编程工具)写代码,它真的很好用——但有个问题:只认 Claude 模型。
客户端会校验模型名称必须以 claude- 开头,这意味着你没法直接接入通义千问、GLM、DeepSeek 等国产大模型。
之前写了个简单的反向代理做模型名改写,能用但太简陋。最近花了两天时间,参考 new-api 的多渠道网关思路和 cc-switch 的熔断降级设计,用 Go 重写了一版——cowork-rename-proxy。
全部代码不到 2000 行,只有一个外部依赖(yaml.v3),编译出来就是一个二进制文件,拿来即用。
它解决什么问题
Cowork 的限制很明确:
Client → 必须发送 claude-xxx 模型名Server → 必须是 Anthropic 兼容接口而国产模型提供商(百炼 DashScope、智谱 GLM、火山方舟等)的模型名和接口都不一样。
cowork-rename-proxy 做的事情很简单:站在中间,两头欺骗。
• 告诉 Cowork:"我支持 claude-sonnet-4-6" • 把请求转发到百炼,模型名替换为 "qwen3.6-plus" • 把上游响应里的模型名换回来,Cowork 完全感知不到
Cowork → claude-sonnet-4-6 → [proxy] → qwen3.6-plus → DashScopeCowork ← claude-sonnet-4-6 ← [proxy] ← qwen3.6-plus ← DashScope核心特性
1. 多渠道路由
不止能接一个上游,可以配置多个渠道,每个渠道独立设置优先级和权重:
channels: - id: "dashscope" name: "通义千问" base_url: "https://coding.dashscope.aliyuncs.com/apps/anthropic" api_key: "sk-xxx" priority: 1 # 数字越小优先级越高 weight: 10 models: - "qwen3.6-plus" - id: "openrouter" name: "OpenRouter" base_url: "https://openrouter.ai/api/v1" api_key: "sk-or-xxx" priority: 2 # 备用渠道 weight: 5 models: - "google/gemini-2.5-pro"路由逻辑:按优先级排序 → 同优先级按权重选择 → 过滤已熔断的渠道 → 过滤不支持目标模型的渠道。
2. 模型别名映射
用一张映射表,把 Cowork 看到的模型名翻译成真实模型名:
model_aliases: "claude-sonnet-4-6": "qwen3.6-plus" "claude-gemini": "google/gemini-2.5-pro"Cowork 里选 claude-sonnet-4-6,到上游就变成 qwen3.6-plus,响应里再换回来。SSE 流式响应也会逐事件改写,不影响流式输出体验。
3. 熔断 + 自动降级
参考了经典的 Circuit Breaker 模式,三态状态机:
连续失败 ≥ 阈值 超时后尝试Closed ──────────→ Open ──────────→ HalfOpen ↑ │ │ 连续成功 ≥ 阈值 │ 失败 └────────────────────────────────────┘• Closed:正常转发 • Open:渠道挂了,跳过它,请求自动走下一个渠道 • HalfOpen:试探性放几个请求过去,成功就恢复,失败继续隔离
上游返回 5xx 或连接失败会触发熔断计数,4xx(参数错误、认证失败)直接返回客户端,不算渠道故障。
4. 请求日志 + 统计面板
每个请求都会记录:渠道、模型映射、Token 用量、延迟、状态码。数据用 JSONL 文件存储(最初用了 SQLite,但 pure-Go 的实现在 macOS ARM 上直接 panic,果断换成了零依赖的 JSONL 方案)。
内置一个暗色主题的 Web Dashboard:
• Overview:今日请求数、Token 用量、成功率、每日趋势图 • Channels:各渠道健康状态、熔断器状态、一键重置 • Logs:最近请求明细,包含模型映射关系
直接浏览器打开 https://localhost:18080/ 就能看到。
5. 配置热更新
修改 config.yaml 后不用重启,代理每 2 秒检测配置文件变化,自动重新加载渠道列表、模型别名、熔断参数等。
只有 host、port、tls 这三项需要重启才能生效。
快速上手
第一步:下载
去 GitHub Releases 下载对应平台的二进制。macOS、Linux、Windows 都有。
第二步:生成 HTTPS 证书
Cowork 要求 HTTPS 连接,用 mkcert 一行搞定:
brew install mkcert # macOSmkcert -installmkcert localhost # 生成 localhost.pem 和 localhost-key.pem第三步:写配置
host: "0.0.0.0"port: 18080tls: truetls_cert: "localhost.pem"tls_key: "localhost-key.pem"base_path: "/apps/anthropic"channels: - id: "dashscope" name: "通义千问" base_url: "https://coding.dashscope.aliyuncs.com/apps/anthropic" api_key: "你的API Key" priority: 1 models: - "qwen3.6-plus"model_aliases: "claude-sonnet-4-6": "qwen3.6-plus"mock_models: - "claude-sonnet-4-6"failover: enabled: true第四步:启动
./proxy-darwin-arm64 # macOS Apple Silicon第五步:配置 Cowork
Base URL: https://localhost:18080/apps/anthropicAPI Key: 你的百炼 API KeyModel: claude-sonnet-4-6完事。Cowork 以为自己在跟 Claude 对话,实际上背后是通义千问在干活。
架构一览
┌─────────────────────────────────────────────────┐│ Cowork Client ││ POST /apps/anthropic/v1/messages ││ model: claude-sonnet-4-6 │└──────────────────────┬──────────────────────────┘ │ ▼┌─────────────────────────────────────────────────┐│ cowork-rename-proxy ││ ││ ┌──────────┐ ┌────────┐ ┌────────────────┐ ││ │ Router │→│ Alias │→│ Channel Select │ ││ │ │ │ Resolve │ │ (Priority+CB) │ ││ └──────────┘ └────────┘ └───────┬────────┘ ││ │ ││ ┌──────────┐ ┌────────┐ ┌───────▼────────┐ ││ │ Store │←│ Logger │←│ Forwarder │ ││ │ (JSONL) │ │ │ │ (Failover+SSE) │ ││ └──────────┘ └────────┘ └───────┬────────┘ ││ │ ││ ┌──────────────────────────────────┘ ││ │ Circuit Breaker Manager ││ │ (per-channel state machine) ││ └──────────────────────────────────────────────│└──────────────────────┬──────────────────────────┘ │ ┌────────────┼────────────┐ ▼ ▼ ▼ ┌──────────┐ ┌──────────┐ ┌──────────┐ │DashScope │ │OpenRouter│ │ 其他渠道 │ │ qwen3.6 │ │ gemini │ │ ... │ └──────────┘ └──────────┘ └──────────┘一些技术选择
为什么不用 SQLite?
最初是用的 modernc.org/sqlite(pure Go 实现,不需要 CGO),但在 macOS ARM 上直接 panic:
libc_darwin.go:197:Xsrandomdev: TODOTODO这个 pure-Go 的 libc 层没有实现 macOS ARM 的 srandomdev。与其等上游修复或者引入 CGO,不如直接换成 JSONL 文件 + 内存索引,零外部依赖,够用就行。
为什么只有一个外部依赖?
go.mod 里只有 gopkg.in/yaml.v3,没有 gin/echo/fiber 这些框架,没有 ORM,没有日志库。标准库的 net/http 足以应对代理场景,而且编译快、二进制小、部署简单。
为什么用 JSONL 而不是数据库?
这是个单机工具,日志量不会太大。JSONL 方案:追加写入零碎片、启动时顺序扫描加载、自带人类可读性、30 天自动清理。对于这个场景,比任何数据库都简单。
测试覆盖
目前有 33 个单元测试,覆盖核心模块:
全部通过 -race 检测,无数据竞争。
后续计划
• 支持 OpenAI 兼容接口( /v1/chat/completions),学习百炼的双协议模式• 支持按模型维度的统计和限速 • 支持 WebSocket 长连接场景
最后
代码开源在 GitHub:wayyoungboy/cowork-rename-proxy
如果你也在用 Cowork 但想接国产模型,或者有类似的 API 网关需求,欢迎 Star 和 PR。
有问题可以开 Issue,或者直接在评论区聊。
夜雨聆风