首页 资讯 下载 教程 Skills 社群

Cloudflare AI Gateway 配置

概述

Cloudflare AI Gateway 是 Cloudflare 提供的 AI 请求代理和观测平台。将 AI 调用流量路由经过该 Gateway,可以获得完整的请求日志与用量分析、响应缓存加速、请求速率控制,以及跨多个 AI 提供商的统一管理视图。对于需要审计 AI 调用记录或希望降低重复请求成本的团队,这是一个值得引入的基础设施层。OpenClaw 通过 cloudflare-ai-gateway 提供者与之对接。

快速开始

第一步:在 Cloudflare Dashboard 创建 Gateway

登录 Cloudflare Dashboard,进入 AI Gateway 模块,创建一个新的 Gateway,记录下 Account IDGateway ID

第二步:准备 API Key

根据你要通过 Gateway 转发的目标服务(如 Anthropic),准备对应的 API Key。Cloudflare AI Gateway 本身可选配访问令牌用于 Gateway 级鉴权。

第三步:运行 OpenClaw 配置命令

openclaw onboard --auth-choice cloudflare-ai-gateway-api-key

或使用非交互方式一次性完成配置:

openclaw onboard --non-interactive \
  --mode local \
  --auth-choice cloudflare-ai-gateway-api-key \
  --cloudflare-ai-gateway-account-id "your-account-id" \
  --cloudflare-ai-gateway-gateway-id "your-gateway-id" \
  --cloudflare-ai-gateway-api-key "$CLOUDFLARE_AI_GATEWAY_API_KEY"

配置参数

Gateway 的基础 URL 格式为:

https://gateway.ai.cloudflare.com/v1/<account_id>/<gateway_id>/anthropic

在 OpenClaw 配置文件中设置默认模型:

{
  agents: {
    defaults: {
      model: { primary: "cloudflare-ai-gateway/claude-sonnet-4-6" },
    },
  },
}

如果 Gateway 启用了访问令牌鉴权,需要在请求头中附加 cf-aig-authorization

{
  models: {
    providers: {
      "cloudflare-ai-gateway": {
        headers: {
          "cf-aig-authorization": "Bearer <cloudflare-ai-gateway-token>",
        },
      },
    },
  },
}

支持的模型

Cloudflare AI Gateway 支持代理多个主流 AI 服务商,通过 OpenClaw 可使用的模型以 cloudflare-ai-gateway/ 为前缀:

  • cloudflare-ai-gateway/claude-sonnet-4-6 — 通过 Gateway 转发至 Anthropic Claude Sonnet
  • cloudflare-ai-gateway/claude-opus-4-6 — 通过 Gateway 转发至 Anthropic Claude Opus
  • cloudflare-ai-gateway/gpt-4o — 通过 Gateway 转发至 OpenAI GPT-4o

实际可用模型取决于你在 Cloudflare Dashboard 中为 Gateway 配置的上游提供商及对应 API Key。

注意事项

双层鉴权:使用 Anthropic 模型时,需要同时准备 Anthropic API Key(用于上游鉴权)和可选的 Cloudflare Gateway Token(用于 Gateway 级访问控制),两者相互独立。

守护进程部署:在 launchd 或 systemd 环境下运行 OpenClaw 时,需将 API Key 写入 ~/.openclaw/.env,确保后台进程启动时能正确读取凭据。

缓存行为:Cloudflare AI Gateway 的语义缓存功能默认关闭,如需启用请在 Cloudflare Dashboard 中配置,相同或相似的提示词可命中缓存直接返回,减少 API 消耗。

延迟影响:请求经过 Cloudflare 网络转发会引入轻微额外延迟,通常在 10-30ms 以内,对于大多数交互式使用场景影响可忽略不计。