Skip to content

灰度发布

是什么

灰度发布(也叫 rollout、A/B 发布)让一个 Prompt 的两个已发布版本 并行服务,按权重在它们之间切分流量。不是一次把所有人切到新 Prompt,而是 比如把 20% 的请求发给新版本,然后观察。

为什么重要

新 Prompt 可能在某些方面表现更差,而这些问题在真实流量打上来之前看不出来。 灰度发布给改动降风险:先放一小部分流量,对比,再扩大或回滚。

工作原理

灰度按每个 Prompt(key + env)配置:

配置项含义
enabled灰度是否生效
variant_a一个已发布版本标签,例如 v1
variant_b另一个已发布版本标签,例如 v2
weight_a发给变体 A 的流量百分比(其余给 B)

当 SDK 按 key + env 获取该 Prompt 时,服务端按 weight_a 掷一次骰子, 返回变体 A 或变体 B 的已发布内容。

提示

两个变体版本必须先发布 —— 见版本与发布。灰度是在已发布 快照之间选择,而不是那份可变的工作区内容。

怎么用

  1. 至少发布该 Prompt 的两个版本(例如 v1v2)。
  2. 打开 Prompt 编辑器,找到 灰度发布 (AB) 卡片。
  3. 打开 启用灰度
  4. 把变体 A、变体 B 设为两个已发布版本标签。
  5. 设置 A 流量占比 (%) —— 例如 80 表示 80% 给 A、20% 给 B。
  6. 点击 保存灰度配置

对应的 API

操作接口
获取灰度配置GET /api/prompts/:id/rollout
设置灰度配置PUT /api/prompts/:id/rollout
删除灰度DELETE /api/prompts/:id/rollout

下一步

AI Prompt、Agent 与 Workflow 的开源运行时平台。