灰度发布
是什么
灰度发布(也叫 rollout、A/B 发布)让一个 Prompt 的两个已发布版本 并行服务,按权重在它们之间切分流量。不是一次把所有人切到新 Prompt,而是 比如把 20% 的请求发给新版本,然后观察。
为什么重要
新 Prompt 可能在某些方面表现更差,而这些问题在真实流量打上来之前看不出来。 灰度发布给改动降风险:先放一小部分流量,对比,再扩大或回滚。
工作原理
灰度按每个 Prompt(key + env)配置:
| 配置项 | 含义 |
|---|---|
enabled | 灰度是否生效 |
variant_a | 一个已发布版本标签,例如 v1 |
variant_b | 另一个已发布版本标签,例如 v2 |
weight_a | 发给变体 A 的流量百分比(其余给 B) |
当 SDK 按 key + env 获取该 Prompt 时,服务端按 weight_a 掷一次骰子, 返回变体 A 或变体 B 的已发布内容。
提示
两个变体版本必须先发布 —— 见版本与发布。灰度是在已发布 快照之间选择,而不是那份可变的工作区内容。
怎么用
- 至少发布该 Prompt 的两个版本(例如
v1和v2)。 - 打开 Prompt 编辑器,找到 灰度发布 (AB) 卡片。
- 打开 启用灰度。
- 把变体 A、变体 B 设为两个已发布版本标签。
- 设置 A 流量占比 (%) —— 例如
80表示 80% 给 A、20% 给 B。 - 点击 保存灰度配置。
对应的 API
| 操作 | 接口 |
|---|---|
| 获取灰度配置 | GET /api/prompts/:id/rollout |
| 设置灰度配置 | PUT /api/prompts/:id/rollout |
| 删除灰度 | DELETE /api/prompts/:id/rollout |