用户提示词工作区¶
路由:/#/basic/user
这个工作区适合优化“一次具体任务怎么说”。
如果你主要在写角色、规则、边界,通常更适合去 系统提示词工作区。
第一次使用,先这样判断¶
如果满足下面两条,通常就该用这个页面:
- 你在改的是一条直接发给模型的任务提示词
- 右侧通常不需要额外测试文本
什么时候用它¶
适合:
- 写作、改写、总结、翻译
- 生成结构化内容
- 调整任务目标、约束和输出格式
- 打磨一条直接发给模型的任务提示词
如果你只想快速开始,看这 4 步¶
- 左侧填一条用户提示词
- 左侧先做一次优化
- 右侧直接运行测试
- 再做结果评估或对比评估
左侧到底在改什么¶
左侧改的是 user prompt 本身。
当前页面可以这样理解:
- 左侧上方:原始用户提示词
- 左侧下方:当前工作区和版本链
左侧的 分析 / 优化 / 迭代,目标都是把这条 user prompt 写得更清楚、更稳定。
右侧到底在测什么¶
右侧测的是:
- 某个提示词版本本身
- 直接执行后的真实输出
所以在这个工作区里,右侧通常不需要额外测试文本。
这不是少了功能,而是当前设计本来就是这样:被测试的就是那条用户提示词本身。
这个页面里“分析”和“评估”的边界¶
- 左侧
分析:只分析提示词本身 - 右侧
结果评估:评估某一列输出是否完成任务 - 右侧
对比评估:比较多列输出的差异模式
推荐工作流¶
- 左侧输入原始用户提示词
- 左侧先做一次优化,得到工作区版本
- 如需先看提示词本身是否清楚,再点左侧
分析 - 右侧选择
原始 / 工作区 / vN - 运行测试
- 先做单列
结果评估 - 如果已经跑了两列或更多,再做
对比评估 - 把真正有价值的建议应用回左侧工作区
最容易混淆的地方¶
因为在 basic/user 里,被测试的就是用户提示词本身。
不是。当前评估建议统一尝试作用到左侧当前工作区,而不是绑定到某个历史版本分支。
一个最小例子¶
原始提示词:
写一首诗
优化后可能变成:
请写一首关于秋日思念的七言律诗。
要求:
1. 共八句,每句七字。
2. 语言含蓄,不要直接喊口号式抒情。
3. 通过景物意象表达思念。
4. 只输出诗作,不要额外解释。
这时右侧就可以直接比较:
- 原始版本是否太泛
- 工作区版本是否更稳定地满足要求
- 不同模型是否对同一提示词理解一致