跳转至

用户提示词工作区

路由:/#/basic/user

这个工作区适合优化“一次具体任务怎么说”。

如果你主要在写角色、规则、边界,通常更适合去 系统提示词工作区

第一次使用,先这样判断

如果满足下面两条,通常就该用这个页面:

  1. 你在改的是一条直接发给模型的任务提示词
  2. 右侧通常不需要额外测试文本

什么时候用它

适合:

  • 写作、改写、总结、翻译
  • 生成结构化内容
  • 调整任务目标、约束和输出格式
  • 打磨一条直接发给模型的任务提示词

如果你只想快速开始,看这 4 步

  1. 左侧填一条用户提示词
  2. 左侧先做一次优化
  3. 右侧直接运行测试
  4. 再做结果评估或对比评估

左侧到底在改什么

左侧改的是 user prompt 本身

当前页面可以这样理解:

  • 左侧上方:原始用户提示词
  • 左侧下方:当前工作区和版本链

左侧的 分析 / 优化 / 迭代,目标都是把这条 user prompt 写得更清楚、更稳定。

右侧到底在测什么

右侧测的是:

  • 某个提示词版本本身
  • 直接执行后的真实输出

所以在这个工作区里,右侧通常不需要额外测试文本

这不是少了功能,而是当前设计本来就是这样:被测试的就是那条用户提示词本身。

这个页面里“分析”和“评估”的边界

  • 左侧 分析:只分析提示词本身
  • 右侧 结果评估:评估某一列输出是否完成任务
  • 右侧 对比评估:比较多列输出的差异模式

推荐工作流

  1. 左侧输入原始用户提示词
  2. 左侧先做一次优化,得到工作区版本
  3. 如需先看提示词本身是否清楚,再点左侧 分析
  4. 右侧选择 原始 / 工作区 / vN
  5. 运行测试
  6. 先做单列 结果评估
  7. 如果已经跑了两列或更多,再做 对比评估
  8. 把真正有价值的建议应用回左侧工作区

最容易混淆的地方

因为在 basic/user 里,被测试的就是用户提示词本身。

不是。当前评估建议统一尝试作用到左侧当前工作区,而不是绑定到某个历史版本分支。

一个最小例子

原始提示词:

写一首诗

优化后可能变成:

请写一首关于秋日思念的七言律诗。
要求:
1. 共八句,每句七字。
2. 语言含蓄,不要直接喊口号式抒情。
3. 通过景物意象表达思念。
4. 只输出诗作,不要额外解释。

这时右侧就可以直接比较:

  • 原始版本是否太泛
  • 工作区版本是否更稳定地满足要求
  • 不同模型是否对同一提示词理解一致

相关页面