跳转至

多消息工作区

路由:/#/pro/multi

这个工作区不是“单条提示词模式的增强版”,而是一个围绕整段会话来优化其中某一条消息的工作区。

第一次使用,先这样判断

如果满足下面两条,通常就该用这个页面:

  1. 你的输入已经不是单条提示词,而是整段会话
  2. 右侧需要带整段上下文、共享变量或工具一起测试

什么时候用它

适合:

  • 同时存在 system / user / assistant 多条消息
  • 你要在完整对话上下文里优化其中一条 systemuser 消息
  • 会话里还需要共享变量或工具定义

不适合:

  • 只想优化一条独立提示词

那种情况通常用基础模式或变量模式更简单。

如果你只想快速开始,看这 5 步

  1. 先把整段会话搭出来
  2. 选中要优化的那条 systemuser 消息
  3. 左侧先做一次优化或分析
  4. 右侧配置共享变量和可选工具
  5. 右侧跑测试,再做评估

左侧到底在改什么

左侧改的是 整段会话里被你选中的那条目标消息

当前页面可以这样理解:

  • 会话管理器:维护整段消息列表
  • 选中某一条 systemuser 消息作为当前优化目标
  • 左侧下方:这条消息自己的工作区和版本链

右侧到底在测什么

右侧测的是 整段会话的真实执行结果

只是当前列会把你选中的那条目标消息切换成:

  • 工作区
  • 原始
  • v1 / vN

同时,右侧还会把这些内容一起带入测试:

  • 整段会话
  • 共享变量
  • 可选工具上下文

左侧分析和右侧评估怎么区分

  • 左侧 分析:分析被选中的目标消息在上下文中的写法
  • 右侧 结果评估:评估某一列整段会话执行后的结果
  • 右侧 对比评估:比较多列真实输出之间的差异

需要特别注意:

  • 左侧分析不会把右侧某一次测试结果当作前提
  • 右侧评估看的是真实执行证据,而不是版本标签本身

变量和工具在这里怎么生效

多消息模式里,变量和工具都属于右侧测试证据的一部分。

你可以把它理解成:

  • 左侧决定“目标消息怎么写”
  • 右侧决定“这条消息放回整段会话后,真实跑出来会怎样”

推荐工作流

  1. 先把整段会话搭出来
  2. 选中要优化的那条 systemuser 消息
  3. 左侧先做一次优化或分析
  4. 右侧配置共享变量和可选工具
  5. 在右侧比较 工作区 / 原始 / vN
  6. 先做单列 结果评估
  7. 如果已经跑了两列或更多,再做 对比评估
  8. 把真正有价值的建议应用回左侧工作区

最容易混淆的地方

不是。右侧是在执行整段会话,只是被选中的那条目标消息会按列切换版本。

不是。变量值属于右侧测试输入,左侧分析的重点仍然是目标消息本身。

相关页面