多消息工作区¶
路由:/#/pro/multi
这个工作区不是“单条提示词模式的增强版”,而是一个围绕整段会话来优化其中某一条消息的工作区。
第一次使用,先这样判断¶
如果满足下面两条,通常就该用这个页面:
- 你的输入已经不是单条提示词,而是整段会话
- 右侧需要带整段上下文、共享变量或工具一起测试
什么时候用它¶
适合:
- 同时存在
system / user / assistant多条消息 - 你要在完整对话上下文里优化其中一条
system或user消息 - 会话里还需要共享变量或工具定义
不适合:
- 只想优化一条独立提示词
那种情况通常用基础模式或变量模式更简单。
如果你只想快速开始,看这 5 步¶
- 先把整段会话搭出来
- 选中要优化的那条
system或user消息 - 左侧先做一次优化或分析
- 右侧配置共享变量和可选工具
- 右侧跑测试,再做评估
左侧到底在改什么¶
左侧改的是 整段会话里被你选中的那条目标消息。
当前页面可以这样理解:
- 会话管理器:维护整段消息列表
- 选中某一条
system或user消息作为当前优化目标 - 左侧下方:这条消息自己的工作区和版本链
右侧到底在测什么¶
右侧测的是 整段会话的真实执行结果。
只是当前列会把你选中的那条目标消息切换成:
工作区原始v1 / vN
同时,右侧还会把这些内容一起带入测试:
- 整段会话
- 共享变量
- 可选工具上下文
左侧分析和右侧评估怎么区分¶
- 左侧
分析:分析被选中的目标消息在上下文中的写法 - 右侧
结果评估:评估某一列整段会话执行后的结果 - 右侧
对比评估:比较多列真实输出之间的差异
需要特别注意:
- 左侧分析不会把右侧某一次测试结果当作前提
- 右侧评估看的是真实执行证据,而不是版本标签本身
变量和工具在这里怎么生效¶
多消息模式里,变量和工具都属于右侧测试证据的一部分。
你可以把它理解成:
- 左侧决定“目标消息怎么写”
- 右侧决定“这条消息放回整段会话后,真实跑出来会怎样”
推荐工作流¶
- 先把整段会话搭出来
- 选中要优化的那条
system或user消息 - 左侧先做一次优化或分析
- 右侧配置共享变量和可选工具
- 在右侧比较
工作区 / 原始 / vN - 先做单列
结果评估 - 如果已经跑了两列或更多,再做
对比评估 - 把真正有价值的建议应用回左侧工作区
最容易混淆的地方¶
不是。右侧是在执行整段会话,只是被选中的那条目标消息会按列切换版本。
不是。变量值属于右侧测试输入,左侧分析的重点仍然是目标消息本身。