Content
LLM 存在序列位置效应(Serial Position Effect):对上下文开头和末尾的信息处理最好,中间的信息最容易被忽略,形成 U 型注意力曲线。
Acceptance
- LLM 存在序列位置效应(Serial Position Effect):对上下文开头和末尾的信息处理最好,中间的信息最容易被忽略,形成 U 型注意力曲线。
- Liu et al. (2024) “Lost in the Middle” 论文(TACL 2024)测量到:答案文档从位置 1 移到中间位置时,准确率下降约 20 个百分点。
- 这一效应由 Rotary Position Embedding (RoPE) 的衰减特性引起,是 transformer 架构的固有属性。
- Trailing Reminder(尾部提醒):在提示词末尾重复关键约束,可将终端型约束的遵从率恢复到 90-100%(“Did You Forget What I Asked?” 论文,arxiv 2603.23530)。
- Anthropic 官方建议:“把查询放在长文档之后(而非之前),可以提升最多 30% 的响应质量。“
Question
- 随着模型参数规模增大和上下文窗口扩展,U 型曲线是否在减弱?
- 对于 skill 系统这样的长系统提示词,是否应该定期在中间插入 reminder 而非只在末尾?
See Also
Reference
- 来源:2026-03-28 Claude Code 对话(spec-skill reform 任务中的调研)
- 论文:Lost in the Middle: How Language Models Use Long Contexts (TACL 2024)
- 论文:Did You Forget What I Asked? (arxiv 2603.23530)
- 论文:Serial Position Effects of Large Language Models (arxiv 2406.15981)
YoYo’s Note
- 这个发现解释了为什么 skill 中的终端型约束(如”Phase 4 结束时必须展示 checklist”)经常被遗忘——到那时候,开头的指令已经”淡出”了注意力。解决方案是在流程末尾加一个简短的 trailing reminder。
- 实践规则:核心约束放在 skill 文件的开头和末尾,中间放流程描述。这不只是排版美学,而是基于 U 型注意力曲线的工程决策。