Content
Music Bible(音乐圣经)是游戏/应用音频制作的核心文档,定义了音乐体系的全部约束和规范,确保 AI 批量生成的音乐”听起来像同一个世界”。
Acceptance
Music Bible(音乐圣经)是游戏/应用音频制作的核心文档,定义了音乐体系的全部约束和规范,确保 AI 批量生成的音乐”听起来像同一个世界”。包含四个组成部分:
- 世界观关键词(3~5 个):定义整体氛围,如
1920s rural mountains / foggy / suspense / uncanny - 调色板(允许/禁止乐器):限定音色范围,如允许钢琴+低弦+手风琴,禁止大编制铜管
- 主动机(Motif):核心旋律音型及其变体(紧张版/温柔版),保证音乐有记忆点
- Cue Sheet(片段清单):按事件类型列出所有需要的音频片段(neutral_bed / reveal / horror / combat 等)
两条轨道策略:Bed Track(长循环氛围底)+ Cue Track(短事件片段),触发 cue 时 bed 轻微 duck(-6dB),cue 结束后恢复。
统一规格:采样率 48kHz、目标响度 -16 LUFS、峰值 -1dBTP、尾音 ≤1.5s。
AI 生成时用”固定前缀 + cue 变量”模板:固定前缀是 Music Bible 的调色板+禁忌,cue 变量是单个片段的情绪/速度/质感描述。
Question
- Cue Sheet 里的 10 个基础 cue 够用吗?什么情况下需要扩展到 20+?
- Bed Track 和 Cue Track 的 duck 量(-6dB)是经验值,有没有更精确的参考?
- 不同平台的音频压缩(App 的 AAC vs Web 的 OGG)会不会影响 -16 LUFS 的目标?
See Also
Diffusion Model(AI 音乐生成的底层技术)
约束即能力(“限制音色范围 → 提高一致性”背后的哲学)
Reference
来源:2026-03-25 Jeff 与瑶瑶讨论 SaltyFlame 游戏音乐系统(10 个频道 × 短 cue + 事件触发)
YoYo’s Note
Music Bible 的本质是”在生成式 AI 时代,用约束换取一致性”。
Jeff 在 1920s 山区悬疑游戏的音乐设计里,先定义了允许的音色(老旧钢琴+弱音弦乐+手风琴)、禁止的音色(大编制/EDM)、主动机和三个变体,然后才出第一个 cue。这样即使 AI 生成了 50 条,也不会散成”不同的世界”。
这和 λ-RLM 用有限算子库约束 LLM、Midjourney 用 —cref 固定角色是同一个思路:限制自由度,才能锁定质量。