一、风格与氛围类标签

标签名称

功能说明

典型示例

适用场景

备注

[Style]

定义音乐流派框架,决定核心乐器、节奏逻辑与和声走向,避免风格跑偏

[Style: Pop](流行乐,适配大众听感)、[Style: Folk](民谣,侧重质朴叙事)、[Style: Rock, Classic Rock](经典摇滚,强电吉他 + 鼓点)、[Style: Lo-fi](低保真,带复古杂音)、[Style: Electronic, Synthwave](合成器浪潮,80 年代电子质感)、[Style: Classical, Chamber](室内古典,弦乐四重奏为主)

全场景,无论是短视频配乐、原创 demo 还是影视原声,均需先通过此标签锁定基础风格

高频使用

[Vibe]

传递情绪感受与氛围基调,通过音色质感、动态起伏优化情感表达

[Vibe: Warm and cozy](温暖舒适,适合睡前助眠)、[Vibe: Cinematic and epic](电影感史诗,适配预告片)、[Vibe: Melancholic](忧郁细腻,适合抒情歌)、[Vibe: Energetic and explosive](活力爆发,适合运动视频)、[Vibe: Cool and laid-back](冷静松弛,适合街头文化内容)

需强化情感共鸣的创作,如剧情短片配乐、情绪向 Vlog 背景音、主题性活动音乐

高频使用

二、人声控制类标签

标签名称

功能说明

典型示例

适用场景

备注

[Vocal]

定义人声核心特质,覆盖性别(Male/Female/Non-binary)、音色(Raspy/Bright/Breathless)、演唱技法(Vibrato/Belting/Rap),塑造人声辨识度

[Vocal: Female, Soprano, Breathless](女高音 + 气声,适合空灵抒情)、[Vocal: Male, Rap, Old-school Flow](男声 + 老派说唱,适合嘻哈)、[Vocal: Non-binary, Androgynous, Soft](非二元性别 + 中性柔音,适合独立流行)、[Vocal: Male, Baritone, Raspy](男中音 + 沙哑,适合布鲁斯)

有人声的歌曲创作,如流行单曲、叙事民谣、说唱作品,需避免人声与风格脱节

高频使用

[Vocal Mix]

控制人声音量与编曲的平衡关系,可添加回声、双轨等特效,优化人声听感

[Vocal Mix: Balanced](人声与编曲均衡,适配多数风格)、[Vocal Mix: Echo, Short Delay](短延迟回声,增强空间感)、[Vocal Mix: Loud](人声突出,适合独白式歌曲)、[Vocal Mix: Soft, Double Tracked](轻柔双轨,适合氛围哼唱)

需调节人声主次的场景,如人声主导的民谣、编曲复杂的电子乐、需隐藏人声的背景音

高频(Balanced)

三、编曲与节奏类标签

标签名称

功能说明

典型示例

适用场景

备注

[Instrumentation]

指定乐器组合逻辑,明确核心乐器(如民谣的原声吉他)与辅助乐器(如点缀的口琴),确保编曲贴合风格

[Instrumentation: Acoustic Guitar, Piano, Drums](流行乐核心:原声吉他 + 钢琴 + 鼓)、[Instrumentation: Guzheng, Erhu](古风核心:古筝 + 二胡)、[Instrumentation: Synthesizer, Drum Machine, Bass Synth](电子乐核心:合成器 + 鼓机 + 贝斯合成器)、[Instrumentation: Violin, Cello, Piano](古典室内乐:小提琴 + 大提琴 + 钢琴)

需明确配器的创作,如原创 demo、影视配乐、风格化短视频背景音,避免乐器混乱堆砌

高频使用

[Tempo]

以 BPM(每分钟节拍数)定义节奏速度,可搭配 Swing/Groove 等节奏类型,匹配风格与情绪

[Tempo: 110 BPM](中速,适配流行 / 民谣)、[Tempo: 75 BPM](慢速,适配抒情 / Lo-fi)、[Tempo: 140 BPM, Swing](140BPM + 摇摆节奏,适配爵士)、[Tempo: 90 BPM, Groove](90BPM + 律动节奏,适配嘻哈)

全场景,无论是快节奏的派对音乐、慢节奏的睡眠背景音,还是需律动的爵士 / 嘻哈,均需此标签定调

高频(110 BPM)

四、结构与技术类标签

标签名称

功能说明

典型示例

适用场景

备注

[Structure]

定义歌曲段落顺序(如 Intro→Verse→Chorus),可指定段落时长(如 Intro 5s),优化叙事逻辑与完整性

[Structure: Intro→Verse→Chorus→Bridge→Chorus→Outro](完整流行结构)、[Structure: Instrumental Intro (8s)](8 秒乐器前奏)、[Structure: Intro (5s)→Verse 1→Pre-Chorus→Chorus→Verse 2→Chorus→Bridge→Outro (3s)](带时长的细化结构)

追求完整结构的创作,如正式发行单曲、广告配乐、剧情向影视片段音乐,避免段落混乱

高频使用

[Mix]

控制整体混音质感,调整音色风格(复古 / 清晰)、空间感(Wide/Narrow),提升作品专业度

[Mix: Professional](专业清晰混音,适配多数正式作品)、[Mix: Lo-fi, Vinyl Crackle](低保真 + 黑胶杂音,适配复古风格)、[Mix: Cinematic Wide](电影感宽频,适配预告片)、[Mix: Vintage, 1960s Tape](60 年代磁带质感,适配复古流行)

需优化听感的正式作品,如发行级单曲、影视原声、品牌宣传音乐,避免混音粗糙

高频(Professional)

[Key]

指定音乐调式,大调(如 C Major)传递明亮 / 欢快,小调(如 A Minor)传递忧郁 / 细腻,影响和声走向与情绪适配

[Key: C Major](C 大调,明亮欢快,适合励志歌)、[Key: A Minor](A 小调,忧郁柔和,适合抒情歌)、[Key: D Major, Bright](D 大调 + 明亮感,适合阳光主题)、[Key: E Minor, Melancholic](E 小调 + 忧郁感,适合悲伤片段)

专业创作中匹配氛围与和声的场景,如情绪向歌曲、影视情绪片段配乐、主题性音乐

五、音效与氛围增强类标签

标签名称

功能说明

典型示例

适用场景

备注

[Sound FX]

添加自然 / 场景化音效,增强沉浸感,让音乐更贴合具体场景

[Sound FX: Birds chirping](鸟鸣,适合自然主题)、[Sound FX: Rain](雨声,适合治愈背景音)、[Sound FX: Applause](掌声,适合派对音乐)、[Sound FX: Coffee shop ambient](咖啡店环境音,适合休闲 Vlog)、[Sound FX: Thunder](雷声,适合史诗 / 悬疑场景)

场景化创作,如 ASMR 背景音、影视场景还原、主题性短视频配乐(如旅行、探店)

高频使用

[FX]

针对乐器或段落添加特效,强化听觉冲击(如失真)或过渡自然度(如渐入 / 渐出)

[FX: Fade Out](渐弱收尾,避免突兀结束)、[FX: Echo FX](全局回声,增强空间感)、[FX: Distorted Guitar Solo](吉他失真独奏,适合摇滚高潮)、[FX: Fade In](渐强开篇,适合抒情歌)

段落过渡或高潮强化场景,如歌曲开篇 / 收尾、乐器独奏、风格化段落(如电子乐 Drop)

高频(Fade Out)

标签组合避坑指南

  1. 风格与乐器冲突

❌ 错误:[Style: Folk] + [Instrumentation: Electric Guitar (Distortion)]

✅ 替代:[Style: Folk] + [Instrumentation: Acoustic Guitar, Harmonica]

原因:民谣的核心是 “质朴叙事”,依赖原声乐器(如木吉他、口琴)的细腻质感;而失真电吉他的高增益音色会掩盖这种细腻,还会注入摇滚的 “强烈冲击感”,彻底破坏民谣的 “原生态” 特质,导致风格割裂。

  1. 氛围与调式冲突

❌ 错误:[Vibe: Melancholic] + [Key: C Major]

✅ 替代:[Vibe: Melancholic] + [Key: A Minor]

原因:调式的音阶构成直接影响情绪 ——C 大调的三级音为 “E”(自然大调特性),整体音阶呈现 “明亮上扬” 的听感,无法传递忧郁;而 A 小调通过将三级音降为 “C”,形成 “柔和下沉” 的和声色彩,与 Melancholic(忧郁)的氛围需求完全匹配,能让情绪表达更精准。

  1. 节奏与风格冲突

❌ 错误:[Style: Lo-fi] + [Tempo: 140 BPM]

✅ 替代:[Style: Lo-fi] + [Tempo: 70 BPM]

原因:Lo-fi 的核心是 “松弛治愈”,目标是让听众放松,通常依赖 60-80BPM 的慢节奏,配合轻微的音量波动和背景杂音;140BPM 接近电子乐的快节奏,会让音乐产生 “紧张感”,与 “放松” 的核心需求相悖,甚至让听众感到烦躁,破坏氛围统一性。

  1. 人声与氛围冲突

❌ 错误:[Vibe: Intimate] + [Vocal Mix: Loud] + [Sound FX: Cheering]

✅ 替代:[Vibe: Intimate] + [Vocal Mix: Soft] + [Sound FX: Whispers]

原因:Intimate(私密)氛围的核心是 “贴近感”,需要模拟 “耳边倾诉” 的效果 ——Loud 人声会拉大与听众的 “距离感”,而 Cheering(欢呼)音效的嘈杂感会直接打破私密场景的安静;改用 Soft 人声(轻柔音量)+Whispers(耳语)音效,能强化 “近距离交流” 的沉浸感,完全贴合私密氛围需求。

  1. 结构与时长冲突

❌ 错误:[时长: 15s] + [Structure: Intro→Verse→Pre-Chorus→Chorus→Outro]

✅ 替代:[时长: 15s] + [Structure: Instrumental Intro (3s)→Chorus (10s)→Fade Out (2s)]

原因:15 秒的短时长仅够完成 “引入 - 核心 - 收尾” 的简洁逻辑,若强行塞入 5 个段落,每个段落会被压缩至 2-3 秒,旋律来不及展开、情绪来不及铺垫,听众会感到 “混乱无重点”;简化为 “短前奏(快速引入)+ 副歌(核心记忆点)+ 渐弱收尾(自然结束)”,既能突出核心旋律,又完全适配短视频、广告等短时长场景。

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐