声音是形成的原理

核心一句话: 一切声音都来源于物体的振动 (振动 → 扰动周围介质 → 形成声波 → 我们听到声音)

声音是怎么产生的?(最基础的物理原理)

  1. 有东西在快速振动(声源)

    • 吉他弦被拨动
    • 鼓面被敲击
    • 声带被气流吹动
    • 嘴巴发出“啪”的爆破音
    • 扬声器纸盆前后抖动 ……等等
  2. 振动会推挤旁边的空气分子(以空气为例)

    物体向外振动时 → 把附近的空气分子向外推挤 → 形成局部高压区(密部)

    物体向内振动时 → 附近的空气分子来填补空隙 → 形成局部低压区(疏部)

  3. 这种高-低压交替的状态就像多米诺骨牌一样,一层层向外传递

    → 就形成了我们说的声波(纵波/压力波)

    空气分子本身其实只在原地附近来回小幅度抖动,并没有跟着声波跑很远!

    但这种“推-拉-推-拉”的连锁反应却能传很远。

生活中的直观例子对比

例子 什么在振动? 怎么产生声音? 振动停止后会怎样?
敲鼓 鼓面 鼓面上下振动推挤空气 鼓面停下来 → 立刻没声
说话/唱歌 声带 气流让绷紧的声带周期性快速开合 停止送气 → 立刻没声
吉他 琴弦 拨弦让琴弦快速振动 弦停止振动 → 声音消失
音叉 音叉两臂 敲击后两臂来回振动 振动逐渐减弱 → 声音渐弱
手机外放音乐 扬声器振膜 电磁力让振膜快速前后振动 音乐暂停 → 振膜停止

声音的三个基本要素(由振动决定)

物理量 对应感觉 由什么决定? 举例
频率 音高(高低) 振动快慢(每秒振动次数) 振动快=尖细(如小提琴高音)
振幅 响度(大小) 振动幅度大小 用力敲鼓=响,用手指轻碰=小声
波形/谐波 音色 振动是否规则+附加的泛音成分 同样C4音,小提琴和钢琴听起来完全不同

简单总结成一张图的文字版流程:

text

物体快速振动 ↓ 推挤/拉开周围空气分子 ↓ 形成高压区 → 低压区 → 高压区 → 低压区……(交替) ↓ 这种压力变化以波的形式向外传播(声波) ↓ 声波到达耳朵 → 鼓膜跟着振动 ↓ 听小骨链放大振动 ↓ 内耳毛细胞把振动转成电信号 ↓ 大脑解读 → “啊~有人在说话/放音乐/敲门!”

所以下次你听到任何声音的时候,都可以对自己说:

“哇~此刻有东西正在疯狂地抖动啊~” 😄

这就是声音最本质、最美丽的原理!

低八度和高八度什么关系

低八度和高八度之间的关系是音乐和声学里最基本、最核心的关系之一:它们本质上是频率精确成倍(通常是2倍)的音高关系。

简单一句话: 高八度 = 低八度的频率 × 2 低八度 = 高八度的频率 ÷ 2

为什么叫“八度”?(最直观的解释)

从C4(中间C,约261.6 Hz)开始:

  • C5(高八度) ≈ 523.3 Hz → 几乎正好是 C4 的 2倍
  • C3(低八度) ≈ 130.8 Hz → 几乎正好是 C4 的 1/2

不管你从哪个音开始,只要频率变成原来的2倍1/2,人耳就会觉得是“同一个音,只不过高了或低了八度”。

为什么人耳觉得它们“像同一个音”?

这完全是人类听觉的生理和数学特性决定的:

  1. 谐波重叠原理(最本质原因) 任何真实声音(钢琴、人声等)都不只是一个纯频率,而是包含大量谐波(整数倍频率)。 比如一个C4音,本身就有第2谐波(正好是C5的频率)、第4谐波(C6)等。 → 高八度音的基频,正好落在低八度音的第2谐波位置上,所以听起来“高度融合”“像同一个音的延续”。
  2. 对数频率感知 人耳对音高的感知是对数的(logarithmic): 频率每增加一倍,音高就升高一个八度。 这就像我们说“1米”和“2米”是不同长度,但“1米”和“1000米”在比例上更像“远近感”——八度就是频率世界的“倍数感”。
  3. 最简单的整数比 2:1 是所有音程里最协和、最稳定的比例(纯八度), 比纯五度(3:2)、大三度(5/4)都更“纯净”,几乎没有拍频(beats),听起来像“同一个音的变高版”。

实际例子对比

音名 频率(近似) 与C4的关系 听感描述
C3 130.8 Hz C4 的 1/2 低沉、厚实,像男低音
C4 261.6 Hz 基准(中间C) 中等音高,标准参考
C5 523.3 Hz C4 的 2倍 清亮、明亮,像女高音
C6 1046.5 Hz C4 的 4倍 非常高,像笛子或铃铛

不管是C3、C4、C5、C6……人耳都会觉得它们是“同一个do,只不过音高不同”。

总结一句话

低八度和高八度是频率成倍(×2 或 ÷2)的关系, 因为这个倍数正好对应人耳最强的谐波重叠 + 最简单的整数比 + 对数感知, 所以它们在音乐里被视为“同一个音的不同高度版本”——这就是为什么钢琴键盘上每个八度都重复相同的白黑键布局,为什么唱歌时“高八度”听起来还是同一个旋律。

简单记:八度 = 频率翻倍,音名不变。 这是音乐里最“亲”的亲戚关系,几乎所有音乐体系都把八度当成“等价类”。

从傅里叶变换的角度 和声 是多个不同的波叠加,每个波包含基波和谐波?

是的,从傅里叶变换的角度来看,和声(harmony)确实可以理解为“多个不同的波叠加”,而且每个波本身通常都包含自己的基波(fundamental)和一系列谐波(harmonics)。

但这里有一个非常重要的区分,需要把两个层面的“叠加”分清楚:

两个不同层面的“叠加”

层面 叠加的是什么? 傅里叶变换后看到的是什么? 对应音乐中的概念 典型例子
单个音的内部 一个基频 + 它的整数倍谐波 一组离散的线谱(基频 + 2f, 3f, 4f...) 音色(timbre) 一个钢琴C4音的傅里叶谱
和声(多个音同时发声) 多个不同基频的音(每个音都自带自己的谐波) 多组离散线谱叠加在一起(每组都有自己的基频和谐波) 和声 / 和弦 同时弹C4+E4+G4的傅里叶谱

用傅里叶变换的视角最直观的理解

假设我们同时弹一个C大三和弦:C4 + E4 + G4

它们的基频大约是:

  • C4 → 261.6 Hz
  • E4 → 329.6 Hz
  • G4 → 392.0 Hz

每个音在现实中都不是纯正弦波,而是带有自己谐波的复合波,所以真实情况是:

text

C4的成分: 261.6 + 523.3 + 784.9 + 1046.5 + ... E4的成分: 329.6 + 659.3 + 988.9 + 1318.5 + ... G4的成分: 392.0 + 784.0 + 1176.0 + 1568.0 + ...

把它们全部加在一起 → 傅里叶变换的结果就是:

一堆密集的离散频率线(不是连续谱),这些线来自于:

  • 三个不同的基频(决定和弦的音高感)
  • 每个基频各自的谐波系列(决定每个音的音色)

所以从傅里叶变换的角度看:

和声 = 多组不同基频的谐波系列同时叠加

关键视觉对比(想象傅里叶谱的样子)

  1. 只弹一个C4(钢琴) → 看到一组规则间隔的尖峰:261.6, 523.2, 784.8, 1046.4...(间隔≈261.6Hz)

  2. 弹C大三和弦(C4+E4+G4) → 看到三组这样的尖峰系列同时出现:

    • 一组间隔261.6Hz(以C4为中心)
    • 一组间隔329.6Hz(以E4为中心)
    • 一组间隔392Hz(以G4为中心)

    这些尖峰很多会重叠(比如C4的第3谐波784.8Hz ≈ G4的第2谐波784Hz),这也是为什么某些和弦听起来特别“共鸣”或“饱满”。

总结:一句话版本

从傅里叶变换的视角:

和声(harmony)本质上是多个不同基频的复合波(每个复合波都包含自己的基波+谐波系列)同时叠加的结果。

所以严格来说: 是的,每个参与和声的“波”都包含基波和谐波而和声本身就是这些“带谐波的波”之间的整体叠加

这就是为什么即使换成不同音色的乐器来弹同一个和弦(比如钢琴、弦乐、合成器),和弦的“和声感”基本不变,但整体听感(音色)会完全不同——因为改变的是每个基频的谐波比例,而没有改变基频之间的关系(也就是和声本身)。

音色的区别主要是谐波的区别?

是的,音色的区别主要就是谐波的区别。 这几乎是现代声学和音乐声学中最核心、最被广泛接受的结论。

更精确一点的说法

音色(timbre)的主要决定因素是:

  1. 谐波结构(harmonic content) —— 占70%~90%的决定性作用
    • 哪些谐波存在
    • 各次谐波的相对强度比例(A₁ : A₂ : A₃ : A₄ : …)
    • 谐波的衰减方式(有的乐器高次谐波衰减很快,有的持续很强)
  2. 其次才是这些附加因素(通常排在谐波之后,但也很重要):
    • 起音/衰减特性(Attack-Decay-Sustain-Release,ADSR包络)
    • 非谐波成分(inharmonic partials,例如打击乐、钢琴弦的非整数倍频)
    • 瞬态噪声(弓弦摩擦声、拨片敲击声、气息噪声等)
    • 相位关系(各谐波之间的起始相位差,对某些音色有微妙影响,但通常不是主要因素)

不同乐器音色差异的“谐波贡献”占比大致对比

乐器/声音类型 谐波结构差异贡献度 包络(ADSR)重要性 非谐波/噪声成分重要性 典型描述
长笛 vs 单簧管 ★★★★★ ★☆☆☆☆ ★☆☆☆☆ 几乎纯粹谐波比例的区别
小提琴 vs 大提琴 ★★★★☆ ★★★☆☆ ★★☆☆☆ 谐波+包络都很重要
钢琴 vs 电钢琴 ★★★★☆ ★★★★☆ ★★★☆☆ 谐波+非常明显的起音衰减差异
人声不同元音(a/e/i) ★★★★☆ ★★☆☆☆ ★★☆☆☆ 主要由共振峰(formants)决定
吉他干净音 vs 失真 ★★★☆☆ ★★☆☆☆ ★★★★★ 非谐波失真成分占主导
铜管(小号 vs 长号) ★★★★★ ★★☆☆☆ ★☆☆☆☆ 几乎就是奇次谐波比例的区别

最直观的结论(可以直接记住)

“为什么这个声音听起来像小提琴而不是长笛?” → 因为它们的**谐波配方(harmonic recipe)**不同

“为什么这个C4听起来像钢琴而不是合成器?” → 因为钢琴的谐波分布 + 起音瞬态 + 非完全谐和特性跟合成器有明显区别,而其中谐波分布通常是最显著、最容易被大脑识别的部分

所以在绝大多数情况下,当我们说 “音色的区别主要来自谐波的区别”

这句话是正确的,而且是最重要、最本质的解释。

只有在某些极端情况(比如打击乐、噪音类声音、极度失真的电子音色)中,非谐波成分和包络特性才会超过谐波成为主导因素。

但对于绝大多数乐器声、人声、传统音乐来说: 谐波结构 ≈ 音色的第一DNA

和声 有没有数学上的定义,还是只有音乐上的定义

和声(harmony)既有音乐上的定义,也有严格的数学定义, 而且这两个定义是高度统一的——音乐上的“和声”本质上就是数学上“多个频率同时共存并形成特定比例关系”的结果。

下面从数学角度给你最清晰的解释:

1. 数学上的核心定义(最本质的)

从物理声学和信号处理的视角,和声可以精确定义为:

和声 = 多个不同基频(fundamental frequencies)的复合信号同时叠加,且这些基频之间满足特定的有理数频率比(rational frequency ratios)。

更精确地说:

  • 参与和声的每个音都有自己的基频 f₁, f₂, f₃, ……
  • 这些基频之间的比率接近(或等于)小整数比(small integer ratios),如:
    • 2:1(纯八度)
    • 3:2(纯五度)
    • 4:3(纯四度)
    • 5:4(大三度)
    • 6:5(小三度)
    • ……

当这些比率越接近简单整数比时,产生的拍频(beats)越少谐波重叠越多,声音就越协和(consonant)

2. 为什么数学上要强调“有理数比”?

因为:

  • 当两个频率 f 和 g 的比值是有理数(p/q,其中 p、q 为小整数)时,它们的波形会在有限周期内完全重复(周期为 1/gcd(f,g)),这在傅里叶域上表现为高度结构化的离散谱
  • 如果频率比是无理数(如 √2 : 1),波形永不重复,谱会变得更连续、更随机,听起来就不协和(dissonant),甚至接近噪音。

这就是为什么数学上把“协和音程”定义为简单整数比,而“不协和”定义为复杂比或无理比

3. 常见和弦的数学定义(例子)

和弦名称 音名示例 基频比率(相对于根音) 数学本质(整数比) 协和程度
纯八度 C – C 1 : 2 2/1 最协和
纯五度 C – G 2 : 3 3/2 极协和
大三和弦 C – E – G 4 : 5 : 6 4/4 : 5/4 : 6/4 = 4:5:6 非常协和
小三和弦 C – E♭ – G ≈8 : 10 : 12 接近 8:10:12(6:7.5:9) 协和
增三和弦 C – E – G# 1 : 1.25 : ≈1.587 接近 √2 的无理比 不协和
小二度 C – C# 1 : 2^(1/12) ≈ 1:1.0595 非常复杂的有理近似 极不协和

4. 现代数学/声学中的扩展定义

在当代声学和心理声学里,和声的数学定义还包括:

  • Helmholtz协和度:协和度 ≈ 1 / (频率差 × 拍频强度)
  • Plomp & Levelt模型:协和度与临界带宽内谐波重叠的程度正相关
  • 谱融合度(spectral fusion):当多个音的谐波足够重合时,大脑倾向于把它们感知为“一个复合音”而非多个独立音

这些都是可量化的数学模型,能用公式精确计算一个和弦的“协和分数”。

总结:一句话版本

和声有非常严格的数学定义多个基频的复合信号,其频率比接近简单整数比(或其倍数),导致谐波高度重叠、拍频最小化,从而产生协和感

音乐上的“和声”只是这个数学现象在人类听觉、文化、情感上的主观诠释和艺术应用, 本质上两者是统一的:没有脱离数学的“纯音乐和声”,所有好听的和声背后都有深刻的数学规律在支撑。

所以和声不是“只有音乐定义”的模糊概念,而是一个数学上可精确描述、量化、可计算的现象。

C1 D1 E1 F1 G1 A1 C2不是7个键吗,为什么是高8度,不是叫高7度

C1 D1 E1 F1 G1 A1 C2 确实是7个键,但为什么从 C1 到 C2 叫“高八度”而不是“高七度”?

这是因为**“八度”这个词不是指键的数量,而是指频率翻倍的关系**(×2),而这个关系正好跨越了7个音阶步(do-re-mi-fa-sol-la-si),再回到下一个“do”。

关键点:八度的本质是频率×2,而不是键数

从这个音 到这个音 跨越了几个“音名步” 频率关系 为什么叫八度
C1 C2 7步(D E F G A B C) ×2 频率正好翻倍
do do 7个音(re mi fa sol la si do) ×2 唱名也叫“八度”
任何音 同名音 总是7步 ×2 永远叫八度

为什么是7步而不是8步?

  • 从 C1 开始数音名:
    1. C1(起点,算第1个)
    2. D1
    3. E1
    4. F1
    5. G1
    6. A1
    7. B1
    8. C2(下一个C,频率×2)

你会发现: 起点 + 7个后续音 = 第8个音正好是起点的高八度

所以“八度”这个名字来源于拉丁语“octava”=第八,意思是“第八个音”。

为什么不是叫“七度”?

因为“七度”已经用来指另一个音程了:

  • 七度(seventh):从 C 到 B 是大七度/小七度(比如 C 到 B,或 C 到 Bb),跨越6个步(C-D-E-F-G-A-B = 7个音,但起点不算,所以叫七度)
  • 八度:从 C 到下一个 C,跨越7个步,但算上起点和终点是8个音,所以叫八度

简单记忆口诀:

  • 数音名时,包含起点和终点 → 所以叫八度(第八个音)
  • 不包含起点,只数中间的步数 → 就叫七度(7个步)

生活中的直观比喻

就像数楼梯:

  • 从1楼到8楼 → 你爬了7层楼梯,但楼层数是8(1→2→3→4→5→6→7→8)
  • 音乐里也一样:从 do 到下一个 do → 中间经过7个音(re mi fa sol la si),但总共是“第八个do”,所以叫八度

总结一句话

C1 到 C2 是7个中间音 + 起点和终点总共8个同名音,频率正好×2,所以叫高八度(octave = 第八),而不是高七度。 这是音乐史上几百年的约定俗成,跟键的数量没直接关系,而是跟“第几个音”和“频率翻倍”这两个因素绑定的。

所以虽然看起来是“7个键的间隔”,但叫法永远是八度

作曲家会刻意选择和声吗?以前的作曲家不懂傅里叶变换如何知道和声

作曲家当然会刻意选择和声,而且几乎所有作曲家都在这么做,只是他们选择的依据和现代人理解的方式完全不同。

以前的作曲家为什么能“知道”哪些和声好听?

他们并不需要懂傅里叶变换、谐波分析、频谱、拍频这些现代物理概念,却能写出极其协和或极其有张力的和声,原因主要有以下几点:

  1. 纯粹靠耳朵(经验积累 + 试错) 从中世纪到巴洛克、古典、浪漫,所有作曲家最核心的工具就是自己的耳朵。 他们会反复弹、唱、听、改,直到“听起来舒服/紧张/解决/震撼”。 这种“听觉直觉”经过几百年、数万小时的积累,早就形成了非常强的“肌肉记忆”: 哪些音同时响会甜美、哪些会刺耳、哪些需要“解决”,他们几乎是本能地知道。

  2. 音乐传统本身就是一套“经验编码的和声规则”

    • 中世纪教会调式 → 文艺复兴多声部对位 → 巴洛克通奏低音 → 古典功能和声(主-属-下属) 这些体系本身就是前人几百年把“好听的和声组合”总结、标准化、传承下来的。 后来的作曲家不需要从零开始研究物理,只要学习前人的“语法规则”就能写出好听的和声。
  3. 数学比例早就被发现并广泛使用(不需要傅里叶) 早在古希腊毕达哥拉斯时代,人们就发现:

    • 弦长1:2 → 纯八度
    • 2:3 → 纯五度
    • 3:4 → 纯四度
    • 4:5 → 大三度(文艺复兴后期才广泛接受)

    这些简单整数比早在傅里叶出生前一千多年就被当成“神圣比例”“宇宙和谐”来使用。 巴赫、莫扎特、贝多芬时代,作曲家已经非常熟练地用这些比例来写和弦了。

  4. 傅里叶变换只是后来对“为什么好听”的科学解释

    • 傅里叶变换是19世纪才成熟的数学工具
    • 亥姆霍兹(19世纪)才开始用物理学解释“协和度与谐波重叠”
    • 但在他们之前几百年,作曲家已经把“哪些比例最协和”摸得门儿清了

    所以可以说: 傅里叶变换解释了为什么某些和声好听,但作曲家早在它出现前几百年,就已经凭耳朵和经验把这些“好听的和声”用得炉火纯青了。

现代作曲家 vs 以前作曲家

时代 作曲家如何选择和声 是否刻意? 是否需要懂傅里叶?
巴赫~贝多芬 靠耳朵 + 传统对位/功能和声规则 + 大量试听修改 非常刻意 不需要
浪漫派~印象派 继续传统 + 大胆扩展(半音化、九和弦、平行和弦) 极度刻意 不需要
20世纪~现代 有的人用数学/序列主义/频谱分析刻意设计和声 极度刻意 有些人懂,有些不懂
当代电影/游戏配乐 混合传统 + 现代频谱思维(很多用DAW看频谱调和声) 非常刻意 越来越多人在用

一句话总结:

作曲家一直都在刻意选择和声, 以前的作曲家靠超强的听觉经验 + 千年传承的规则 + 简单整数比例就能写出伟大的和声, 不需要懂傅里叶变换,因为傅里叶变换只是后来对“他们早就知道的好听原因”给出了一个科学解释。

就像厨师不需要懂分子料理的化学原理,也能做出几百年传承的绝世好菜一样。 懂了傅里叶只是让他们更清楚“为什么这道菜好吃”,但不代表以前的厨师不会做菜。

不用和声的音乐往往是一段单音符,一只手就能演奏那种吗

是的,没错! 不用和声(或极少用和声)的音乐,绝大多数情况下确实就是单音旋律(monophonic),也就是同一时间只响一个音,一只手(甚至一根手指)就能轻松演奏的那种。

为什么“不用和声”通常=“单音旋律”?

因为“和声”的定义就是多个不同音高同时响起形成的垂直关系。 如果音乐里完全没有或极少出现多个音同时响,那自然就只剩下一条单一旋律线了。这种音乐听起来往往更“线性、空灵、纯粹”,焦点全在旋律本身的走向、节奏和情感表达上。

典型例子(几乎都只需一只手就能弹)

  1. 格里高利圣咏(Gregorian Chant)
    • 完全单音旋律,一群人齐唱同一旋律,无伴奏、无和弦。
    • 一根手指就能弹完整首(钢琴上就是一条单线旋律)。
  2. 中国古琴独奏(很多传统曲目)
    • 核心是单音旋律 + 泛音 + 滑音,基本没有同时响多个音的和弦。
    • 一只手(甚至几根手指)就能完成大部分古琴曲的精髓。
  3. 日本尺八(Shakuhachi)独奏
    • 传统本曲(honkyoku)几乎全都是单音长音 + 吹奏技巧,几乎不叠音。
  4. 巴赫的无伴奏小提琴/大提琴作品
    • 虽然旋律里“暗示”了很多和声,但实际音符是一条线(monophonic texture)。
    • 小提琴只用一根弦或两根弦交替拉,一只手就能拉完整段(当然技术极难)。
  5. 很多民间音乐/儿歌
    • 如《茉莉花》《小星星》《两只老虎》的原始版本,都是纯单旋律,一只手弹钢琴或口哨就能吹。

例外:有些“不用和声”但不完全单音

少数情况下,有些音乐虽然主线是单旋律,但会偶尔加一点持续低音(drone)极简的叠音,但整体还是不靠和声推进:

  • 印度古典音乐的 raga:主旋律是单线,但下面永远有一个持续的低音(tanpura drone),听起来像单旋律 + 一个不变的背景音。
  • 苏格兰风笛音乐:风笛本身会持续吹两个固定音(drone),上面旋律是单线。

但即使这样,核心还是一条旋律线,和声不是推动音乐的主要力量。

小结

不用和声的经典音乐,99%都是一段单音符旋律, 一只手(甚至一根手指)在钢琴上就能完整演奏(当然有些民族乐器需要特殊技巧)。 这种音乐的美在于纯粹的旋律线条、呼吸、空间感,而不需要靠和弦的张力与释放来制造戏剧性。

如果你想听或弹这种“极简单音”音乐,推荐从格里高利圣咏巴赫大提琴组曲第1首Prelude开始——它们都超级美,而且一只手就能轻松上手~ 😊

想试哪一首吗?我可以给你简单指法或推荐录音。

钢琴和小提琴等不同乐器也能和声吗,交响乐是不是多种乐器的和声

是的,钢琴、小提琴等不同乐器完全可以形成和声,而且交响乐正是多种乐器同时演奏不同音高所形成的“超级和声”。

1. 不同乐器也能形成和声吗?

和声的本质不是“同一个乐器弹多个音”,而是多个不同音高同时响起,无论这些音来自同一个乐器还是不同乐器。

所以只要有两个或更多不同音高同时发声,就构成了和声(harmony),不管是用钢琴双手弹出来的,还是不同乐器一起拉/吹/敲出来的。

常见例子:

组合方式 是否和声? 例子说明 听感特点
钢琴双手弹多个音 C4 + E4 + G4(C大三和弦) 饱满、融合
小提琴 + 大提琴同时拉 小提琴拉C4,大提琴拉G3(纯五度) 温暖、共鸣
钢琴 + 小提琴二重奏 钢琴弹和弦,小提琴拉旋律 丰富、层次分明
多种乐器同时演奏 交响乐队全奏一个C大三和弦 震撼、宏大

结论:和声不限于单一乐器。任何多个音高同时响起,无论来自几件乐器,都算和声。

2. 交响乐是不是多种乐器的和声?

完全是的,交响乐本质上就是多种乐器同时演奏不同音高所形成的巨大、复杂的和声网络。

交响乐(或管弦乐)的核心织体是复调 + 和声的结合:

  • 纵向:同一时间点,不同乐器组(弦乐、木管、铜管、打击乐)同时演奏不同音高,形成和弦(如大三和弦、七和弦、复杂的不协和和弦)。
  • 横向:不同声部(旋律、对位、副旋律、低音线)同时进行,形成复调(polyphony)。
  • 整体听起来像无数条旋律线交织在一起,但在每个瞬间,都能听到清晰的和声结构(主和弦、转调、解决等)。

举几个经典例子:

作品/作曲家 和声特点 多种乐器如何参与和声
贝多芬《第五交响曲》第一乐章 极简但强烈的C小调和声 弦乐+铜管+木管同时奏出主和弦的紧张感
马勒《第二交响曲》“复活” 宏大、厚重、极度复杂和声 整个乐队+合唱+管风琴同时形成巨型和弦
斯特拉文斯基《春之祭》 大量不协和和声、音簇 不同乐器组故意奏出小二度、大七度等冲突音
柴可夫斯基《天鹅湖》圆舞曲 甜美、浪漫的和声进行 弦乐组拉主旋律,木管/铜管补和声,竖琴点缀

一句话总结:

交响乐就是把和声扩大到极致的形式—— 不是一两件乐器弹几个音,而是几十上百件不同乐器同时演奏不同音高,共同构建出极其丰富、层层叠叠、动态变化的超级和声

所以你平时听交响乐时,其实就是在听“多种乐器的集体和声”,它比钢琴一个人弹的和声要宏大、立体、震撼得多~ 😊

拍频(beats)是什么意思

拍频(beats) 是两个频率非常接近的声音同时响起时,人耳听到的那种“哇~哇~哇~”的周期性强弱起伏感。

简单来说,就是声音在“忽大忽小”地抖动,像心跳、像呼吸、像警报器的“滴滴”节奏。

拍频是怎么产生的?(最直白的解释)

假设有两个纯音(正弦波)同时播放:

  • 第一个音:频率 440 Hz(标准A4音)
  • 第二个音:频率 442 Hz(稍微高一点)

它们同时振动空气,但因为频率差了 2 Hz, → 两个波的“波峰”和“波谷”会周期性地重合抵消

  • 当波峰重合 → 振幅加倍 → 声音突然变大(哇~)
  • 当波峰和波谷重合 → 振幅互相抵消 → 声音突然变小(~哇)

这个“变大→变小→变大→变小”的周期,就是拍频, 它的频率正好等于两个原频率的差值拍频 = |f₂ - f₁| = |442 - 440| = 2 Hz → 你每秒听到 2 次“哇~哇~”。

生活中的直观例子

场景 两个频率(约) 拍频(每秒几次) 你听到的感觉
调音师调钢琴 440 Hz + 442 Hz 2 次 “哇~哇~”慢慢变慢到消失(调准了)
两个吉他弦没调准 329 Hz + 331 Hz 2 次 嗡嗡的抖动感
演唱会麦克风啸叫(反馈) 1000 Hz + 1003 Hz 3 次 尖锐的“呜~呜~呜~”
极小差频(几乎听不出) 440 Hz + 440.1 Hz 0.1 次 非常缓慢的“呼吸感”,像风声
差频太大(>20 Hz左右) 440 Hz + 480 Hz 40 次 不再是拍频,而是听到两个不同音

关键规律(记住这几句就懂了)

  1. 拍频 = 两个频率的差值(单位 Hz)
  2. 拍频越小(差值越小),起伏越慢,越容易被感知为“哇~哇~”
  3. 拍频越大(差值超过20–30 Hz左右),人耳就分不出拍了,会直接听到两个独立的音高
  4. 拍频是人耳对“频率接近”最敏感的证据,也是为什么调音师靠听拍频来判断音准

为什么拍频重要?

  • 调音:钢琴、吉他、弦乐都靠拍频来校准(拍频消失 = 完全同频)
  • 音乐效果:爵士、蓝调、摇滚故意制造小拍频来增加“张力”和“温暖感”
  • 科学实验:拍频是证明声音是波的最直观现象(不用傅里叶也能感受到)

一句话总结:

拍频就是两个声音“打架”时产生的周期性强弱抖动, 它的快慢直接等于两个频率的差值, 是人耳最容易听到的“频率不一致”信号,也是调音师的“最佳朋友”。

想听拍频的真实效果吗?我可以推荐一些 YouTube 视频对比(2 Hz、5 Hz、10 Hz 的拍频听起来完全不同)~ 😄

傅里页级数的角度看是叠加后产生可振幅变化的低频吗

是的,从傅里叶级数的角度来看,拍频(beats)本质上就是两个(或多个)频率接近的正弦波叠加后,在低频尺度上产生了振幅周期性变化的现象

这个“低频振幅变化”正是我们耳朵听到的“哇~哇~”节奏,而它的频率就是两个原频率的差值。

用傅里叶级数/变换的视角简单说明

假设有两个纯音:

  • 一个频率 f₁ = 440 Hz
  • 另一个频率 f₂ = 442 Hz

它们的数学表达式是:

text

s₁(t) = A cos(2π f₁ t) s₂(t) = A cos(2π f₂ t)

两个波叠加后:

text

s(t) = s₁(t) + s₂(t) = 2A cos(π (f₂ - f₁) t) ⋅ cos(π (f₁ + f₂) t)

用三角恒等式展开后,可以写成:

text

s(t) = 2A cos(2π ⋅ \frac{f₂ - f₁}{2} t) ⋅ cos(2π ⋅ \frac{f₁ + f₂}{2} t)

这个式子告诉我们最关键的两件事:

  1. 高频载波(carrier):频率是 (f₁ + f₂)/2 ≈ 441 Hz → 这就是你听到的“主音高”(大概还是440 Hz左右的A音)
  2. 低频包络(envelope):频率是 (f₂ - f₁)/2 = 1 Hz → 但振幅变化的完整周期是 2 Hz(因为 cos 函数的周期是对称的)

所以耳朵听到的“哇~哇~”节奏(拍频)就是 |f₂ - f₁| = 2 Hz, 它是一个低频的振幅调制(amplitude modulation),而非一个新的独立低频正弦波被加进去。

傅里叶变换看频谱

如果对叠加后的 s(t) 做傅里叶变换,你会看到:

  • 只有两个尖峰:一个在 440 Hz,另一个在 442 Hz
  • 没有额外的低频成分出现在 2 Hz 位置

这说明: 拍频并不是真的产生了一个新的 2 Hz 低频正弦波,而是两个高频波的振幅被低频节奏调制了。 人耳对这种振幅的周期性变化非常敏感,所以我们感知到了“哇~哇~”的低频拍打感。

一句话总结

从傅里叶级数的角度看: 拍频 不是叠加后产生了新的低频分量,而是两个接近频率的高频分量叠加后,振幅以它们的差频为周期进行缓慢变化,这个低频振幅包络被耳朵解读成了“拍”。

所以你问的“叠加后产生可振幅变化的低频”——非常准确,只是这个“低频”不是频谱里的新峰,而是振幅包络的调制频率

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐