声学基础与理论

大脑如何“听见”空间？揭秘回声与混响背后的声学工程

本文首发于微信公众号「声学号角」作为声学工程师，我们每天都在与声音的各种形态打交道。但有两个词，尽管是基础中的基础，却时常在非专业领域被混为一谈，甚至在我们的日常交流中也可能出现不精确的表达。它们就是——回声 (Echo) 与混响 (Reverberation)。它们绝非同义词。精确理解并区分二者，不仅是专业素养的体现，更是我们进行声场设计、音频处理和产品研发的基石。今天，我们就从物理本质、工程应用到感知奥秘，彻底解构这对最熟悉也最容易被误解的“声音兄弟”。 Part 1：本质之别——离散的重复 vs 融合的尾音让我们用一个经典的场景来做最直观的区分： • 回声 (Echo)：想象你站在广阔的山谷中大喊一声“喂——”，几秒钟后，你会清晰地听到一个或几个延迟、分离、可辨的“喂——”从远处的山崖传来。这就是回声。它的关键特征是离散和可辨识。从技术上讲，当声源发出的直达声与第一个反射声之间的时间延迟大于50ms（大约对应17米的传播距离）时，人耳就能将其分辨为两个独立的声音事件，即回声。 • 混响 (Reverberation)：现在，将场景切换到一座宏伟的巴洛克式教堂。你拍一下手，声音并不会像在山谷中那样产生清晰的重复，而是瞬间被一个饱满、浓密、平滑延续并逐渐衰减的“声音尾巴”所包裹。你无法分辨出任何一次单独的反射声，因为成千上万次来自四面八方的反射声已经密集地交织在一起。这就是混响。它的核心特征是密集、融合与持续衰减。 Part 2：物理溯源——从反射路径到声场特性从物理机制上看，二者的差异源于反射界面的数量、距离和材质特性。回声的形成通常依赖于单一或少数几个距离较远、尺寸巨大的强反射面，例如山崖、大型建筑外墙或空旷体育馆的对面看台。声波的反射路径相对简单、纯粹。混响的形成则复杂得多，它是一个封闭空间内声场能量建立和衰减的完整过程。当声源在室内发声，声音会经历： 1. 直达声 (Direct Sound)：最先到达听者。 2. 早期反射声 (Early Reflections)：紧随其后的几次反射声，它们提供了关于空间尺寸、形状和听者与声源相对位置的关键信息。 3. 晚期反射/混响声 (Late Reflections/Reverberation)：经过无数次反射后，声波能量被充分扩散，形成一个统计上均匀的、逐渐衰减的弥散声场（Diffuse Field）。空间的体积、几何形状以及表面吸声系数是决定混响特性的三大核心要素。我们常用混响时间 (Reverberation Time, RT60)——即声能衰减60dB所需的时间——来定量描述一个空间的混响强度。一个高反射性（如石材、玻璃）的大空间（如教堂）RT60很长，而一个高吸声性（如地毯、窗帘）的小空间（如录音棚）RT60则非常短。 Part 3：工程应用——创造与控制的艺术在声学工程和音频制作领域，回声和混响是我们手中强大的“调色板”。 • 人工回声 (Delay/Echo)：在音乐制作中，我们使用“延迟 (Delay)”效果器来精确地复刻回声效果。它可以用来创造节奏感（如U2乐队吉他手The Edge的标志性音色），或者为人声增加一种空灵、遥远的感觉。工程师可以精确控制延迟时间、反馈次数（重复次数）和干湿比（原始信号与效果信号的混合比例）。 • 人工混响 (Reverb)：混响效果器则更为复杂和精妙。它的目标是模拟特定声学环境，为“干”的音轨（如在吸声良好的录音棚里录制的人声）赋予空间感和融合度。无论是模拟明亮的“房间 (Room)”、温暖的“音乐厅 (Hall)”还是复古的“板式 (Plate)”混响，恰当的Reverb能让声音听起来更自然、更平滑、更具沉浸感。它能将多个独立的音轨“粘合”在一起，仿佛它们本就同处于一个真实空间。然而，这也是一把双刃剑。过度的、不合适的混响是音频制作的灾难，它会使声音细节模糊、清晰度下降，导致整体混音变得“浑浊”。作为工程师，我们的挑战在于根据音乐风格和表达需求，选择并精调混响参数（如RT60、预延迟、扩散度等），在“清晰度”与“空间感”之间找到完美的平衡。 Part 4：感知奥秘——大脑的空间解码器回声与混响的意义远超物理现象本身，它们是我们大脑感知和理解三维空间的核心线索。这套内置于我们听觉系统中的“空间解码器”是历经千万年演化而来的生存本能。大脑通过精妙地分析直达声和反射声序列的时间差、强度、频率内容和空间来源，来构建一幅关于周边环境的“听觉地图”。 • 直达声告诉我们声源的方向和大致距离。 • 早期反射声勾勒出空间的轮廓、大小和材质。 • 混响则填充了整个空间的氛围感和“体积感”。正因如此，艺术家和工程师才能“欺骗”或“引导”我们的大脑。通过在电影、游戏或音乐中精心设计回声与混响，我们可以在听众的脑海中构建出任何虚拟空间——从压抑狭窄的潜艇内部，到广袤无垠的星际空间——从而引导其产生特定的情绪，实现沉浸式体验。 ...

心理声学的“时间魔法”：一文读懂哈斯效应，重塑听觉焦点

本文首发于微信公众号「声学号角」你可能遇到过这样的场景：在一个大型会议室里，虽然场地后方和两侧都安装了辅助音箱，但听众的感觉却是声音始终来自于前方的音箱，而不是头顶或侧面的音箱。这背后，就是我们今天要深入探讨的主角——哈斯效应（Haas Effect），也被称为先行效应（Precedence Effect）。这不仅仅是一个有趣的心理声学现象，更是我们用于驾驭声场、塑造空间感的强大工具。一、什么是哈斯效应？不仅仅是“先到为主” 哈斯效应描述了人耳在处理来自不同方向、但内容相同的声音时的一个基本听觉规律。 1949年，Helmut Haas的研究指出：当两个相同的声音信号先后到达听音者耳朵时，如果时间延迟（Δt）在一定范围内，人耳会倾向于将这两个声音“融合”成一个单一的声像，而这个声像的方向由最先到达的那个声音决定。这个定义包含三个核心要素：先行声、延迟声和时间差Δt。根据时间差的不同，听觉感知会经历几个截然不同的阶段：融合区 (Δt = 0-5ms): 两个声音被完全融合成一个声音。声像位置由先行声主导，但随着延迟声的延迟量和电平增加，声像会略微向延迟声的方向偏移，并且声音听起来会更“饱满”和“宽广”。回声阈值区 (Δt ≈ 5-35ms): 听众依然能感知到单一的声像，其位置仍由先行声决定。但是，延迟声开始作为一种“空间感”或“混响感”被感知，它为直达声增添了“厚度”和“立体感”，但还不会被识别为独立的回声。这正是建筑声学中“早期反射声”的美妙之处。回声感知区 (Δt > 35-50ms): 大脑无法再将两个声音融合。延迟声被清晰地感知为一个独立的回声（Echo），从而破坏了声像的单一性和定位感。二、哈斯效应的背后：大脑的“生存算法” 为什么我们的大脑会如此处理声音？这其实是一种在自然选择中形成的生存本能。在自然环境中，一个声源发出的声音除了直接传到我们耳朵（先行声），还会经过地面、墙壁、树木等障碍物反射后才到达（延迟声）。为了快速、准确地判断声源（例如猎物或天敌）的真实位置，我们的大脑进化出了一套高效的“算法”：优先采信第一个到达的声波所携带的方向信息，并适当忽略后续的反射声干扰。这个机制确保了我们在复杂环境中定位的准确性，而哈斯效应正是这一古老生存智慧在心理声学上的体现。三、从理论到实践：声学工程师如何“利用”哈斯效应？理解理论是为了更好地应用。哈斯效应在现代电声工程中无处不在，尤其是在以下几个领域： 1. 大型场馆的扩声系统设计这是哈斯效应最经典、最重要的应用场景。在音乐厅、剧院、体育场等大型空间，为了保证后场听众也能获得足够的声压级和清晰度，必须使用延时音箱（Delay Towers）或补声音箱（Fill Speakers）。错误的做法：所有音箱（主扩和延时）同时发声。结果是，后场听众会先听到离自己更近的延时音箱的声音，感觉声音是从头顶或侧方来的，声像与舞台上的表演者完全脱节，体验极差。正确的做法：利用哈斯效应，通过DSP（数字信号处理器）为延时音箱施加一个精确的延时。延时时间的计算原则是：延时量 = (延时音箱到听众的距离 - 主扩音箱到听众的距离) / 声速 + (10~20ms) 这样一来，来自主扩音箱的先行声会先于延时音箱的延迟声到达听众耳朵。根据哈斯效应，听众的听觉系统会“忽略”延时音箱的物理位置，将声像牢牢地“拉”回到舞台上，同时又能享受到延时音箱所补充的声能和清晰度。这额外增加的10-20ms，是为了确保一个稳定、无偏移的声像定位。 2. 立体声场与沉浸式音频在立体声重放中，一个稳定的“幻象中间声道”（Phantom Center）的形成，同样离不开哈斯效应。当左右两个音箱以相同的电平和时间播放相同信号时，我们在正中间感知到声源。如果一个声道的信号有微小的延迟（通常在1ms以内），声像就会向先发声的那个声道偏移。录音师和混音师正是利用电平差（ILD）和时间差（ITD）的精妙组合，在二维的立体声场中创造出乐器前后左右的层次感和定位感。在杜比全景声（Dolby Atmos）等沉浸式音频系统中，对上百个音频对象（Objects）的实时渲染，更是将哈斯效应的应用推向了极致。系统需要精确控制每一个音箱的发声时间和电平，才能让听众在三维空间中感知到精确的声音定位和移动轨迹。 3. 建筑声学设计在音乐厅或录音棚的设计中，建筑师和声学顾问会有意设计墙面和天花的形状，以产生有益的“早期反射声”。这些在直达声之后5-30ms内到达的反射声，正好落在哈斯效应的融合区内。它们不会被感知为回声，反而能极大地增强声音的丰满度、响度和空间包围感（Envelopment），让听感更自然、更具沉浸感。五、总结与思考哈斯效应，这个源于半个多世纪前的心理声学发现，至今仍是电声工程领域最核心、最实用的指导原则之一。它告诉我们，听众的感知并非完全由物理测量决定，心理声学在其中扮演着至关重要的角色。 ...

声波基础特性仿真动态示意

本文首发于微信公众号「声学号角」声波反射声波相消干涉，ANC主动降噪的基础原理声波衍射方形音箱边缘声波衍射球形音箱边缘声波衍射声波多普勒效应

频响完美 ≠ 听感优秀！被你忽略的“相位”，正是低音清晰度的命脉

本文首发于微信公众号「声学号角」作为声学工程师，我们每天都在和各种“曲线”打交道。其中，频率响应曲线（Frequency Response）无疑是大家最熟悉、最看重、也投入最多精力去“拉平”的一条。你是否也曾经历过这样的“至暗时刻”：经过通宵达旦的调试，音箱的频响曲线终于在消声室里被驯服得像一条水平线，堪称完美。你满意地保存了数据，准备接受耳朵的检阅。然而，一开声，心就凉了半截——低音含混不清，鼓点拖泥带水，贝斯和底鼓糊成一团，毫无“拳拳到肉”的冲击力。整个声音听起来“慢”了半拍，缺乏活力和瞬态细节。明明曲线无可挑剔，为什么听感却如此糟糕？问题很可能出在一个被我们下意识忽略，但却对音质有决定性影响的参数上——相位（Phase）。误区：频响决定一切长期以来，行业内存在一种惯性思维：只要频响曲线平直，音质就不会差。这在一定程度上是对的，平直的频响是高保真声音的基础。但它绝不是全部。频率响应描述的是一个系统在稳定状态下，对不同频率正弦波的振幅响应。它告诉我们高、中、低频的能量分布是否均衡。然而，音乐信号远非稳态的正弦波，而是由大量包含了丰富谐波和瞬态信息的复杂波形构成。鼓点的敲击、琴弦的拨动、人声的齿音… 这些都是在极短时间内发生、又极快消失的瞬态事件。要准确地重放这些瞬态信号，除了保证各频率分量的“量感”（振幅）正确外，更要保证它们“步调一致”地在正确的时间到达你的耳朵。而决定这个“步调”的，就是相位。真正的“元凶”：相位不一致性简单来说，相位描述的是一个波形在特定时间点所处的振动状态。在多单元扬声器系统中（例如最常见的两分频音箱），我们最关心的就是高音单元和低音单元发出的声音，在分频点附近的相位关系。为了让高、低音单元各司其职，我们需要使用分频器（Crossover）将信号一分为二。然而，任何模拟或IIR数字分频器，在对振幅进行滤波的同时，都不可避免地会引入相位偏移。以一个典型的2阶Linkwitz-Riley分频器为例，在分频点处，高通和低通滤波器都会产生90度的相移，两者叠加后，低音单元的信号相对于高音单元的信号，会产生180度的相位差。这意味着，在分频点频率，当高音单元的振膜向外推动时，低音单元的振膜正在向内拉动。图中红色和蓝色分别为高低音的幅度响应，黑色为整体幅度响应，黑色虚线为整体相位响应虽然通过反转其中一个单元的极性，可以在声学上实现同相叠加，让频响曲线看起来是平的（不调整分频点曲线是凸的，调整分频点后可以调平），但这只是一个“稳态”的假象。这种相位失真所带来的时间延迟问题，已经悄然埋下了祸根。如何“看穿”时间的延迟？瞬态响应与群延时相位失真对听感最直接的影响，体现在时间域上。我们有两个关键的工具来衡量它： 1. 脉冲/阶跃响应 (Impulse/Step Response) 一个理想的系统，在输入一个脉冲信号后，应该输出一个完美的脉冲。但在有相位失真的系统中，输出的脉冲会被“拖尾”和“振铃”，能量在时间上被分散了。阶跃响应（Step Response）则更直观，一个相位一致性好的系统，其阶跃响应的前沿会非常陡峭，像一把尖刀；而相位差的系统则会呈现一个缓慢、振荡的斜坡。这个“缓慢”的响应，正是你听到的“糊”和“慢”的物理根源。它意味着不同频率的声音没有同时到达，瞬态信号的起始和结束都被模糊化了。 2. 群延时 (Group Delay) 群延时是相位响应对频率的导数，它直接描述了每个频率分量的信号通过系统所花费的时间。理想情况下，群延时应该是一条水平线，意味着所有频率都以相同的时间延迟输出。如果群延时曲线在低频部分（尤其分频点附近）出现一个巨大的峰值，就意味着这部分频率的信号比其他频率“慢”了。当底鼓（主要能量在低频）和军鼓（能量覆盖中高频）同时敲响时，由于低频的群延时更大，你会先听到军鼓清脆的“嗒”，然后才听到本应同时到达的、拖泥-带水的底鼓“咚”声。这就是“糊”的本质——不同频率成分在时间上发生了“分离”。从“糊成一团”到“清晰有力”：我们该怎么做？既然找到了元凶，我们就可以对症下药。作为工程师，我们的目标就是实现系统（尤其是分频点）的相位一致性。测量，测量，再测量！不要只满足于频响曲线。在你的测试软件（如Soundcheck, Klippel, REW等）中，调出相位、群延时和阶跃响应的图谱。它们会告诉你眼睛看不到的真相。优化分频器设计 IIR 滤波器 + 全通滤波器 (All-pass Filter)：对于传统的IIR分频器，可以级联一个或多个全通滤波器来补偿其中一个单元的相位，使其在分频点附近与另一个单元对齐。这需要精心的设计和调试。拥抱 FIR 滤波器：如果你的系统使用DSP，FIR（有限脉冲响应）滤波器是实现相位线性化的终极武器。FIR滤波器可以设计成具有完美的线性相位（即恒定的群延时），从根本上解决了相位失真问题，代价是会引入更大的系统延迟（Latency）和更高的计算资源需求。物理时间对齐 (Time Alignment) 在设计阶段，就要考虑高、低音单元声中心的物理位置。通过倾斜障板、或前后移动单元，使它们的声中心在垂直于轴线的平面上对齐。对于无法物理对齐的系统，则必须在DSP中为更靠前的单元增加一个精确的延时。相信你的耳朵仪器是工具，耳朵是最终的裁判。在进行A/B对比测试时，重点关注：低频的清晰度和冲击力：贝斯线条是否清晰可辨？鼓点冲击力是否够强？声场与结像：人声和乐器的定位是否精准、稳定？声场的深度和宽度是否足够？相位一致性好的系统，结像会异常扎实。瞬态细节：吉他拨弦的质感、三角铁的清脆泛音是否清晰可闻？结论追求平直的频响曲线是正确的，但这只是万里长征的第一步。在专业音频领域，时间域的精准度（由相位一致性决定）和频率域的均衡度同等重要。一个优秀的声学系统，是振幅和相位双双优化的结果。它不仅能在稳态下发出正确的音高，更能在一瞬间迸发出精准、凌厉、充满细节的瞬态声音。从今天起，别再只盯着那条熟悉的频响曲线了。把相位的优先级提上来，打开时间域的窗口，去真正驯服那些让你的低音“糊”成一团的“时间幽灵”。讨论：你在工作中是如何处理相位问题的？欢迎在评论区分享你的经验和技巧！

吸声尖劈的理论分析和仿真计算及形状优化

本文首发于微信公众号「声学号角」 01—消音室和吸声尖劈消声室是用来模拟自由声场的重要声学实验室，在声学产品开发中有着广泛应用。所谓自由声场，就是指声波能自由传播，无障碍物的反射，也无环境噪声的干扰。比如下图中的中科院声学所东莞电声产业基地的全消声室。声动松山湖 | 中科院声学所东莞电声产业基地在各种消声室中，基本上我们都可以在天花板、地面、墙面发现挂装着长长的尖劈状吸声体。因为吸声尖劈具备优良的吸声性能，从而被普遍采用。当然现在也有用声超构材料来做消音室吸声体的。各种类型声学超材料新上市的KEF LS50 Meta音箱中声学超构材料吸收器原理以及应用 02—吸声尖劈的理论分析理想的消音室应该将入射到各个壁面的声波完全吸收，即壁面的吸声体的吸声系数要达到100%。然而低频段的吸声系数达到100%这么完美是不太可能的。为了将消声室作为近似自由声场的模拟，通过研究表明，在壁面吸声系数>0.99时，消音室测试声场与自由声场误差<1dB。也就是说声波垂直入射时，壁面声反射系数<0.1（10%），或者说反射声波声压级比入射声波声压级低20dB以上。一些吸声材料，比如玻璃纤维，其吸声系数可以做到0.9以上，但要超过0.99是非常困难的。下面做个简要分析。良好的吸声材料需要满足两个条件：1.材料对声波有很强的吸收和消耗能力；2.材料的特性阻抗与空气介质特性阻抗接近，使得声波能充分透入材料，减小声反射。反射太多，或吸收消耗太少都很难做到很高的吸声系数。假设吸声材料很厚，且材料内部声吸收系数非常大，即声波进入材料的话会被完全吸收。其总的吸声系数近似表达式其中γ为吸声材料与空气介质的特性阻抗比值（密度*声速比值）从上述吸声系数的表达式来看，即使吸声材料能将入射的声波完全吸收掉，如果γ做不到<1.22，吸声系数也达不到0.99以上（部分声能会被反射）。尖劈状吸声体具有良好的吸声性能，用来做消声室的吸声体已经很长时间，关于其吸声原理也有不少研究。但其中涉及复杂的数学计算，尤其是多孔材料的微观机理非常复杂，其物理参数也不容易得到。基于微观结构的吸声多孔介质建模总的来说，从理论的分析上可以得知，吸声尖劈实现良好的吸声性能机理主要是实现了特性阻抗逐渐过渡，从而使得声波有效地进入了材料并被吸收衰减。多孔材料高频吸声较好，通常我们将吸声系数0.99的最低频率作为吸声尖劈的吸声低频截止频率。低频截止频率主要和尖劈长度L有关，其近似表达式：尖劈长度越长，低频截止频率越低。 03—吸声尖劈的仿真计算下图是简要的一个吸声尖劈的3d图示，灰色代表墙面，米色代表吸声尖劈。吸声尖劈一般都有一定厚度的基底，除了安装的考虑，也是达到最佳吸声效果必须要的。且一般吸声尖劈和墙面会留一些间隙，形成空腔，会使得截止频率更低。下图是仿真一种设计下不同频率的吸声系数，纯尖劈长度0.9m。其低频截止频率（吸声系数>0.99）在80Hz。其反射系数在80Hz以上都是<0.1的。 200Hz仿真的声场分布 50Hz仿真的声场分布 1000Hz声波动态吸收过程同样材料同样外围尺寸，吸声尖劈和均匀厚度吸声体的吸声系数对比：可以发现吸声尖劈的效果远远好于同尺寸同材料的均匀厚度吸声体。不同长度尖劈吸声系数对比 0.5m长尖劈低频截止频率在180Hz，1.5m长尖劈低频截止频率在50Hz。 04—吸声尖劈的仿真计算通过仿真的方式，可以找到合适的吸声尖劈设计，并对其形状进行优化。关于仿真的各种优化方式：拓扑优化、形状优化、参数优化，可以参考我之前的文章利用Comsol进行扬声器弹波的有限元形状优化扬声器的形状优化和拓扑优化 Comsol优化功能简介扬声器设计中声学元件的数值优化策略磁路拓扑优化【扬声器仿真高阶应用】扬声器盆架设计的拓扑优化优化后的吸声尖劈形状，尖劈长度和之前保持一致优化前后的吸声系数仿真对比：可以看到其低频截止频率从80Hz下降到60Hz，且50Hz的吸声系数仍然有0.98。 200Hz仿真的声场分布 50Hz仿真的声场分布 1000Hz声波动态吸收过程掌握优化方法是从仿真菜鸟到仿真高手的必经之路。

电声工程师应该掌握的基础知识【补充学习资料A】

本文首发于微信公众号「声学号角」之前发了一篇电声相关的基础知识的文章，本文整理下相关知识点对应的资料（基础知识以书籍为主），供学习。我个人认知和眼界有限，列得不全，欢迎各位在评论区补充。电声工程师应该掌握的基础知识声学和振动原理优先推荐杜功焕的《声学基础》进阶可以看看马大猷的《现代声学理论基础》以及程建春的《声学原理》 Mendel Kleiner《Electroacoustics》扬声器和麦克风设计优先推荐山本武夫的《扬声器系统》然后王以真《实用磁路设计》《实用扩声技术》《实用扬声器工艺手册》《实用扬声器技术手册》《扬声器探索：工艺、设计、应用》《线阵列扬声器系统》俞锦元《音箱原理及制作》《扬声器设计与制作》《扬声器设计与制作(全新版1) 》《扬声器设计与制作(全新2.0版)》（后面这个真的是三本完全不同的书）沈勇《扬声器系统的理论与应用》 Vance Dickason《扬声器系统设计手册》（即《Loudspeaker Design Cookbook》） John Eargle《扬声器与音响设计手册》 Ray A. Rayburn《传声器手册 John Eargle的传声器设计与应用指南》（Ray是接替John Eargle成为第三版的作者） John Borwick《Loudspeaker and Headphone Handbook》 Glen Ballou《Electroacoustic Devices-Microphones and Loudspeakers》 Mendel Kleiner《Electroacoustics》 Leo L. Beranek《Acoustics：Sound Fields and Transducers》测试和分析 Joseph D’ Appolito《实用扬声器测量》陈克安《声学测量》许龙《声学计量与测量》资料比较多，分成上下AB两篇

声阻抗概念，以及Comsol某些情况下局部模型声阻抗边界的手动修正

本文首发于微信公众号「声学号角」 01 — 阻抗边界阻抗的概念在结构和声学中非常重要，定义为边界上力/流动变量，和电路阻抗类似（电压/电流）。阻抗边界条件可以在不直接建模的前提下，表征边界的特性。硬声场边界表示其边界加速度（或者说速度）的法向（垂直于边界）分量为0。在数学上，这个和声对称边界是等效的。对零偶极域源qd=0，以及流体密度ρc恒定，则压力的法向偏导为0 软声场边界意味着边界声压消失，即 pt = 0，是某些特定情况下的近似。阻抗边界一般用于分析介于硬声场边界和软声场边界之间的情况，比如模拟机械结构系统或者吸收边界的特性。当然需要注意，阻抗边界条件仅将法向速度与压力关联，而不考虑切向（平行于边界）速度。即，使用阻抗边界条件，切向速度会被忽略。所以说阻抗边界条件是实际边界情况的低阶近似。如果需要考虑切向速度，即对边界非垂直入射的情况，则应该对边界进行建模，或者使用更高阶的模型。 02 — 不同的阻抗概念通常在声学中，有三种不同的阻抗概念：声阻抗、比声阻抗、机械阻抗。声阻抗Zac，国标单位Pa*s/m^3，定义为边界平均压力与通过边界的体积流速Q（单位m^3/s）之比。Zac=pav/Q。比声阻抗Zsp，单位Pa*s/m，定义为压力p与粒子速度u之比。Zsp=p/u。机械阻抗Zmech，单位kg/s(或Pa*s*m)，定义为边界作用力F与粒子速度之比。Zmech=F/u。对于给定表面积S上值恒定的情况下，这三种阻抗概念的关系为Zmech=S*Zsp=S^2*Zac。 03 — Comsol中的阻抗边界模型设置比声阻抗为Zi。其边界条件的频域方程为：而时域的边界方程为： Comsol中的阻抗边界模型非常丰富。可以通过RLC电路、生理学、波导末端阻抗、多孔层、特性比阻抗、吸收系数或者自定义的方式进行设置。挑RLC电路和生理学模型进行简单说明。 RLC电路阻抗模型以串联耦合RLC电路为例其阻抗Zac为比阻抗Zi=S*Zac，S指边界面积。生理学阻抗模型生理学阻抗模型包含皮肤、人耳向外辐射、鼓膜、无耳廓人耳，完整人耳。以鼓膜为例鼓膜的声阻抗为Zeardrum，比阻抗Zi=S*Zac。对人耳生理阻抗测量和建模感兴趣的可以参考下面三篇文献： “Measuring and modeling basic properties of the human middle ear and ear canal. Part I: Model structure and measure techniques” “Measuring and modeling basic properties of the human middle ear and ear canal. Part II: Ear canal, middle ear cavities, eardrum, and ossicles” ...

电声工程师应该掌握的基础知识

本文首发于微信公众号「声学号角」瞎写的，仅供参考声学和振动原理系统理解振动系统和声波在一维、二维和三维中的物理模型和数学表示通过理论推导和数学计算的应用来解决声学中的问题。扬声器和麦克风设计了解电声器件的基本工作原理和基本参数，并能对它们进行数值研究和分析。了解电声相关的材料特性，加工工艺等。分析扬声器的电磁、机械、声学特性的相互作用，确定其灵敏度、频响曲线和指向性，使用公式计算、等效电路分析、有限元仿真等。并考虑辐射效率和非活塞振动等实际问题。研究扬声器和麦克风的非线性和谐波失真，互调失真，直流偏移等来源以及相互影响。将分析拓展到闭箱、开口箱、无源辐射器、传输线箱和带通箱，耳机等。研究扬声器和麦克风如何在阵列中使用，比如各类波束形成和指向性控制。测试和分析了解电磁、机械、声学的基本测试原理和设备，能进行适当的声学测量，包括了解其局限性，并能够分析生成的数据。学习如何有效地进行标准化的声学测量，同时充分考虑到在整个过程中引入的不确定性和误差。全面了解电声测量技术的原理，从而更好地应用它们，并知道如何适当地调整或提出新的测试方法。数字信号处理与机器学习了解如何数字信号处理，并应用在处理声音信号上，考虑各种方式的优势和局限性。研究信号在频率上的分解及其使用数字滤波器的方法，包括设计和分析。学习自适应滤波和机器学习，包括意识到它们各自的局限性和适用范围，并应用于实际产品开发，如回声消除、噪声抑制、主动降噪、声源定位、语音分离等。房间声学全面掌握房间声学原理，包括低频和高频的理论模型，并分析现有房间或设计新的房间。学习声波的理论和声学统计理论，包括客观的描述，以及如何与听众的感觉相吻合。设计和应用吸声和散射处理的技术，并考虑这些技术在应用领域的有效性和局限性。声学仿真学习常用仿真技术的基本原理：几何声学、有限元法和边界元法。使用仿真建模解决实际产品开发和应用的问题，并评估各类仿真方法的应用领域、准确性和局限性。心理声学学习如何把测量到的声音信号与人的主观反应联系起来。了解听觉系统如何让人类感知周围声学环境的不同属性。研究如何推动良好的心理声学主观实验设计。音频系统设计掌握无源分频器的设计。了解各类放大器原理，包括前置放大器和功率放大器。掌握各类信号处理设备工作原理，均衡、降噪、延时、混响、压缩、限幅等。了解各类音频接口，如蓝牙、Wifi、AUX、USB，以及模数和数模转换器ADC和DAC。掌握从拾音到重放完整的音频系统框架。

用虚拟现实（VR）的方式听音乐

本文首发于微信公众号「声学号角」使用耳机听音乐时，虚拟场景的方式和技术越来越流行。一些听音App有些音效的设置。苹果的Airpods Pro和三星的Galaxy Buds Pro也添加了空间音频的功能。虚拟声音渲染技术使得耳机用户可以获得超过传统耳机立体声的体验。双耳音频可以虚拟放置环绕听众的声源，用于环绕声音频再现并提高真实感。之前的文章有介绍过一些背景知识，包括人耳的声源定位原理，以及各类空间声重放技术。人听觉系统的单声源定位空间声重放技术使用耳机进行双耳音频重放的优势：左右通道声音直接到达对应左右耳，无串扰无墙面，房间物品等反射的影响所以理论上，双耳音频可以模拟我们在任何声源下会听到的声音，并放置在收听者周围的任何地方。而双耳音频信号的制作可以直接用双耳人头录音也可以常规音频信号+声源位置+声场信息，通过数字信号处理得到，“双耳音频渲染” 双耳滤波器被称为“头相关传递函数”(head-related-transfer-function，HRTF)。包括耳廓滤波器，双耳时间差（ITD），双耳声级差（ILD）。在之前文章有介绍分析过。人听觉系统的单声源定位当然还有不同方向入射的声源频谱因素还可以包括一个混响滤波器，用于模拟虚拟听音室。添加混响有助于声源的真实感，例如对距离的感知，并减小头中效应。常用的环绕声设置但仅仅通过HRTF不足以说服用户听到的是外部的声源。因为人的头部转动也是识别声源方向的一个重要指标。通过头部转动，可以消除“混乱锥”、“前后混淆”等。 Airpods Pro的空间音频就是考虑了人头转动/移动的影响，实时动态调整双耳的音频渲染，所以真实感比之前的产品强。当然目前用于耳机只是小试牛刀，最终应该是应用于VR/AR产品中。头部跟踪坐标系同时还存在另一个挑战：用户可能在走路/跑步/开车/坐飞机。那这个时候虚拟的声源是应该留在原始位置，还是跟着用户移动？拐弯的时候虚拟声源是否需要跟着移动？需要分离好用户的移动和场景的移动。要实时实现声临其境以假乱真的双耳音频渲染，还有很多工作可以做。

基于微观结构的吸声多孔介质建模

本文首发于微信公众号「声学号角」多孔材料被广泛应用于吸声。从其微观结构确定多孔介质的整体声学特性的方法已经有很长的历史。经典方法是假设理想化的微观结构，例如具有恒定截面的孔，纤维或颗粒的阵列。但实际用于吸声的多孔材料的典型微观结构要复杂很多。为了同时允许任意形状的孔，使用粘滞特征长度，考虑粘滞效应在窄孔中的影响。后来为解释热效应，引入了热特征长度，热导率和热曲折性。下图是Comsol软件自带的其中一个多孔介质声学模型JCALP，需要确定的参数还是非常多的。这个是目前最完整的半分析模型。满足一定的条件下，也可以适当简化。当材料的微观结构非常类似于均匀一致的曲折圆柱孔阵列，而没有太大的横截面变化时，所需的参数数量减少到六个，简化为JCAL模型。下图是一种由具有圆形横截面的直的平行纤维组成的周期性纤维材料。假定波的传播方向垂直于纤维，意味着从微观几何形状来看可以认为是周期性的二维结构。放在模型中使用的周期性纤维层的微观结构和边界条件：假设的条件：等温，在纤维和后壁的固体表面上无滑动，在流体带域的顶部和底部边界上是周期性的，并且在空气层的外表面上有绝热压力激发。用于多尺度计算的周期性纤维材料在计算流体域上的有限元网格计算得到的速度、温度分布周期性纤维材料的动态粘滞渗透率计算结构：DM –直接多尺度计算；JCALP，JCAL，JCA –使用指定模型的混合多尺度计算周期性纤维材料的动态热导率：周期性纤维材料的动态粘性曲折度：周期性纤维材料的动态热曲折度周期性纤维材料的波速和衰减：这里简单说一句，波速的降低或许才是Bass材料能提升等效背腔容积的原因，而不是有些人说的空气分子吸附。周期性纤维材料和自由空气中的波长：不同厚度h的吸声效率另外有一种规则的周期性泡沫，立方体中堆积着相同的球形孔，REV。这种多孔材料是各向同性的。可以利用几何对称性分为1/8，1/16或1/48对模型进行简化。规则周期泡沫REV流体域截面上的有限元网格：速度和压力分布：温度分布多孔周期性结构的横截面，其中添加了带有平滑拐点的圆角，以便精确重建几何形状：各种传输参数TP随孔半径Rp/减小的圆角半径Rf的相对变化周期性泡沫的动态粘滞性和热导率：周期性泡沫的动态粘性曲折度：周期性泡沫的动态热曲折度：周期性泡沫的波速和衰减具有指定厚度h的吸声系数：更复杂的模型也可以用类似的方法进行仿真分析计算。