1.1 了解音频基础知识
本节我们先来了解一下音频的基础知识,包括了解声音与声波、掌握声音的类别、认识模拟与数字音频技术、认识数字音频硬件以及了解音频信号等内容。掌握这些内容就能对录音以及音乐的编辑与制作的基本思想有一个很好的认识,今后使用软件也不会盲目,善于跟着软件的发展来不断掌握新技能。
1.1.1 了解声音与声波知识
任何物体由静态到动态转变后,都会使人听到声音,发出这种声音的物体就是声源,它的传播形式主要是通过声波进行的。下面向读者详细介绍声音与声波的基础知识。
1. 声音与波形图
声音是一种摸不着的东西,主要通过在空气中运行,如说话的声音、钢琴的弹奏声、二胡的弹唱声等,然后传到人的耳朵里,才能听到这些声音。声音的音波有高有低,有快有慢。在声音的属性中,主要通过声音的频率和振幅来展现和描述音波的属性,声音中的频率大小与声音的音高对应,振幅与声音的大小对应。
所以,在平常听到的所有声音中,它是包含了声音频率在内的,一般人的耳朵可以听到的声音频率范围为20~20000Hz,某些动物的耳朵可以听到高达170000Hz的声音,海里的某些动物还可以听到15~35Hz范围内的小声音。
图1-1以波浪线的形式表现了声音频率振动的波形,波形的零点线表示静止中的空气压力,当声音波动为停止状态到达最低点时,代表空气中的压力较低;当声音波动为振动状态到达最高点时,代表空气中的压力较高。
在音频波形图中,各部分的含义如表1-1所示。
图1-1 音频振动的波形图
表1-1 波形图中各参数含义说明
专家指点
用户使用软件对音乐进行剪辑操作时,音乐的开头部分和结束部分基本都处于无声状态,它们都在零点线的位置,因此听不到任何声音,如果用户对该区域进行相应的编辑和剪辑操作,对原音频文件的影响也不会很大,而且可以使音乐的播放更加流畅。
当用户对一段音乐进行编辑处理时,可以通过对起始点和结束点位置的零点线区域进行删除操作,这样可以在不破坏音频文件的同时缩短音乐的播放时间。
2. 声压级与声强级
声音压力是指物体通过振动发出的声音引起的空气逾量压强,可以理解为声压是指声波存在时的空间压强减去没有声波时的空气压强而得到的结果,它的单位称为帕(Pa)。
声强是指声波平均面积上产生的能量密度的大小,它以瓦/平方米2(W/m2)为单位。人的耳朵能听到的能量数值大概在1013:1,人对声音强弱的感觉大体上与有效声压值或声强值的对数成比例。为了方便计算,部分学术专家把声压有效值和声强值取对数来表示声音的强弱,这种用来表示声音强弱的参数称为声压级(dB)或声强级(dB),如表1-2所示。
表1-2 声压级与声强级计算说明
专家指点
以人们的耳朵能听到的最低值为参考的客观相对值来计算声压级和声强级参数。
3. 声波相关物理参数
对声波的描述主要使用多个物理参数来表示,下面向读者分别介绍与声波相关的这些物理参数,希望读者熟练掌握和理解这些基础知识,如图1-2所示。
4. 音色包络
音色包络是指某一种乐器特有的强度随时间变化的一种形态,一般由4个阶段组成,分为起音、持续、衰落以及释音等,如图1-3所示。
释音中一般分为3种乐器的音色波形包络,如图1-4所示。
图1-2 与声波相关的物理参数的详解
图1-3 音色包络的4个阶段
图1-4 3种乐器的音色波形包络
1.1.2 掌握声音的不同类别
随着物理声学研究的深入和技术手段的完善,科学家发现人的主观听觉与声音的物理特性是有所差异的,并由此发展出生理声学、心理声学和音乐声学。下面主要向读者介绍声音类别的相关知识。
1. 响度级与响度
在前面的知识点中,详细介绍了声压与声强,它们分别表示声音的客观参量。为了表达人的听觉对声音强弱的感受特点,这里需要引入听觉感受的响度级与响度两个概念。这样,就把声音强弱的客观尺度与在此声音刺激下主观感受的强弱联系起来了。如图1-5所示为响度与响度级的相关知识。
2. 频率与音高
人们一般认为声音的大小和高低是通过声音的频率高低展现出来的,在声音中称为“音高”。两个不同频率的声音文件进行对比时,有决定意义的是两个频率的比值,而不是它们的差值。音阶频率对照表如表1-3所示。
图1-5 响度与响度级的相关知识
表1-3 音阶频率对照表
3. 谐波与泛音
谐波和泛音所指的是同一种声学现象,因为分支学科的不同,物理声学中的“谐波”在音乐声学中称为“泛音”。
简单来说,通常乐器在发音时,其弦或空气柱的整体振动会发出较强的音,即基音。同时,还会在弦长或空气柱长的1/2、1/3、1/4、1/5……处发出较弱的音,即泛音。泛音是基音的2倍、3倍、4倍、5倍……各次谐波,并由此构成了一个泛音列。
4. 音色与音质
音色的不同取决于不同的泛音,每一种乐器、不同的人以及所有能发声的物体发出的声音,除了一个基音外,还有许多不同频率(振动的速度)的泛音伴随,正是这些泛音决定了其不同的音色,使人能辨别出是不同的乐器甚至不同的人发出的声音。
音乐中的音色效果好坏最能触动人们的听觉器官,是吸引听众最重要的方法。音乐中包括现实性音色和非现实性音色,现实性音色是指人的声音音色和演奏乐器的音色,是实实在在的声音;而非现实性音色是指在音乐软件中通过相关功能制作出来的MIDI电子乐器的声音,是一种虚拟的音色。音质是指声音通过一些音响产品播放出来的音频质量的客观指标和主观感受,具体展现如图1-6所示。
图1-6 音质的具体展现
1.1.3 认识模拟与数字音频技术
随着经济和生产力的不断完善和发展,记录和处理音频信号的方式越来越复杂,因此部分专家开发出了模拟的音频技术和数字音频技术。在这两种技术中,信号的波形、传输方式和存储媒介是完全不同的。本节主要向读者介绍模拟音频与数字音频的基础知识。
1. 模拟音频技术的诞生
模拟音频技术的诞生,一共经历了多个阶段,下面简单向读者进行介绍。
1857年
法国斯科特根据人类耳鼓膜随声波振动的现象发明了声波振记器,它是在实验室研究声学时发明的,是最早的记录声音的仪器。这项装置通过转动的柱面上的一层膜记录下声波振动留下的痕迹,用来测定一个音调的频率,并研究声音及语言。斯科特发明的声波振记器如图1-7所示。
图1-7 声波振记器
1877年
美国爱迪生发明了一种录音装置,他将声波转换成金属针的振动,同时转动圆筒的摇把,随着声音强弱高低的不同,金属针可以将波形在圆筒的锡箔上刻录出深浅不一的沟纹。当金属针再次沿着刻录的轨迹行进时,便可以重新发出留下的声音。
1885年
美国奇切斯特·贝尔和查尔斯·吞特发明了用涂有蜡层的圆形卡纸板来录音的留声机装置。
1887年
旅美德国人伯利纳研制成功了蝶形唱片和平面式留声机。
1888年
美国爱迪生又把留声机上的大圆筒和小曲柄改进成类似时钟发条的装置,改为由马达带动一个薄薄的蜡制大圆盘转动的样式,大大增强了播放的稳定性。
1895年
美国爱迪生成立了国家留声机公司(National Phonograph Company),生产并销售这种用发条驱动的留声机,从此以后留声机才得以普及。同年,德国人艾米利和伯利纳推出了一款新的留声机,使用扁圆形涂蜡锌版作为播放和录音的媒体,同时也可以制成母版进行复制,这就大大增加了唱片商业化量产的可能性。
1891年
伯利纳研制成功了以虫胶(也称洋乾漆)为原料的唱片,发明了制作唱片的方法,唱片工业由此开始了历史性的起点。
20世纪初
在20世纪最初的10年中,留声机和唱片很快得到了普及,虽然当时的留声机产生的音质还很差,但毕竟是第一次把音乐从音乐厅传播到人们的家中,这表明了机械方式的模拟音频技术正在走向实用化。
2. 了解模拟音频技术的特点
模拟音频是一种对声音波形进行1:1比例记载和传输的信号表示方式,它的波形是连续的,可以用机械、磁性、电子或光学形式来表现。模拟音频信号的振幅除了可以通过电压与位移(如留声机和模拟光学声迹)的直接模拟来表现外,还可以通过信号电压与磁通量强度(模拟磁带录音)的直接模拟来表现。模拟音频也可以用调频方式使信号被载频或被解调,因为不管是在调制还是在解调周期内,其信号仍保持其模拟形态。
模拟音频技术反映了真实的声音波形,技术成熟,声音温婉动听,尤其在声/电能相互转换的功能(拾音与还音)方面是其他技术无法替代的,直到今天还在使用。但它是工业化时代的产物,在记录、编辑和传输时受到很多技术本身的限制,主要缺点是动态范围小,信号/噪声比较差,音频信号编辑十分不便,以及设备复杂昂贵等,尤其是其薄弱的信息承载能力,无疑是一个致命的弱点。
3. 数字音频技术的诞生
20世纪90年代,国外学者尼葛洛庞帝、比尔·盖茨等人的著作,对未来数字时代中的人类生存与发展之路进行了解说,阐述了独特的观点,也指明了音频技术的发展方向。
1928年,奈奎斯特通过实验首次提出这样的观点,在进行模拟信号转换为数字信号的过程中,当采样频率大于信号中最高频率的两倍时,采样之后的数字信号可以完整地保留原信号中的信息。由于奈奎斯特是最先发现采样规律的科学家,因此采样定理也被称为奈奎斯特定理。
1933年,苏联工程师科捷利尼科夫首次用公式严格地表述了这一定理,因此在苏联文献中称为科捷利尼科夫采样定理。
1948年,信息论的创始人香农对这一定理加以明确说明,并正式作为定理引用,因此在许多文献中又称为香农采样定理。
直到20世纪70年代晚期,数字音频技术才逐渐成熟起来,第一代数字音频媒体CD于1982年开始推向消费者市场,并得以普及使用。
4. 数字音频的采样
采样频率是指音频信号采样时每秒的数字快照数量,这个速度决定了一个音频文件的频率范围或称为频响带宽。采样频率越高,数字波形的形状越接近原来的模拟波形;采样频率越低,数字音频的波形越容易被扭曲,从而背离原始音频,造成频率失真。
5. 数字音频的量化
所谓数字音频的量化,是指按照一定的数值量把经过采样得到的瞬时幅度值离散化,这个规定的数值量称为位深度,也称为量化精度或量化比特数,它决定了数字音频的动态范围,较高的位深度可以提供更多可能性的振幅值,从而产生更大的动态范围和更高的信号噪声比,提高信号的保真度。
采用16位(bit)位深度的数字音频是最常见的,它能达到CD音质,但有些Hi-Fi音频系统使用32位(bit)的位深度,而在有些对音质要求较低的场合,如网络电话,也可能使用8 位(bit)的位深度。不同的数字音频位深度对应的声音品质如表1-4所示。
专家指点
离散化是指将连续问题的解用一组离散要素来表征而近似求解的数字方法。
表1-4 不同的数字音频位深度对应表
6. 数字音频的量化
由于数字音频电路一旦过载就会产生无法消除的数字噪音,所以数字音频系统中所有的信号必须保持在某种基准电平值以下。在数字音频电路中表述音频信号的大小除了沿用了电平(dB)这一参量外,还使用dBFS这一特殊参量。
数字音频技术提高了声音记录过程中的动态范围和信噪比,保证了声音的复制与重放无损,提高了传输过程中的抗干扰能力,便于加密,并且在编辑处理以及与其他媒体的结合上更加方便。因此,数字音频技术逐渐成为当代声音处理领域中的主流技术。
1.1.4 认识数字音频硬件
数字音频技术中的硬件设备属于物理装置,硬件技术是数字音频技术中有形的部分,数字化技术的诞生都是从硬件的开发与发展开始的。下面主要向读者介绍多种数字音频硬件设备的相关基础知识。
1. 拾音设备
拾音设备主要是用来收集声音的设备,这些声音包括说话声、清唱声、合唱声以及演奏乐器声等。拾音设备是指麦克风(话筒)设备,它主要是将声音的振动信号转换为电信号。麦克风的种类有很多,主要类型如图1-8所示。
图1-8 麦克风的种类
在音乐制作的专业领域中,使用最为广泛的是动圈式和电容式两种麦克风类型,下面向读者简单介绍这两种麦克风的相关知识。
动圈式麦克风
动圈式麦克风是指由磁场中运动的导体产生电信号的话筒,是由振膜带动线圈振动,从而使在磁场中的线圈生成感应电流。
动圈式麦克风有4个特点,如图1-9所示。
由于动圈式麦克风有这么多的优点,因此,它常被用于现场人声和大声压级声源的拾音。常见的动圈话筒如图1-10所示。
电容式麦克风
电容式麦克风的振膜就是电容器的一个电极,当振膜振动,振膜和固定的后极板间的距离跟着变化,就产生了可变电容量,这个可变电容量和麦克风本身所带的前置放大器一起产生了信号电压。
图1-9 动圈式麦克风的特点
图1-10 动圈式话筒
电容式麦克风有许多优点,但也有自身的不足和缺点,如图1-11所示。
电容麦克风中有前置放大器,所以需要一个电源,这个电源一般是放在麦克风之外的。除了供给电容器振膜的极化电压外,也为前置放大器的电子管或晶体管供给必要的电压,一般称它为幻象电源。由于有了这个前置放大器,所以电容话筒相对要灵敏一些,在使用时必不可少的一些附属设备有防震架(一般会随话筒赠送)、防风罩、防喷罩、优质的话筒架。常见的电容式话筒如图1-12所示。
图1-11 电容式麦克风的特点
图1-12 电容式话筒
2. 信号转换设备
模拟/数字音频信号转换设备主要是指声卡,声卡的主要功能是实现模拟信号与数字信号的互换,一方面它可以把来自传声器、磁带和合成器等的外部模拟音频信号转换为数字信号传输到计算机中去,另一方面,它也可以将存储在计算机硬盘上的音频数据转换为模拟信号输出到耳机、扬声器和磁带等外部模拟设备中去。声卡的模拟/数字转换质量直接决定了数字音频的质量,因此拥有一块品质优良的声卡对于数字音频编辑制作来说十分重要。
专业声卡可分为板卡式和外置式两种,如图1-13所示。
两种常见的专业声卡如图1-14与图1-15所示。
图1-13 声卡的类型
图1-14 创新Sound Blaster Audigy 4 Value SB0610
图1-15 华硕Xonar Essence ST
3. 调音台
调音台又称调音控制台,它将多路输入信号进行放大、混合、分配、音质修饰和音响效果加工,是现代电台广播、舞台扩音、音响节目制作等系统中进行播送和录制节目的重要设备。调音台按信号出来的方式可分为模拟式调音台和数字式调音台。
现代的数字调音台除了具备模拟调音台的一切功能外,还具备频率处理、动态处理和时间处理等外部音频处理硬件的功能,有的甚至可以录制存储音频数据信号,变成了一种专用音频工作站。
由于数字调音台从设计思想上就是一种基于硬件的封闭系统,所以软件升级困难,更新换代缓慢,且价格十分昂贵,面对日新月异的计算机技术,它逐渐变得落伍了。现在的数字声卡加上数字音频工作站大都已经具备调音台的全部功能,并可以存储海量数据,操作更方便。所以,小型的数字音频制作系统完全可以不配备调音台,但在某些大型的制作中,调音台还是系统的主要设备之一。常见的数字调音台如图1-16所示。
图1-16 不同品牌的数字调音台
专家指点
调音台分为三大部分:输入部分、母线部分、输出部分。母线部分把输入部分和输出部分联系起来,构成了整个调音台。
在Audition音乐编辑软件中,也向用户提供了调音台功能,在软件中的调音台中,可以对音频进行简单的调音编辑操作。图1-17所示为Audition CC 2018软件中提供的“混音器”(调音台)面板。
图1-17 Audition CC 2018中的“混音器”面板
4. 数字音频工作站
数字音频工作站是一种用来处理和交换音频信息的计算机系统,是数字音频软件与计算机技术结合的产物。
数字音频工作站的出现实现了数字音频信号记录、储存、编辑和输出一体化高效的工作环境,具有强大的功能和良好的人机交互界面,是声音制作由模拟走向数字的必由之路。目前,用于数字音频制作的工作站主要有基于PC平台和基于Mac平台两大类型。
PC平台普及程度高,有丰富的硬件和软件支持,用户可进行第二次开发扩展其功能,且具有较好的性价比,在音频编辑的专业领域和教学中得到了广泛的应用。PC平台如图1-18所示。
图1-18 PC平台
Mac苹果电脑是一种封闭的系统,苹果公司卓越的技术确保了Mac音频工作站高质量的声音制作和极强的系统稳定性。但其技术升级慢,价格比较昂贵,主要用在专业音频制作领域。Mac苹果电脑如图1-19所示。
图1-19 Mac苹果电脑
专家指点
PC加上数字音频软件和其他必备的硬件,可以搭建一套数字音频工作站。除了台式计算机外,手提式计算机性能的迅速发展使其也可以作为个人便携式音频工作站。
5. 耳机监听设备
耳机是目前年轻人使用最多的一种监听设备,它是一种超小功率的电声转换设备,由于它直接贴合于人的耳朵旁,于耳道空腔内产生声压,因此耳机的播放基本不受外界的影响。关于耳机的优点如图1-20所示。
图1-20 耳机的优点
优质的耳机具有这么多的优点,因此适合于长时间的监听使用。耳机的类型也有很多,如图1-21所示。
图1-21 耳机的类型
根据上述向读者介绍的3种耳机类型,下面将分别对其进行解说。
等磁式耳机
等磁式耳机的驱动器类似于缩小的平面扬声器,它将平面的音圈嵌入轻薄的振膜里,像印制电路板一样,可以使驱动力平均分布。磁体集中在振膜的一侧或两侧(推挽式),振膜在其形成的磁场中振动。等磁式耳机振膜没有静电式耳机振膜那样轻,但有同样大的振动面积和相近的音质,它不如动圈式耳机效率高,不易驱动。
动圈式耳机
动圈式耳机是最常见的耳机类型,一般的家庭用户、网吧用户等都配有动圈式耳机,如图1-22所示。它的驱动单元基本上就是一只小型的动圈扬声器,由处于永磁场中的音圈驱动与之相连的振膜振动。动圈式耳机效率比较高,大多可为音响上的耳机输出驱动,且可靠耐用。通常而言,驱动单元的直径越大,耳机的性能越出色。
图1-22 动圈式耳机
静电式耳机
静电式耳机有轻而薄的振膜,由高直流电压极化,极化所需的电能由交流电转化,也有电池供电的。振膜悬挂在由两块固定的金属板(定子)形成的静电场中。静电式耳机必须使用特殊的放大器将音频信号转化为数百伏特的电压信号,所能达到的声压级也没有动圈式耳机大,但它的反应速度快,能够重放各种微小的细节,失真率极低。静电式耳机如图1-23所示。
图1-23 静电式耳机
专家指点
如今,市场上还盛行着一种蓝牙耳机,也称为无线耳机。无线耳机仍然算是新生事物,目前仍处在上升期,根据用户需求的不断提升,用户对无线耳机的期望值也在提高。从目前的数据来看,无线耳机的传输能力基本可以满足绝大多数用户的需求,而音质和续航能力还有很大的提升潜力。
6. 音箱监听设备
音箱的作用是把音频信号转换成声源,并把声音播放出来。因为人的听觉是十分灵敏的,并且对复杂声音的音色具有很强的辨别能力,而音箱要直接与人的听觉打交道,所以它是音响系统中的重要组织部分。人的耳朵对声音音质的主观感受是评价一个音响系统好坏的最重要的标准。
专业的监听音箱与民用音箱在声音品质的取向上有很大不同。监听音箱是用于专业录音与音频制作的,注重体现声音的细节与层次,追求声音的真实再现,而民用音箱更多倾向于声音的修饰美化,会掩盖声音的缺陷,其结果可能给音频制作者产生误导。
目前,专业监听音箱多为有源音箱,常见的监听音箱如图1-24所示。
图1-24 有源监听音箱