一生平安 发表于 2020-4-15 01:58:22

声卡的48KHz、96KHz、192KHz采样率有何意义

  人耳的听觉是有限的,介于20Hz到20kHz。跟据Nyquist采样定理,采样频率只要超过信号带宽的2倍就不会产生混迭。在数字媒体领域,如音乐CD的规范,都是以44.1kHz作为标准采样率的。因为44.kHz大于20kHz的两倍,所以实际上44.1kHz的采样率是足够用的。

  如图所示,人类对 5khz的声波最敏感
  为了高保真采样,应该对5khz的声波采用16倍采样,倍数越高越保真

  但是现在普遍在工程中都是使用48kHz或者96kHz频率录音,只有在最终母带处理时才会转成44.1kHz的CD格式,这样减少多次采样率转换造成的失真。
  而在电脑领域,作为音频硬件codec标准的AC97规范只规定了48kHz。这造成几乎所有的输入、输出信号都要被重新采样(专业术语叫采样率转换,即 SRC)。SRC一般都会造成音质的损失,较简单(即较差)的SRC算法会造成音质明显劣化。但这已经是一个既成事实了。
  既然44K够了,那为什么还要用192KHZ来录音?
  首先,20kHz只是大多数人的听觉门限,也就是说,人耳对于20kHz以上的声音很不敏感。注意不敏感并不意味着完全无法感知。大多数乐器(特别是钢琴和弦乐器)的乐音含有丰富的高次谐波,用音乐术语来说即所谓的上方泛音。截止频率为22.05kHz的CD音频,的确会给听惯了真实乐器的人一种不自然的感觉,尤其在高频部分,因为奈奎斯特截止频率造成更高频率泛音的信号失真。
  其次,数字录音通常都需要进行后处理。音频处理会对信号产生进一步的失真,包括信号畸变、频谱混叠,等等。如果录音时仅仅用44.1kHz对原始信号采样,那么在后处理前还得进行上采样(up-sampling),对采样频率进行扩展。由于这种扩展是“假”的,实际上并没有更多有用的原始信号,并且上采样算法的优劣也会影响原录音信号的失真,所以这个做法并不可取。因此,通常的做法是用更高的频率进行采样。
  而现在的完全专业数字录音棚中,则不再按CD标准的规范录音、混音以及母带,而是优先使用HD音频规范。即:
  采用24Bit 48KHz、24Bit 96KHz、24Bit 192KHz 三种规格进行录音,当然,24Bit 48KHz是一些小的录音棚使用,因为他们的处理器资源有限。而大的录音棚,都清一色的使用24Bit 96KHz和24Bit 192KHz 进行录音。

  采样频率(Sampling Frequency)指每秒钟取得声音样本的次数,采样频率越高,声音的质量也就越好。采样频率的单位用赫兹(Hz)表示,当然,KHz就代表“千赫兹”。
  对于我们常用的音频录音和回放而言,按时钟发生器分(晶振),采样频率通常会使用如下两个阵容:
  (一)22系列(小数点暂时忽略):
  典型的有:11025Hz、22050Hz、44100Hz、88200Hz、176400Hz
  (二)24或49系列(小数点暂时忽略):
  典型的有:48000Hz、96000Hz、192000Hz
  其中,第一阵容中:
  11025Hz、22050Hz 多用于电话、语音、部分游戏音乐等场合;
  44100Hz则是早期的CD标准;
  88200Hz、176400Hz 则多用于符合CD标准采样频率整数倍的母带处理,它们是为了方便CD标准整数倍数字音频转换而被迫制定的采样频率。
  而第二阵容中:
  48000Hz符合标准HD音频规格;96000Hz符合Full HD音频规格;192000Hz符合Super HD音频规格。这三种采样频率都符合HD Audio高清音频规格标准。(中国高清音频网有更权威的介绍)
  应用方面:48000Hz多用于形如AC-3、DTS多声道编码以及基础的音频混流(包含AC97)等等方面;96000Hz、192000Hz则多用于高清专业音频录音以及高清音频回放(包含HDCD、DVD-Audio、蓝光DVD等)。马上出来的HDTA也支持(甚至超过)高清音频标准。
  其中,同种阵容的采样频率的转换中,属于整数倍转换,那么:
  (1)44.1KHz转换成 88.2KHz,得到的88.2KHz的文件,但音质不能达到88.2KHz品质,而和原来44.1KHz一样;
  (2)88.2KHz转换成 44.1KHz,音质就降到44.1KHz级别;
  (3)48KHz转换成96KHz,得到的是96KHz的文件,但音质不能达到96KHz品质,而和原来48KHz一样;
  (4)96KHz转换成48KHz,音质就降到48KHz级别;
  但是,如果是不同阵容的采样频率的转换,属于非整数倍转换,那么,无论怎样转换,不管从高到低还是从低到高,都会明显降低质量,而且得到的新文件的质量比原始文件的质量更低。比如:
  (1)44.1KHz转换成48KHz,得到新的48KHz文件,而这个新文件的音质不但达不到48KHz,而且比原来的44.1KHz文件音质还差;反之亦然。
  (2)96KHz转换成44.1KHz,得到新的44.1KHz文件,这个新文件音质明显下降到比44.1KHz还差的级别(连44.1KHz都不如)。
  (3)96KHz和88.2KHz互相转换、192KH和176.4KHz互相转换,都会明显下降质量。
  也就是说,不论在何时何地,请尽量避免非整数倍采样频率的转换,不管从高到低还是从低到高,都应该避免这样做。当然,非整数倍转换时,不同的转换设备所转换造成的损失不同。如果非要使用非整数倍转换时,请选择高质量的重采样处理设备(通常都很贵)进行操作。
  就目前专业录音行业而言,因为44.1kHz是早期为了CD这个不成熟的格式而制定的标准,因此近几年绝大多数录音棚并没有都使用第一阵容的采样频率,而使用第二阵容的采样频率(48KHz、96KHz、192KHz)进行录音;而只有少部分落后的录音棚还在使用第一阵荣的采样频率(44.1KHz、88.2KHz、176.4KHz)进行录音。
  也就是说,第一阵容中的44.1KHz、88.2KHz、176.4KHz 采样频率已经逐步被专业录音行业淘汰,也许您会说:“什么,我们的CD标准已经淘汰啦?”。
  对,目前的专业录音行业,已经逐渐不再照顾我们沿用了多年且古老的的CD音频规范,而是向上照顾HD音频规范。因为,将来的音乐载体(包含HD视频载体),都采用HD音频标准。当然,老的CD标准照样执行,但是他们将以无奈的兼容方式去执行(下面会说到)。
  那么,以前的CD规范的音频制作,是如何进行的?
  1.以往模拟和数字混用的棚中,采用16Bit 44.1KHz录音和混音,而母带处理时可能直接使用,也可能还向上整数倍采样后,经过模拟母带处理设备进行处理,最后又转换为数字格式,还要向下采样变回CD标准。也就是说,母带处理有模拟设备,也有数字设备,制作过程在不断的AD、DA变换中进行。
  2.以往的纯数字录音棚中,采用24Bit 88.2KHz录音混音 或者 采用24Bit 176.4KHz录音混音,母带处理时,直接采用24Bit 88.2KHz或者24Bit 176.4KHz进行处理(比如:线性均衡、多段动态处理等),处理完成后,进行整数倍向下采样,降为44.1KHz采样频率,同时向下降低位深(24Bit将为16Bit)再进行抖动处理(Dither)以填充量化失真。
  很显然,传统的CD制作流程,都是为CD唱片服务,不能兼顾HD高清音频标准。如果要兼容HD音频标准,就要进行非整数倍重采样去“由低变高”的“变成HD”,但这样不但不能保证原来的品质,反而会降低品质(比如:176.4KHz转换为192KHz会降低音质),连原始母带的音质都达不到了,显然,专业音频制作是不会做如此蠢事。于是,他们的最终作品,也只能符合传统的CD唱片标准。
  而现在的完全专业数字录音棚中,则不再按CD标准的规范录音、混音以及母带,而是优先使用HD音频规范。即:
  采用24Bit 48KHz、24Bit 96KHz、24Bit 192KHz 三种规格进行录音,当然,24Bit 48KHz是一些小的录音棚使用,因为他们的处理器资源有限。而大的录音棚,都清一色的使用24Bit 96KHz和24Bit 192KHz 进行录音。
  那么,这样的录音规范,有什么好处?
  1.符合HD音频标准,这也是将来的主流标准,制作出的成品,可以直接应用于HDCD、DVD-Audio、蓝光唱片、数字音乐下载业务、数字对媒体播放机业务。
  2.完全照顾数字影视视频业务,多声道电影视频都会采用HD音频规范。包括移动便携数字视频设备都用它。
  3.完全照顾消费性音频播放业务,比如:因特尔HD-Audio音频标准,AC97音频编码解码,便携MP3/mp4/电话/游戏机最高音频质量播放。
  目前,专业录音行业的最高质量标准就是:24比特定点位深、192000Hz采样频率,简称“24Bit/192KHz。”。当然,将来这个标准依然会继续提高,向32Bit 384KHz进发也是可能的。
  那么,如今还要兼容CD标准的唱片,该怎么办?
  显然,录音棚绝对不会因为为了照顾CD标准唱片而重新使用44.1KHz、88.2KHz、176.4KHz 这几种淘汰的采样频率进行录音(因为不能照顾主流的HD音频节目),而依然会使用48KHz、96KHz、192KHz采样频率进行录音。
  由于CD音频标准必须使用16bit 44.1KHz才能被播放机播放,那么48KHz、96KHz、192KHz采样频率显然不能符合要求,因此,录音棚就在母带处理环节采用如下妥协的办法:
  1.母带处理时,依然按48KHz、96KHz、192KHz采样频率进行处理,处理到最后,将使用“采样频率转换器”进行重采样,而且这个重采样是非整数倍变换,因此会带来失真,为了尽可能减小失真,他们会使用运算能力很高的SRC处理器进行重采样处理。
  2.母带处理时,为照顾CD标准,依然要降低位深,也就是将24比特降低为16比特,前面已经说过,高位深将为低位深,必然会出现量化失真。因此,为了填充这个失真,他们会使用抖动处理器(Dither)在最后的节目中加入特定的“噪音”去“填充”量化失真。
  于是,如今的CD标准唱片,都会经过如上两个环节进行处理,而以上两个环节都是为了妥协CD标准而进行的无奈之举。
  实际上,现在的CD唱片市场上卖的产品(正版),最低级别的通常都是HDCD唱片,你买唱片时都会发现基本上都是HDCD标识,也就是一张激光唱片包含两种音轨:普通CD音轨和HDCD音轨。其中CD音轨记录16比特44.1KHz信号(这是这张唱片的兼容内容,照顾早期的CD播放机),HDCD音轨则记录24Bit 96KHz信号(这才是该唱片的主要内容)。普通的CD播放机只能播放CD音轨信号,而HDCD音轨则需要HDCD播放机才能播放(实际上现在的绝大多数DVD播放机都能播放HDCD,而现在的电脑则更没问题了。)
  本文是谈“家庭录音的采样频率选择”,而貌似我前面写的内容,都是废话,寒....,不过,那些还是有必要写的吧?
  那么,下面具体谈谈我们家庭业余录音,该如何选择采样频率。
  我们家庭用户的声卡,最低规格的是AC97规范,当然,如今的最低AC97规范的集成声卡,都是AC97 2.3规格以上的标准。最低规格AC97规范的集成声卡的最佳工作模式是16Bit 48KHz,而且AC97 Code(AC97音频编码解码器)的输入和输出,都是以16Bit 48KHz标准进行处理。
  如果AC97 Code接受到非 48KHz的信号,会在驱动层或者Windows KernelMix层进行重采样,其中:
  当进入AC97 Code的信号是48KHz整数倍采样频率的信号时,比如96KHz等,会进行同步整数倍重采样,这样的重采样因为是整数倍变换,因此音质能保持原来的质量(但不会提高质量)。
  当进入AC97 Code的信号是48KHz非整数倍采样频率的信号时,比如44.1KHz等,会进行异步非整数倍重采样,那么,问题就来了,非整数倍重采样会严重降低声音质量,因此,当使用AC97 Code集成声卡播放符合CD标准44.1KHz的节目或者以44.1KHz标准进行录音时,都会出现非整数倍重采样失真。
  当然,为改善这个问题,一些音频播放器如“Foobar2000和千千静听等”,开始使用播放器内置的高品质异步非整数倍重采样处理器实现实时重采样,也就是在音频流到达声卡之前,就通过那些高品质的SSRC转换成标准的48KHz整数倍频率以取代驱动或Windows KernelMix那种糟糕的重采样算法。因此,我们使用符合AC97规范的产品播放44.1KHz整数倍采样频率的节目时,请在“Foobar2000和千千静听等”播放器开启它们的重采样功能,当然,开启后,CPU占用会变高。
  然而,上面的方法,只能对付播放,那么录音呢?假如去使用44.1KHz整数倍的采样频率又是个头疼问题了,因为您一旦录制为44.1KHz,而实际上就已经经过了44.1KHz--->48KHz--->44.1KHz 变换,也就是说,你用AC97规范声卡录到音频软件内的东西,得到带有重采样失真的素材。
  因此,我只能很遗憾的建议普通的家庭用户,请您在录音时,务必使用48KHz(或其整数倍)的采样频率进行录音。这样就可以避免上面那个问题。那么,位深该如何选?
  关于位深要多少比特,就看您的集成声卡能达到多少位深了。
  假如您的集成声卡是普通的AC97 CODE,那么请使用16Bit位深进行录音;
  假如您的集成声卡是符合因特尔HD-Audio音频标准的CODE,那么则可以适当使用24bit位深;
  由于HD-Audio音频标准的集成声卡不仅支持24Bit位深,还支持至少96KHz以上的采样频率,因此您不妨尝试使用24Bit 96KHz进行录音。如果电脑速度慢跑不动多轨的96KHz采样频率的话,可以用24Bit 48KHz规格进行录音。
  总之,家庭集成声卡用户,最保守的录音规格建议如下:
  16Bit 48KHz (不支持HD-Audio的集成声卡)
  24Bit 48KHz (支持HD-Audio的集成声卡)
  如果您使用的是高档的HD-Audio集成声卡,还可以尝试 24Bit 96KHz录音。
  那么,如果是使用独立多媒体声卡(非专业)声卡的用户,该如何选择呢?
  您根据您的多媒体声卡所支持的最高录音级别进行选择,比如说:
  如果您使用创新SBLive!四声道和5.1声道的版本声卡,您应该选择 16Bit 48KHz 规格进行录音;
  如果您使用创新SBLive!24Bit 7.1、Audigy、Audigy2、2ZS、Audigy4、X-Fi;乐之邦的莫邪II、玲珑III豪华版;德国坦克中端产品等等...,您都可以选择24Bit 96KHz规格进行录音,当然,如果电脑跑不动的话,可以降为24Bit 48KHz进行录音;(PS:创新民用声卡自身缺点中的ASRC问题可暂时不用去管)
  如果您使用专业声卡,不管是PCI声卡还是USB、1394专业声卡,您都应该选择24Bit位深,而采样频率方面,根据您专业声卡能力和电脑的速度酌情选择48KHz或96KHz。而至于192KHz采样频率,我不推荐家庭用户使用,除非您的电脑运算速度达到了双路扣肉至强(如:XEON 5160两枚)以上级别。
  目前有很多翻唱爱好者、音乐爱好者论坛,这些爱好者之间都互相合作而制作音频节目。如果制作节目是多个人通过互联网互相合作完成的话,我建议这些朋友们都使用16Bit 48KHz标准进行录音和制作,这样可以兼顾所有人。
  当然,如果您的团体的所有成员的设备都达到24Bit位深的话,那么都建议使用24Bit 48KHz以上标准进行录音和制作。实际上,现在出的集成声卡大多数都是HD-Audio规范,因此即使是集成声卡,我们都可以大胆使用 24Bit 48KHz 这个规格进行录音,但最后导出发布成品时,可以酌情降低位深为16Bit,但采样频率建议保持48KHz,这样可以照顾所有数字设备(如MP3随身听等只能支持16Bit)。
  那么,为何不用44.1KHz标准,我们要制作CD怎么办?关于这个问题,您可以在我前面开头说的那堆废话中找到答案。
  总之,本文的中心思想以及提倡的目的就是:
  不论您是何种目的,不管是业余制作还是专业制作,在录音时,都建议使用48KHz、96KHz、192KHz 这一组采样频率规范中的其中一种进行录音和制作。而不必要去照顾已经淘汰了的CD标准44.1KHz。
  用192khz采样率录一段人声,但是我导出的时候为了不占太多空间,导出48khz的音频(同为wav格式的前提下)。那么导出的这一段音频是否和在48khz采样率下录出来的毫无区别?这个区别可以是听觉上的这也可以是后期处理上的(比如移调或时间类处理)。
  有区别,但是区别不会很大。人耳可闻与否,这不是我说了算的。人和人之间的听力差别是巨大的,一位母带工程师和一位机械工程师之间的听力差距是我无法推断的。所以我只能把可能出现的损失列举一下,主要体现在这样几个方面:1.截止频率过低所丢失的信息:根据Nyquist采样定理,只要采样频率超过模拟信号带宽的2倍就不会发生频率混叠,所以采样率要超过你所录制的信号的2倍就足够保证基本音质了。192khz的高频可以截止到96khz,远远高于44.1khz采样率截止的22.05khz(即比规定人耳可听频率范围20khz稍高一点)。这样可以保证192khz的录音能保留更多的高频信息,上到96khz。但是对于录制人声来说,192khz有些多余。人声的高频谐波大约到25khz左右就开始趋于几乎没有能量,也就是没有录音价值了。

  图为以88.2khz采样率录制的人声音频增益30dB后的频谱,可见内容就算是增益了这么多也是微乎其微的。当然,高频谐波的可见度和人声的响度有一定关系,所以25khz其实也不绝对。所以96khz的截止频率太过浪费,如果你只是录个贴唱,完全没有必要。可以采用CD标准系列的88.2khz(截止频率44.1khz已经超越25khz很多,足以保证完全录制所有人声信息)或者AC97标准的96khz。如果你需要录制其他乐器,为了完整的保留他们的高频谐波信息,192khz采样率是有必要的。否则为了防止频率混叠,带通滤波器会把其他频率信息全部滤掉。但是如果没有相应的硬件处理能力,192khz对于个人工作室而言太过“高端”(我所在个人中小型工作室惯用的是88.2和96khz而已),完全属于累赘。除非客户告诉你:“我要那种一个文件好几百兆的那种无损高音质音乐!”,你可以用192khz给他录一个……2.模数转换导致的损失:采样率顾名思义,就是你同一时间段内对于这样一段连续的模拟信号进行采样次数的多少。因为数字音频是由模拟音频经过模数转换得来的,所以采样率自然越高质量越好。192khz的采样次数是48khz的4倍,理论上说它的“密度”、“连续性”听起来应该比48khz强得多,“数码味儿”小得多。但是实际上在实际有效可听范围不超过20khz太多的人耳听来,44.1khz或者48khz采样率采样的声音已经足够了。所以这部分差别并不会特别巨大,是“多和少”之间的区别而非截止频率不够导致的“有和无”之间的区别。3.采样率转换导致的损失:转换采样率(SRC)有“上采样”和“下采样”两种,两种方式都会涉及到SRC算法的问题。算法使用的好坏会直接导致信号丢失的多少。上采样不会减少信息,但是也不会增加信息。只会受到算法影响。但是个人和中小型工作室一般不会用到上采样,除非是客户要求……上采样一般由母带工作室进行。下采样会削弱信号质量,道理很简单,把原始音频看做连续信号,就是和AD转换一样。另外下采样的过程中,48khz转44.1khz不满足Nyquist采样定理,会导致不可避免的信号混叠。削弱这种影响非常麻烦,所以如题主一样在同样倍数里转换采样率可以最大程度减小音质的损失。如果使用远超Nyquist采样定理要求的最低采样率(如对于人声来说的192khz)采样的话,被称为“过采样”。过采样在同样倍率里一样不存在信号混叠的问题,同时还可以在下采样的过程中通过噪声整形等等方式提高信噪比。所以大型工作室一般选择192khz过采样或者DSD录音方式(这就是另一套系统了,不仅仅是采样率的问题)来处理信号。对于我们个人或者小型工作室(就混个音,不做母带处理)来说完全没有必要。
页: [1]
查看完整版本: 声卡的48KHz、96KHz、192KHz采样率有何意义

爱淘宝 厦门鹭岛网络-361000.net ,翼企魔方,厦门企业邮局,厦门域名注册,虚拟主机,厦门软件定制|厦门网站建设!