Skip to content

Instantly share code, notes, and snippets.

@misaka00251
Created August 6, 2016 05:44
Show Gist options
  • Save misaka00251/ca2d6e696bb41a1f3840b5831694a2b0 to your computer and use it in GitHub Desktop.
Save misaka00251/ca2d6e696bb41a1f3840b5831694a2b0 to your computer and use it in GitHub Desktop.
MP3
下面是MP3编码类型的详细介绍:
1、音乐格式——将音源信号按照不同的协议进行录制和压缩进行处理后,形成的档案文件格式。音乐格式分无损压缩格式(如CD、WAVE等格式)、有损压缩格式(如MP3、RM、WMA)和一些专用格式(如MIDI)。 本文主要是对音频格式分析。
2、位速——每秒钟声音流的字节数,也叫码率、码速、线速等。单位是Kbps或Kb/s,注意这里使用的"b"是bit。通常人们“位速”又叫音效水平,一般位速高代表音效水平较好。
3、档案容量——是指存储在记录器(如磁盘、光盘等)上的占用空间容量。一般用*MB表示,本文使用的"B"是byt单位; 1byt=8bit。
4、声音文件——是音乐、歌曲、朗诵等文件的总称。为行文直观,本文也用音乐、歌曲的来泛代声音文件。
首先我们来认识下MP3这种现下最流行的音频格式:
MP3 是利用 MPEG Audio Layer 3 的技术,将声音用 1:10 甚至 1:12 的压缩率,变成容量较小的文件,但是在人耳听起来,却没有什么不同。当然这是一种失真压缩,就像图形文件 JPG 一样,因为失真压缩,所以可以压得很多,也可以调整压缩比率,压得越多失真也越多。
现在最流行的几款MP3编码方式:
VBR(Variable Bitrate)动态比特率。也就是没有固定的比特率,压缩软件在压缩时根据音频数据即时确定使用什么比特率,这是以质量为前提兼顾文件大小的方式,推荐编码模式;
ABR(Average Bitrate)平均比特率,是VBR的一种插值参数。LAME针对CBR不佳的文件体积比和VBR生成文件大小不定的特点独创了这种编码模式。ABR在指定的文件大小内,以每50帧(30帧约1秒)为一段,低频和不敏感频率使用相对低的流量,高频和大动态表现时使用高流量,可以做为VBR和CBR的一种折衷选择。
CBR(Constant Bitrate),常数比特率,指文件从头到尾都是一种位速率。相对于VBR和ABR来讲,它压缩出来的文件体积很大,而且音质相对于VBR和ABR不会有明显的提高。
MPC: (MusePaCk) 音乐格式新宠儿MPC,在全方面音频测试中MPC是所有编码中最好的.为了保证高音质,它的最大码率甚至高达1.32Mbps,这已经快接近CD的1.41Mbps了!不过由于知名度较前面的低,直接就能播放MPC的软件非常少,据我们所知只有FooBar2000和JetAudio 5.
由于大家对mp3这种格式大多都是略知皮毛,现对MP3及音频压缩技术的一些误解进行解答
1、mp3的音质很差?
错。mp3作为当前音频有损压缩的“王者”,它的编码技术已经几近完美。很多人只是不清楚如何才能压缩出高品质的mp3而已。2001年12月,世界上最优秀的mp3编码器--LAME推出了**性的版本3.90.2,针对lame压缩参数过于烦琐的情况,提供了几个preset(预设)参数。现在只要使用LAME的standard(标准)模式进行压缩,就能得到近似于CD的完美音质。
2、128kbps的mp3=CD音质?
错。首先,所谓CD音质是一个带有很大主观性的名词,基本上可以认为CD音质意味着在平均水平的听音条件下能达到用光驱放CD的效果。但是根据这个定义,无数的试听结果表明,不管用什么编码器,什么样的设置,128kbps的mp3都不能达到这个标准。关于这方面的主题可参考[url]http://ff123.net/[/url],这是一个非常著名的国外音频站点,对128kbps的mp3的测试有非常详细的理论阐述。
3、mp3 192kbps CBR(固定比特速率) stereo(立体声)编码是音质与文件大小的最佳平衡设置?
错。这一误解有很深的根源。因为128kbps的mp3在音质上不能被“苛刻”的音乐爱好者接受,所以他们要寻求更好的设置。对Xing编码器及Fraunhofer编码器来说,直到现在它们在VBR(可变比特速率)和jointstereo(混合立体声)的算法上都很失败,所以很多人都认为CBR和stereo才是最佳的选择,而且192kbps的mp3在文件大小上也是可以接受的。是LAME编码器改变了这一切!LAME采用的VBR及智能的joint stereo算法非常优秀,已经没什么理由再去使用CBR和stereo--这样做只会浪费有限的bits。标准的VBR预定设置(即使用--alt-preset standard参数)生成的mp3文件的平均比特率也是192kbps,但它的音质要好过CBR 192kbps,在同等的比特率下其他的编码器非其敌手(按:除了1、mpc--其音质在该bitrate左右好于mp3, 2、最近的oggenc 1.0--not tested yet)。
4、mp3 320kbps CBR Stereo是mp3音质的极限?
错(或者说Not exactly true)。虽然320kbps是mp3标准的极限,但在320kbps下使用设计良好的Joint Stereo,能够将节省下下的bits用于纯粹的音乐部分(从而提高音质)。如果音源的立体声分离度很低,使用完全的stereo是一种浪费。
5、VBR的音质不如CBR?
错。设计良好的VBR算法不会将bits浪费在易于编码的部分,节省下来的bits将用在对复杂的音频部分进行编码。这一误解可能来自于较老的FhG Encoder的VBR算法及Xing VBR算法中存在的bug,对当前的lame编码器来说,它的VBR算法已被协调得很好,不会有音质上的问题。
最高品质参数:
--alt-preset insane或者--alt-preset cbr 320
320k CBR,音质最好,文件体积最大
VBR参数:
1.--alt-preset extreme
220-270k左右的VBR,音质与上面参数相仿,但文件体积小25%,推荐此参数
2.--alt-preset fast extreme
音质比上面参数稍微差一些
3.--alt-preset standard
180-220k左右的VBR,在音质和文件大小之间比较好的平衡
4.--alt-preset fast standard
音质比上面参数稍微差一些
5.--alt-preset standard -Y
虽然品质稍差,但文件体积非常小
ABR参数:
--alt-preset <Bitrate>
(可用Bitrate:80、96、112、128、160、192、224、256、320)
CBR参数:
--alt-preset cbr <Bitrate>
(可用Bitrate:80、96、112、128、160、192、224、256、320)
今天我尝试成功了一个【万能】的完美压制320KCBR的参数。
-b 320 --lowpass -1
本帖最后由 chncwk 于 2010.7.15 10:46 编辑
Mp3、WMA、AAC、OGG音质对比
2009-09-13 15:16
个人对有损格式的感觉:
任何有损格式,码率当然都是越高越好。码率高,不仅波形失真小,而且频率的衰减也小。
如果说一定要按照频谱衰竭程度,把有损音频格式排个名的话:(Mp3指CBR,AAC指LC)
同等码率(CBR)下
大于320K OGG、AAC都基本快接近无损
320K OGG=AAC>Mp3>WMA
256K OGG>AAC>Mp3>WMA
224K OGG>Mp3>AAC>WMA
192K OGG>Mp3>WMA>AAC
128K OGG>WMA>AAC>Mp3
96K AAC(HE)>OGG>WMA>Mp3(OGG此时失真严重,所以听觉上可能AAC(HE)>WMA>OGG>Mp3)
64K AAC(HE)>OGG>WMA>Mp3(OGG此时失真严重,所以听觉上可能AAC(HE)>WMA>OGG>Mp3)
另外各种格式都有自己的优势码率范围:
OGG的优势范围:96K以上(OGG)
AAC的优势范围:AAC LC应高于(包含)256K AAC HE 48K-96K(AAC HE真强)
Mp3的优势范围:192K(包含)以上
WMA的优势范围:128K(包含)以下
如果你的机器支持,128K(包含)以上请用OGG,64K-96K请用AAC(HE)
如果你的机器只支持WMA和Mp3,192K以上(包含)请用Mp3,128K以下(包含)请用WMA
64K以下什么格式都很衰,所以请至少保留64K以上的码率。
单从频率范围来讲:
对于1个理论上的正常人来说,听觉范围大约为50Hz-20KHz。那么你的选择为
Mp3 CBR 码率高于(包含)224K
WMA 码率高于(包含)224K
AAC LC 码率高于(包含)256K 、AAC HE 码(包含)率高于48K
OGG 码率高于(包含)192K
Mp3-pro 码率高于(包含)80K
■Mp3 VBR 高频不合格!
对于1个普通音乐迷来说,听觉范围大约为1KHz~16KHz。那么你的选择为
Mp3 CBR 码率高于(包含)192K
Mp3 VBR 码率高于V6编码 即高于128K
WMA 码率高于(包含)128K
AAC LC 码率高于(包含)128K、AAC HE 码率高于(包含)48K
OGG 码率高于(包含)96K
Mp3-Pro 码率高于(包含)56K
当然还有金耳朵们,听觉范围大约为20Hz~22KHz。那么你的选择为
首先当然是无损,然后有损里面可以试试:
Mp3 CBR 码率高于(包含)224K
WMA 码率高于(包含)224K
AAC LC 码率高于(包含)256K、AAC HE 码率高于(包含)48K
OGG 码率高于(包含)192K
Mp3-Pro 码率高于(包含)80K
■Mp3 VBR 高频不合格!
当然,每个人都有自己的感觉
例如Mp3 CBR的低频有点差,所以听古典音乐觉得很生硬……等等
这个感觉问题就只有大家自己慢慢体会了!
16K~20KHz频率:
这段频率范围实际上对于人耳的听觉器官来说,已经听不到了,因为人耳听觉的最高频率是15.1KHz。但是,人可以通过人体和头骨、颅骨将感受到的16~20KHz频率的声波传递给大脑的听觉脑区,因而感受到这个声波的存在。这段频率影响音色的韵味、色彩、感情味。如果音响系统的频率响应范围达不到这个频率范围,那么音色的韵味将会失落;而如果这段频率过强,则给人一种宇宙声的感觉,一种幻觉,一种神秘莫测的感觉,使人有一种不稳定的感觉。因为这些频率大多数是基音的不谐和音频率,所以会产生一种不安定的感受。这段频率在音色当中强度很小,但是很重要,是音色的表现力部分,也是常常被人们忽略的部分,甚至有些人根本感觉不到它的存在。
12K~16KHz频率:
这是人耳可以听到的高频率声波,是音色最富于表现力的部分,是一些高音乐器和高音打击乐器的高频泛音频段,例如镲、铃、铃鼓、沙锤、铜刷、三角铁等打击乐器的高频泛音,可给人一种“金光四射”的感觉,强烈地表现了各种乐器的个性。如果这段频率成分不足,则音色将会会失掉色彩,失去个性;而如果这段频率成分过强,如激励器激励过强,音色会产生“毛刺”般尖噪、刺耳的高频噪声,对此频段应给予一定的适当的衰减。
10K~12KHz频率:
这是高音木管乐器的高音铜管乐器的高频泛音频段,例如长笛、双簧管、小号、短笛等高音管乐器的金属声非常强烈。如果这段频率缺乏,则音色将会失去光泽,失去个性;如果这段频率过强,则会产生尖噪,刺耳的感觉。
8K~10KHz频率:
这段频率s音非常明显,影响音色的清晰度和透明度。如果这频率成分缺少,音色则变得平平淡淡;如果这段频率成分过多,音色则变得尖锐。
6K~8KHz频率:
这段频率影响音色的明亮度,这是人耳听觉敏感的频率,影响音色清晰度。如果这段频率成分缺少,则音色会变得暗淡;如果这段频率成分过强,则音色显得齿音严重。
5K~6KHz频率:
这段频率最影响语音的清晰度、可懂度。如果这段频率成分不足,则音色显得含糊不清;如果此段频率成分过强,则音色变得锋利,易使人产生听觉上的疲劳感。
4K~5KHz频率:
这段频率对乐器的表面响度有影响。如果这段频率成分幅度大了,乐器的响度就会提高;如果这段频率强度变小了,会使人听觉感到这种乐器与人耳的距离变远了;如果这段频率强度提高了,则会使人感觉乐器与人耳的距离变近了。
4KHz频率:
这个频率的穿透力很强。人耳耳腔的谐振频率是1K~4KHz所以人耳对这个频率也是非常敏感的。如果空虚频率成分过少,听觉能力会变差,语音显得模糊不清了。如果这个频率成分过强了,则会产生咳声的感觉,例如当收音机接收电台频率不正时,播音员常发出的咳音声。
2K~3KHz频率:
这段频率是影响声音明亮度最敏感的频段,如果这段频率成分丰富,则音色的明亮度会增强,如果这段频率幅度不足,则音色将会变得朦朦胧胧;而如果这段频率成分过强,音色就会显得呆板、发硬、不自然.
1K~2KHz频率:
这段频率范围通透感明显,顺畅感强。如果这段频率缺乏,音色则松散且音色脱节;如果这段频率过强,音色则有跳跃感。
800Hz频率:
这个频率幅度影响音色的力度。如果这个频率丰满,音色会显得强劲有力;如果这个频率不足,音色将会显得松弛,也就是800Hz以下的成分特性表现突出了,低频成分就明显;而如果这个频率过多了,则会产生喉音感。人人都有一个喉腔,人人都有一定的喉音,如果音色中的喉音成分过多了,则会失掉语音的个性、失掉音色美感。因此,音响师把这个频率称为"危险频率",要谨慎使用。
500Hz~1KHz频率:
这段频率是人声的基音频率区域,是一个重要的频率范围。如果这段频率丰满,人声的轮廓明朗,整体感好;如果这段频率幅度不足,语音会产生一种收缩感;如果这段频率过强,语音就会产生一种向前凸出的感觉,使语音产生一种提前进人人耳的听觉感受。
300Hz~500Hz频率:
这段频率是语音的主要音区频率。这段频率的幅度丰满,语音有力度。如果这段频率幅度不足,声音会显得空洞、不坚实;如果这段频率幅度过强,音色会变得单调,相对来说低频成分少了,高频成分也少了,语音会变成像电话中声音的音色一样,显得很单调。
150Hz~300Hz频率:
这段频率影响声音的力度,尤其是男声声音的力度。这段频率是男声声音的低频基音频率,同时也是乐音中和弦的根音频率。如果这段频率成分缺乏,音色会显得发软、发飘,语音则会变得软绵绵;如果这段频率成分过强,声音会变得生硬而不自然,且没有特色。
100Hz~150Hz频率:
这段频率影响音色的丰满度。如果这段频率成分增强,就会产生一种房间共鸣的空间感、混厚感;如果这段频率成分缺少,音色会变得单薄、苍白;如果这段频率成分过强,音色将会显得浑浊,语音的清晰度变差。
60Hz~100Hz:
这段频率影响声音的混厚感,是低音的基音区。如果这段频率很丰满,音色会显得厚实、混厚感强。如果这段频率不足,音色会变得无力;而如果这段频率过强,音色会出现低频共振声,有轰鸣声的感觉。
20Hz~60Hz频率:
这段频率影响音色的空间感,这是因为乐音的基音大多在这段频率以上。这段频率是房间或厅堂的谐振频率。如果这段频率表现的充分,会使人产生一种置身于大厅之中的感受;如果这段频率缺乏,音色会变得空虚;而如果这段频率过强,会产生一种嗡嗡的低频共振的声音,严重地影响了语音的清晰度和可懂度。
@kira-tanaka
Copy link

上面的信息很有用,这里推荐一些可以下载或者转换成mp3格式的在线网站和软件:https://musicfab.org/convert-spotify-to-mp3

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment