-
-
Save misaka00251/ca2d6e696bb41a1f3840b5831694a2b0 to your computer and use it in GitHub Desktop.
MP3
This file contains bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
下面是MP3编码类型的详细介绍: | |
1、音乐格式——将音源信号按照不同的协议进行录制和压缩进行处理后,形成的档案文件格式。音乐格式分无损压缩格式(如CD、WAVE等格式)、有损压缩格式(如MP3、RM、WMA)和一些专用格式(如MIDI)。 本文主要是对音频格式分析。 | |
2、位速——每秒钟声音流的字节数,也叫码率、码速、线速等。单位是Kbps或Kb/s,注意这里使用的"b"是bit。通常人们“位速”又叫音效水平,一般位速高代表音效水平较好。 | |
3、档案容量——是指存储在记录器(如磁盘、光盘等)上的占用空间容量。一般用*MB表示,本文使用的"B"是byt单位; 1byt=8bit。 | |
4、声音文件——是音乐、歌曲、朗诵等文件的总称。为行文直观,本文也用音乐、歌曲的来泛代声音文件。 | |
首先我们来认识下MP3这种现下最流行的音频格式: | |
MP3 是利用 MPEG Audio Layer 3 的技术,将声音用 1:10 甚至 1:12 的压缩率,变成容量较小的文件,但是在人耳听起来,却没有什么不同。当然这是一种失真压缩,就像图形文件 JPG 一样,因为失真压缩,所以可以压得很多,也可以调整压缩比率,压得越多失真也越多。 | |
现在最流行的几款MP3编码方式: | |
VBR(Variable Bitrate)动态比特率。也就是没有固定的比特率,压缩软件在压缩时根据音频数据即时确定使用什么比特率,这是以质量为前提兼顾文件大小的方式,推荐编码模式; | |
ABR(Average Bitrate)平均比特率,是VBR的一种插值参数。LAME针对CBR不佳的文件体积比和VBR生成文件大小不定的特点独创了这种编码模式。ABR在指定的文件大小内,以每50帧(30帧约1秒)为一段,低频和不敏感频率使用相对低的流量,高频和大动态表现时使用高流量,可以做为VBR和CBR的一种折衷选择。 | |
CBR(Constant Bitrate),常数比特率,指文件从头到尾都是一种位速率。相对于VBR和ABR来讲,它压缩出来的文件体积很大,而且音质相对于VBR和ABR不会有明显的提高。 | |
MPC: (MusePaCk) 音乐格式新宠儿MPC,在全方面音频测试中MPC是所有编码中最好的.为了保证高音质,它的最大码率甚至高达1.32Mbps,这已经快接近CD的1.41Mbps了!不过由于知名度较前面的低,直接就能播放MPC的软件非常少,据我们所知只有FooBar2000和JetAudio 5. | |
由于大家对mp3这种格式大多都是略知皮毛,现对MP3及音频压缩技术的一些误解进行解答 | |
1、mp3的音质很差? | |
错。mp3作为当前音频有损压缩的“王者”,它的编码技术已经几近完美。很多人只是不清楚如何才能压缩出高品质的mp3而已。2001年12月,世界上最优秀的mp3编码器--LAME推出了**性的版本3.90.2,针对lame压缩参数过于烦琐的情况,提供了几个preset(预设)参数。现在只要使用LAME的standard(标准)模式进行压缩,就能得到近似于CD的完美音质。 | |
2、128kbps的mp3=CD音质? | |
错。首先,所谓CD音质是一个带有很大主观性的名词,基本上可以认为CD音质意味着在平均水平的听音条件下能达到用光驱放CD的效果。但是根据这个定义,无数的试听结果表明,不管用什么编码器,什么样的设置,128kbps的mp3都不能达到这个标准。关于这方面的主题可参考[url]http://ff123.net/[/url],这是一个非常著名的国外音频站点,对128kbps的mp3的测试有非常详细的理论阐述。 | |
3、mp3 192kbps CBR(固定比特速率) stereo(立体声)编码是音质与文件大小的最佳平衡设置? | |
错。这一误解有很深的根源。因为128kbps的mp3在音质上不能被“苛刻”的音乐爱好者接受,所以他们要寻求更好的设置。对Xing编码器及Fraunhofer编码器来说,直到现在它们在VBR(可变比特速率)和jointstereo(混合立体声)的算法上都很失败,所以很多人都认为CBR和stereo才是最佳的选择,而且192kbps的mp3在文件大小上也是可以接受的。是LAME编码器改变了这一切!LAME采用的VBR及智能的joint stereo算法非常优秀,已经没什么理由再去使用CBR和stereo--这样做只会浪费有限的bits。标准的VBR预定设置(即使用--alt-preset standard参数)生成的mp3文件的平均比特率也是192kbps,但它的音质要好过CBR 192kbps,在同等的比特率下其他的编码器非其敌手(按:除了1、mpc--其音质在该bitrate左右好于mp3, 2、最近的oggenc 1.0--not tested yet)。 | |
4、mp3 320kbps CBR Stereo是mp3音质的极限? | |
错(或者说Not exactly true)。虽然320kbps是mp3标准的极限,但在320kbps下使用设计良好的Joint Stereo,能够将节省下下的bits用于纯粹的音乐部分(从而提高音质)。如果音源的立体声分离度很低,使用完全的stereo是一种浪费。 | |
5、VBR的音质不如CBR? | |
错。设计良好的VBR算法不会将bits浪费在易于编码的部分,节省下来的bits将用在对复杂的音频部分进行编码。这一误解可能来自于较老的FhG Encoder的VBR算法及Xing VBR算法中存在的bug,对当前的lame编码器来说,它的VBR算法已被协调得很好,不会有音质上的问题。 | |
最高品质参数: | |
--alt-preset insane或者--alt-preset cbr 320 | |
320k CBR,音质最好,文件体积最大 | |
VBR参数: | |
1.--alt-preset extreme | |
220-270k左右的VBR,音质与上面参数相仿,但文件体积小25%,推荐此参数 | |
2.--alt-preset fast extreme | |
音质比上面参数稍微差一些 | |
3.--alt-preset standard | |
180-220k左右的VBR,在音质和文件大小之间比较好的平衡 | |
4.--alt-preset fast standard | |
音质比上面参数稍微差一些 | |
5.--alt-preset standard -Y | |
虽然品质稍差,但文件体积非常小 | |
ABR参数: | |
--alt-preset <Bitrate> | |
(可用Bitrate:80、96、112、128、160、192、224、256、320) | |
CBR参数: | |
--alt-preset cbr <Bitrate> | |
(可用Bitrate:80、96、112、128、160、192、224、256、320) | |
今天我尝试成功了一个【万能】的完美压制320KCBR的参数。 | |
-b 320 --lowpass -1 | |
本帖最后由 chncwk 于 2010.7.15 10:46 编辑 | |
Mp3、WMA、AAC、OGG音质对比 | |
2009-09-13 15:16 | |
个人对有损格式的感觉: | |
任何有损格式,码率当然都是越高越好。码率高,不仅波形失真小,而且频率的衰减也小。 | |
如果说一定要按照频谱衰竭程度,把有损音频格式排个名的话:(Mp3指CBR,AAC指LC) | |
同等码率(CBR)下 | |
大于320K OGG、AAC都基本快接近无损 | |
320K OGG=AAC>Mp3>WMA | |
256K OGG>AAC>Mp3>WMA | |
224K OGG>Mp3>AAC>WMA | |
192K OGG>Mp3>WMA>AAC | |
128K OGG>WMA>AAC>Mp3 | |
96K AAC(HE)>OGG>WMA>Mp3(OGG此时失真严重,所以听觉上可能AAC(HE)>WMA>OGG>Mp3) | |
64K AAC(HE)>OGG>WMA>Mp3(OGG此时失真严重,所以听觉上可能AAC(HE)>WMA>OGG>Mp3) | |
另外各种格式都有自己的优势码率范围: | |
OGG的优势范围:96K以上(OGG) | |
AAC的优势范围:AAC LC应高于(包含)256K AAC HE 48K-96K(AAC HE真强) | |
Mp3的优势范围:192K(包含)以上 | |
WMA的优势范围:128K(包含)以下 | |
如果你的机器支持,128K(包含)以上请用OGG,64K-96K请用AAC(HE) | |
如果你的机器只支持WMA和Mp3,192K以上(包含)请用Mp3,128K以下(包含)请用WMA | |
64K以下什么格式都很衰,所以请至少保留64K以上的码率。 | |
单从频率范围来讲: | |
对于1个理论上的正常人来说,听觉范围大约为50Hz-20KHz。那么你的选择为 | |
Mp3 CBR 码率高于(包含)224K | |
WMA 码率高于(包含)224K | |
AAC LC 码率高于(包含)256K 、AAC HE 码(包含)率高于48K | |
OGG 码率高于(包含)192K | |
Mp3-pro 码率高于(包含)80K | |
■Mp3 VBR 高频不合格! | |
对于1个普通音乐迷来说,听觉范围大约为1KHz~16KHz。那么你的选择为 | |
Mp3 CBR 码率高于(包含)192K | |
Mp3 VBR 码率高于V6编码 即高于128K | |
WMA 码率高于(包含)128K | |
AAC LC 码率高于(包含)128K、AAC HE 码率高于(包含)48K | |
OGG 码率高于(包含)96K | |
Mp3-Pro 码率高于(包含)56K | |
当然还有金耳朵们,听觉范围大约为20Hz~22KHz。那么你的选择为 | |
首先当然是无损,然后有损里面可以试试: | |
Mp3 CBR 码率高于(包含)224K | |
WMA 码率高于(包含)224K | |
AAC LC 码率高于(包含)256K、AAC HE 码率高于(包含)48K | |
OGG 码率高于(包含)192K | |
Mp3-Pro 码率高于(包含)80K | |
■Mp3 VBR 高频不合格! | |
当然,每个人都有自己的感觉 | |
例如Mp3 CBR的低频有点差,所以听古典音乐觉得很生硬……等等 | |
这个感觉问题就只有大家自己慢慢体会了! | |
16K~20KHz频率: | |
这段频率范围实际上对于人耳的听觉器官来说,已经听不到了,因为人耳听觉的最高频率是15.1KHz。但是,人可以通过人体和头骨、颅骨将感受到的16~20KHz频率的声波传递给大脑的听觉脑区,因而感受到这个声波的存在。这段频率影响音色的韵味、色彩、感情味。如果音响系统的频率响应范围达不到这个频率范围,那么音色的韵味将会失落;而如果这段频率过强,则给人一种宇宙声的感觉,一种幻觉,一种神秘莫测的感觉,使人有一种不稳定的感觉。因为这些频率大多数是基音的不谐和音频率,所以会产生一种不安定的感受。这段频率在音色当中强度很小,但是很重要,是音色的表现力部分,也是常常被人们忽略的部分,甚至有些人根本感觉不到它的存在。 | |
12K~16KHz频率: | |
这是人耳可以听到的高频率声波,是音色最富于表现力的部分,是一些高音乐器和高音打击乐器的高频泛音频段,例如镲、铃、铃鼓、沙锤、铜刷、三角铁等打击乐器的高频泛音,可给人一种“金光四射”的感觉,强烈地表现了各种乐器的个性。如果这段频率成分不足,则音色将会会失掉色彩,失去个性;而如果这段频率成分过强,如激励器激励过强,音色会产生“毛刺”般尖噪、刺耳的高频噪声,对此频段应给予一定的适当的衰减。 | |
10K~12KHz频率: | |
这是高音木管乐器的高音铜管乐器的高频泛音频段,例如长笛、双簧管、小号、短笛等高音管乐器的金属声非常强烈。如果这段频率缺乏,则音色将会失去光泽,失去个性;如果这段频率过强,则会产生尖噪,刺耳的感觉。 | |
8K~10KHz频率: | |
这段频率s音非常明显,影响音色的清晰度和透明度。如果这频率成分缺少,音色则变得平平淡淡;如果这段频率成分过多,音色则变得尖锐。 | |
6K~8KHz频率: | |
这段频率影响音色的明亮度,这是人耳听觉敏感的频率,影响音色清晰度。如果这段频率成分缺少,则音色会变得暗淡;如果这段频率成分过强,则音色显得齿音严重。 | |
5K~6KHz频率: | |
这段频率最影响语音的清晰度、可懂度。如果这段频率成分不足,则音色显得含糊不清;如果此段频率成分过强,则音色变得锋利,易使人产生听觉上的疲劳感。 | |
4K~5KHz频率: | |
这段频率对乐器的表面响度有影响。如果这段频率成分幅度大了,乐器的响度就会提高;如果这段频率强度变小了,会使人听觉感到这种乐器与人耳的距离变远了;如果这段频率强度提高了,则会使人感觉乐器与人耳的距离变近了。 | |
4KHz频率: | |
这个频率的穿透力很强。人耳耳腔的谐振频率是1K~4KHz所以人耳对这个频率也是非常敏感的。如果空虚频率成分过少,听觉能力会变差,语音显得模糊不清了。如果这个频率成分过强了,则会产生咳声的感觉,例如当收音机接收电台频率不正时,播音员常发出的咳音声。 | |
2K~3KHz频率: | |
这段频率是影响声音明亮度最敏感的频段,如果这段频率成分丰富,则音色的明亮度会增强,如果这段频率幅度不足,则音色将会变得朦朦胧胧;而如果这段频率成分过强,音色就会显得呆板、发硬、不自然. | |
1K~2KHz频率: | |
这段频率范围通透感明显,顺畅感强。如果这段频率缺乏,音色则松散且音色脱节;如果这段频率过强,音色则有跳跃感。 | |
800Hz频率: | |
这个频率幅度影响音色的力度。如果这个频率丰满,音色会显得强劲有力;如果这个频率不足,音色将会显得松弛,也就是800Hz以下的成分特性表现突出了,低频成分就明显;而如果这个频率过多了,则会产生喉音感。人人都有一个喉腔,人人都有一定的喉音,如果音色中的喉音成分过多了,则会失掉语音的个性、失掉音色美感。因此,音响师把这个频率称为"危险频率",要谨慎使用。 | |
500Hz~1KHz频率: | |
这段频率是人声的基音频率区域,是一个重要的频率范围。如果这段频率丰满,人声的轮廓明朗,整体感好;如果这段频率幅度不足,语音会产生一种收缩感;如果这段频率过强,语音就会产生一种向前凸出的感觉,使语音产生一种提前进人人耳的听觉感受。 | |
300Hz~500Hz频率: | |
这段频率是语音的主要音区频率。这段频率的幅度丰满,语音有力度。如果这段频率幅度不足,声音会显得空洞、不坚实;如果这段频率幅度过强,音色会变得单调,相对来说低频成分少了,高频成分也少了,语音会变成像电话中声音的音色一样,显得很单调。 | |
150Hz~300Hz频率: | |
这段频率影响声音的力度,尤其是男声声音的力度。这段频率是男声声音的低频基音频率,同时也是乐音中和弦的根音频率。如果这段频率成分缺乏,音色会显得发软、发飘,语音则会变得软绵绵;如果这段频率成分过强,声音会变得生硬而不自然,且没有特色。 | |
100Hz~150Hz频率: | |
这段频率影响音色的丰满度。如果这段频率成分增强,就会产生一种房间共鸣的空间感、混厚感;如果这段频率成分缺少,音色会变得单薄、苍白;如果这段频率成分过强,音色将会显得浑浊,语音的清晰度变差。 | |
60Hz~100Hz: | |
这段频率影响声音的混厚感,是低音的基音区。如果这段频率很丰满,音色会显得厚实、混厚感强。如果这段频率不足,音色会变得无力;而如果这段频率过强,音色会出现低频共振声,有轰鸣声的感觉。 | |
20Hz~60Hz频率: | |
这段频率影响音色的空间感,这是因为乐音的基音大多在这段频率以上。这段频率是房间或厅堂的谐振频率。如果这段频率表现的充分,会使人产生一种置身于大厅之中的感受;如果这段频率缺乏,音色会变得空虚;而如果这段频率过强,会产生一种嗡嗡的低频共振的声音,严重地影响了语音的清晰度和可懂度。 |
Sign up for free
to join this conversation on GitHub.
Already have an account?
Sign in to comment
上面的信息很有用,这里推荐一些可以下载或者转换成mp3格式的在线网站和软件:https://musicfab.org/convert-spotify-to-mp3