MP3 : TESTS comparatifs CBR/ABR/VBR
Tests réalisés
Pour comparer les différents modes de compression MP3, le test quantitatif le plus simple à réaliser consiste à tracer le spectre en fréquence d'un échantillon musical, c'est-à-dire l'intensité en dB (décibel) en fonction de la fréquence en Hz (hertz). J'ai utilisé des échantillons de 23 secondes, aux format WAV et MP3, dans différents styles musicaux, et j'ai tracé les spectres à l'aide d'Audacity 1.2.6, un logiciel d'édition audio gratuit. J'ai ensuite superposé ces différents graphes pour mieux les comparer.Les résultats donnent un aperçu des différences entre les différents fichiers MP3 et le fichier WAV d'origine. Cependant, seul un aspect quantitatif est ici pris en compte (la fréquence), et l'aspect qualitatif est absent. Ces illustrations sont donc intéressantes mais ne permettent en aucun cas de trancher définitivement en faveur d'une méthode de compression ou d'une autre. Autrement dit, il ne faut pas faire dire à ces tests plus qu'ils ne peuvent.
Influence du débit numérique
Le spectre en fréquence
Pour illustrer la notion de débit, le fameux "bitrate" mesuré en kb/s, j'ai utilisé la méthode CBR (débit constant), de 32 kb/s à 320 kb/s :L'influence du débit numérique sur la bande passante est ici clairement mise en évidence.
Première constatation : le fichier WAV contient des informations au-delà de 22 kHz (22000 Hz). Sachant qu'une oreille humaine standard n'entend pas les sons dont la fréquence dépasse 19 à 20 kHz, on comprend déjà que le format MP3 présente un intérêt indéniable.
En CBR 320 kb/s, l'intensité chute aux alentours de 19,5 kHz ; en 192 kb/s, aux alentours de 18 kHz ; en 160 kb/s, 17 kHz ; en 128 kb/s, 16 kHz ; enfin en 32 kb/s, l'intensité chute aux alentours de 6 kHz.
Si l'on tient compte uniquement de la qualité, et non du poids du fichier MP3, le mode CBR 320 kb/s est quasiment parfait.
Que dire de cette échelle de fréquence par rapport à la perception du son ? Cette chute d'intensité est-elle décelable ?
En terme de hauteur de son (grave-aigu), le doublement de la fréquence représente une montée d'une octave. Une échelle logarithmique en fréquence est donc plus adaptée pour tenter de se rapprocher de notre perception :
On s'aperçoit alors qu'il faut relativiser les observations précédentes, et que mis à part le mode CBR 32 kb/s, tous les autres débits testés donnent des résultats plus proches que ne le laisserait supposer l'échelle linéaire en fréquence.
D'autre part, il faut savoir que le décibel est une unité relative (chaque fois que la puissance sonore est divisée par 2, l'intensité baisse de 3 dB). La valeur 0 dB correspond à un facteur de normalisation de 100 %, au-delà de laquelle le signal est en général écrêté. Ainsi, les zones inférieures du graphe, situées en-dessous de –70 dB, correspondent à des sons ne pouvant être entendus que dans des conditions d'écoute extrêmes, demandant un volume sonore très élevé, puisque leur puissance est plusieurs millions de fois plus faible (puissance 1 000 000 fois plus faible = intensité sonore 1 000 fois plus faible = –60 dB).
L'écoute
Utilisons nos oreilles (quelle bonne idée !). Je vous invite à télécharger et écouter les 3 fichiers suivants :- jamait_cbr032.mp3 (90 kio) : son tout pourri.
- jamait_cbr096.mp3 (275 kio) : son acceptable, malgré le faible débit.
- jamait_cbr160.mp3 (455 kio) : son proche de la perfection. Par rapport au débit de 96 kb/s, on entend notamment que les sons de cymbales sont plus fins, mais globalement la différence n'est pas si grande que ça. Pour vraiment sentir la différence, il faudrait écouter ça très fort, et là, même un débit de 128 kb/s révélerait ses faiblesses.
Conséquence sur le poids de fichier
débit (CBR en kb/s) | poids | facteur de compression (WAV/MP3) | rapport MP3/WAV |
1411 (WAV) | 3962 kio | 1 | 100 % |
320 | 902 kio | 4,4 | 23 % |
192 | 541 kio | 7,3 | 14 % |
160 | 455 kio | 8,7 | 11 % |
128 | 361 kio | 11 | 9 % |
96 | 275 kio | 14 | 7 % |
32 | 90 kio | 44 | 2 % |
On peut vérifier que le rapport WAV/MP3 est directement proportionnel au débit numérique, en accord avec la définition du débit.
À titre de comparaison, une compression non destructive donnerait :
- au format ZIP : 3833 kio, soit un facteur de compression de 1,03,
- au format 7z : 3704 kio, soit un facteur de compression de 1,07.
Calcul du débit binaire moyen
On peut, à partir de la taille de fichier et de la durée de l'enregistrement, calculer le débit moyen du fichier en kb/s. Il s'agit d'ailleurs ici du débit réel puisque celui-ci est constant. Illustration à partir des données du tableau précédent :- Fichier WAV : poids de fichier =
4 057 388 octets (soit 4 057 388 / 1 024 = 3 962
kio) représentent donc 4 057 388 × 8 = 32 459 104 bits,
soit 32 459 104 / 1 000 = 32 459 kb
(kilobits). La durée étant de 23 secondes, le
débit moyen vaut
32 459 / 23 = 1 411 kb/s (kb·s-1).
Les plus attentifs auront remarqué que la conversion octet <—> kibioctet (kio) se fait par un facteur 1024 (préfixe binaire ki- = 210), tout comme les conversions kio <—> Mio, Mio <—> Gio…), alors que la conversion bit <—> kilobit se fait "normalement" (préfixe décimal k- = 1000). - CBR 320 : 923 136 octets (902 kio) = 7 385 088 bits = 7 385 kb. Le débit vaut donc 7 385 / 23 = 321 kb/s, soit environ 320 comme prévu.
- En résumé : débit numérique moyen en kb/s = poids de fichier en kio × 8,192 / durée en secondes.
*Je le suppose d'après les indications données pour les fichiers à débit variable, qui seraient fausses s'il s'agissait du débit moyen.
Comparaison des différentes méthodes de compression
Pour cette comparaison, j'ai utilisé six types de musique différents, auxquels j'ai appliqué des méthodes qui permettent une restitution quasiment parfaite du son tout en conservant un poids de fichier intéressant :- VBR-ABR, avec un débit moyen de 192 kb/s, pour un minimum de 160 kb/s et un maximum de 320 kb/s, abrégé ici en ABR 192,
- VBR-MTRH, avec une qualité VBR de 2, abrégé ici en VBR 2,
- VBR-MTRH, avec une qualité VBR de 3, abrégé ici en VBR 3.
Conclusions
Tout d'abord, je défie quiconque de distinguer ces trois méthodes de compression à l'oreille (je suis d'autant plus à l'aise pour l'affirmer que je ne vous fournit pas ces fichiers - un peu trop lourds, 18 × 500 kio environ).On notera que la méthode "VBR 3" est toujours un peu en retrait par rapport à "ABR 192", pour un gain non significatif en terme de poids de fichier.
On peut également constater que la méthode "ABR 192" est en très léger retrait par rapport à "VBR 2", mais que le gain de place est ici plus marqué.
J'ai personnellement opté pour "VBR 2" (c'est d'ailleurs à peu de chose près la méthode pré-paramétrée "--alt-preset extreme"). J'ai également utilisé "ABR 192" pendant longtemps.
Détails
Yves Jamait, Le Coquelicot - 2006, chanson françaiseAperçu en ABR 96 kb/s
méthode | poids | facteur de compression (WAV/MP3) | rapport MP3/WAV | débit moyen calculé |
VBR 3 | 526 kio | 7,5 | 13 % | 187 kb/s |
ABR 192 | 533 kio | 7,4 | 13 % | 190 kb/s |
VBR 2 | 597 kio | 6,6 | 15 % | 213 kb/s |
M, Mon ego - 2003, chanson/rock français
Aperçu en ABR 96 kb/s
méthode | poids | facteur de compression (WAV/MP3) | rapport MP3/WAV | débit moyen calculé |
VBR 3 | 531 kio | 7,5 | 13 % | 189 kb/s |
ABR 192 | 535 kio | 7,4 | 13 % | 191 kb/s |
VBR 2 | 714 kio | 5,6 | 18 % | 254 kb/s |
Badmarsh & Shri, Signs - 2001, électro
Aperçu en ABR 96 kb/s
méthode | poids | facteur de compression (WAV/MP3) | rapport MP3/WAV | débit moyen calculé |
VBR 3 | 505 kio | 7,8 | 13 % | 180 kb/s |
ABR 192 | 527 kio | 7,5 | 13 % | 188 kb/s |
VBR 2 | 579 kio | 6,8 | 15 % | 206 kb/s |
Steve Coleman, Oyá Natureza - 1996, Jazz
Aperçu en ABR 96 kb/s
méthode | poids | facteur de compression (WAV/MP3) | rapport MP3/WAV | débit moyen calculé |
VBR 3 | 536 kio | 7,4 | 14 % | 191 kb/s |
ABR 192 | 539 kio | 7,4 | 14 % | 192 kb/s |
VBR 2 | 584 kio | 6,8 | 15 % | 208 kb/s |
Maurice Ravel, Sonate pour violon et violoncelle, enregistrement de 1986
Aperçu en ABR 96 kb/s
méthode | poids | facteur de compression (WAV/MP3) | rapport MP3/WAV | débit moyen calculé |
VBR 3 | 486 kio | 8,2 | 12 % | 173 kb/s |
ABR 192 | 510 kio | 7,8 | 13 % | 182 kb/s |
VBR 2 | 518 kio | 7,7 | 13 % | 184 kb/s |
Édith Piaf, La vie en rose - années 1940
Aperçu en ABR 96 kb/s
Ici, du fait de la "pauvreté" de
l'enregistrement, les 3 méthodes donnent le même spectre.
méthode | poids | facteur de compression (WAV/MP3) | rapport MP3/WAV | débit moyen calculé |
VBR 3 | 568 kio | 7,0 | 14 % | 202 kb/s |
ABR 192 | 517 kio | 7,7 | 13 % | 184 kb/s |
VBR 2 | 578 kio | 6,9 | 15 % | 206 kb/s |