Lorsque l’on entend ou voit des échanges à propos du son sur Internet, en particulier sur le format mp3, les interlocuteurs font souvent, très souvent, trop souvent, la confusion entre compression informatique et compression dynamique. Essayons d’éclairer la situation qui n’est pas si compliquée.
La compression dynamique ou audio est de son côté, au centre d’autres enjeux qui sont ignorés la plupart du temps du grand public mais qui participent grandement à un « formatage » actuel du son. Ces enjeux, me semble t-il, doivent être connus. Ainsi, après une clarification entre compression informatique et compression dynamique, j’évoquerai une histoire de la compression dynamique du son enregistré et diffusé.
La compression informatique ou de données
Numérisation
En informatique, toutes les données sont numérisées : texte, image, photo, film, son, etc. Cela signifie que toutes les données sont converties en une suite de « bits ». Le bit est l’unité élémentaire d’information en informatique. C’est la contraction de l’anglais binary digit, qui signifie « chiffre binaire ». Ce chiffre ne peut prendre que 2 valeurs : 0 ou 1, creux ou bosse, ouvert ou fermé, blanc ou noir, réfléchissant ou non, etc. Les bits sont regroupés par groupe de huit appelé octet (« Byte » en anglais). Tout cela est bien connu. Chaque fichier numérique possède donc une taille ou un poids informatique qui s’exprime en octet, ko, Mo, etc. Le terme taille serait sans doute plus approprié puisque physiquement un fichier occupe une certaine surface d’une mémoire informatique.
La compression informatique consiste à réduire ce poids ou cette taille en supprimant des données. Les méthodes utilisées pour cette suppression n’entre pas dans le cadre de ce billet.
Cette compression des données s’accompagne donc toujours d’une perte d’une partie des données (« lossy » disent les anglo-saxons) et donc d’une baisse de la qualité du fichier. Il n’est pas possible de revenir en arrière. Le problème est de trouver un compromis entre la qualité du fichier, son poids et le canal de diffusion.
Exemples
Certains formats résultant de compression sont bien connus : jpg pour les images, divx pour les images animées. Les logiciels utilisés pour encoder les fichiers originaux permettent de régler le taux de compression donc le gain de place mais également la dégradation du fichier.
Le format mp3
Un des plus connus et emblématiques des formats compressés est le mp3. Il fut créé au tout début des années 1990. MP3 signifie MPEG-1 Layer-3 où MPEG signifie : Moving Picture Experts Group (norme ISO/CEI 13818-3). Il est le résultat d’une recherche menée par une équipe de chercheurs de l’Institut Fraunhofer sous la direction de Karlheinz Brandenburg. Il s’agissait d’un projet européen Eureka (EU 147) sur le DAB (Digital Audio Broadcast) c’est à dire la radio numérique diffusée par ondes hertzienne qui sera enfin disponible en France sans doute fin 2009. Il suffit d’être (très) patient.
En aucun cas le format mp3 n’a été créé pour Internet comme on le voit parfois écrit.
Pourquoi le format mp3 s’est il retrouvé sur Internet ? Parce qu’il était adapté au « diamètre des tuyaux » de l’Internet de l’époque. Par construction et choix des inventeurs (Sony et Philips), le son d’un CD-Audio a pour débit 172 ko/s soit 1 376 kb/s. Il était impossible en 1998 de faire circuler un son de qualité CD-Audio dans les tuyaux d’Internet. L’idée était donc de réduire la taille ou le poids de ces fichiers sonores (soniels ) pour qu’ils puissent relativement facilement être diffusés sur Internet soit en streaming, soit en téléchargement. Il est fréquent, pour du téléchargement, que le taux de compression soit réglé autour de 10. C’est à dire que l’on supprime 90 % des données. Excusez du peu !!!
Autres formats compressés de son
Le mp3 n’est pas le seul format de son compressé disponible. En voici une liste non-exhaustive :
- Orbis est « open source » (extension .ogg) ;
- QuickTime de Apple (audio et vidéo) ;
- ATRAC de Sony. C’est le format utilisé pour les Mini Disc et pour le son cinéma SDDS ;
- AAC (Advanced Audio Coding), ce format est utilisé par Apple pour son magasin en ligne. Ce format (extension .m4a pour MPEG 4 audio ou .m4pa) été créé par un consortium comprenant AT&T, Dolby, Fraunhofer IIS, et Sony ;
- wma de Microsoft ;
- etc.
Le compactage
Il ne faut pas confondre compression et compactage même si dans le langage courant, ils sont souvent utilisés l’un pour l’autre. Dans la compression, il y a perte des données (« lossy ») sans possibilité de récupérer les données perdues. Dans le compactage, il y a réduction des données mais il est possible de récupérer l’intégralité des données de départ (« lossless »). C’est le cas du format de compactage très connu « zip » pour le texte. Pourquoi ne pas, alors, utiliser le format zip (on dit « zipper » chez les gens pressés) pour compacter des soniels ? Bonne question, je vous remercie de l’avoir posée. C’est que la structure des données d’un soniel rend inefficace le compactage zip. Le mieux est d’essayer vous même et vous verrez que votre soniel ne sera pas plus léger. Quelques formats proposent une possibilité de compactage pour l’audio :
- Flac (Free Lossless Audio Codec), http://flac.sourceforge.net ;
- Monkey’s Audio, http://www.monkeysaudio.com ;
- LA (Lossless Audio), http://www.lossless-audio.com/ ;
- True Audio (TTA) codec, http://tta.corecodec.org/codec.project ;
- Shorten, .shn
- Etc.
La réduction de taille dans le cas du compactage n’a rien à voir avec la compression, la réduction de la taille des données est de l’ordre de 50 % maximum.
Comparaisons de différents compacteurs audio, http://members.home.nl/w.speek/comparison.htm et http://wiki.hydrogenaudio.org/index.php?title=Lossless_comparison
Compression dynamique ou audio
On entend souvent la réflexion « Ce morceau a beaucoup de dynamique ». La plupart du temps, la personne veut signifier que le morceau écouté est très fort (en volume) ou qu’il a de la « pêche » ou du « punch » alors que comme nous allons le voir si le volume moyen est effectivement élevé voire très élevé c’est justement parce que le morceau n’a pas de dynamique.
La dynamique (audio) c’est l’écart existant entre le son le plus faible et le plus fort dans un morceau.
L’unité de mesure de la dynamique est le décibel dB.
0 dB est le seuil de l’audition.
120 dB est le seuil de la douleur. [1]
La 9e symphonie de Beethoven est connue pour être une des oeuvres de la musique classique ayant la plus grande dynamique. Cela signifie que dans cette oeuvre il existe des passages qui sont extrêmement doux (pianissimo) et d’autres au contraire extrêmement forts (fortissimo). Il est possible suivant les interprétations et les effectifs qu’en concert les 100 dB de dynamique oient dépassés, ce qui est énorme.
La compression dynamique audio consiste à réduire artificiellement cette dynamique, cet écart entre les sons faibles et les sons forts.
Pourquoi diable vouloir réduire cette dynamique parfaitement naturelle. Comme nous le verrons dans les prochain billets, parfois on n’a pas le choix, parfois c’est un choix esthétique et enfin parfois c’est un choix, … c’est un choix, comment dire, … d’insensés.
Alors : compression informatique ou compression dynamique ?
Comme nous venons de le voir, si, dans les deux types de compression, il s’agit d’une réduction, cette réduction ne s’applique pas aux mêmes paramètres. En fait ça n’a rien à voir. Pour enfoncer le clou, la compression informatique ne peut exister, comme son nom l’indique, que dans le monde numérique alors que la compression dynamique audio existe dans les mondes analogique ET numérique.
Une personne avertie vaut au moins un nuage d’internautes sur le web.
A partir de la semaine prochaine, je débuterai une série de billets sur une histoire de la compression dynamique du son enregistré et diffusé.
1er épisode : La dynamique des instruments (avec des écoutes).
[1] Bureau International des Poids et Mesures
http://www.bipm.org/utils/common/pdf/si_brochure_8_fr.pdf page 42