Pour comprendre ce que signifie l'échantillonnage
(en anglais : "sampling"), il faut penser
à la pellicule d'un film de cinéma. Chaque seconde
du film est divisée en 24 images fixées sur cette
pellicule. C'est le défilement rapide de ces images, à
l'aide d'un projecteur, qui donne l'impression de mouvement.
S'il n'y avait, par exemple, que 6 images par seconde, on verrait
la différence : les mouvements des acteurs seraient
saccadés. Si on réduisait le défilement à
une image par seconde, ce ne serait plus un film mais une succession
de photographies. A l'inverse, si on utilisait, par exemple, 60
images par seconde, ça ne servirait à rien puisqu'à
partir d'un certain seuil (24 à 30 images/seconde), l'oeil
humain ne perçoit plus la différence
Pour la numérisation du son, c'est un peu la même
idée. Chaque seconde de son est découpée en
plusieurs "photos" qu'on appelle "échantillons".
Comme pour le cinéma, plus le nombre de photos est élevé,
plus le son sera précis. Mais il en faut beaucoup plus qu'au
cinéma.
Pour rendre un son de qualité téléphonique,
11025 échantillons par seconde sont nécessaires. On
dira que le son est échantillonné (on dit aussi "encodé")
à la fréquence de 11025 Hz (Hertz) ou 11 kilo-hertz
(kHz). Pour une qualité de son équivalente à
celle d'une cassette normale, il faut 22050 échantillons/sec.
Et pour atteindre la qualité d'un disque compact, c'est 44100
échantillons/sec. Au-delà de 48000 kHz, l'oreille
humaine ne perçoit plus la différence.

Pour "voir" une représentation de ces échantillons
(sous la forme de petits carrés blancs), il suffit d'utiliser
la loupe dans votre logiciel de montage. Dans CoolEdit par exemple,
cette loupe est accessible par les boutons "zoom", "in"
et "out".
Ouvrez un fichier son et cliquez une dizaine de fois, avec la souris,
sur le bouton "in". La courbe de son s'aplatira et vous
la verrez se transformer en une succession de points carrés.
Chacun de ces points représente un échantillon. Pour
un son encodé dans une qualité de disque compact (CD),
il correspond donc à une "photo" du son prise à
1/44100ième de seconde.
Le taux ou la fréquence d'échantillonnage
(en anglais : "sample rate")
Les logiciels de montage du son offrent des fréquences d'échantillonnage
pré-réglées qui peuvent varier de l'un à
l'autre. Dans Wave Studio par exemple, vous pouvez choisir trois
réglages différents (11025, 22050 ou 44100 Hz)
alors que douze fréquences sont permises par CoolEdit 2000
(6000, 8000, 11025, 16000, 22050, 32000, 32075, 44100 ou 48000 Hz).
Quelle fréquence d'échantillonnage choisir ?
Pour
obtenir une qualité de son comparable à celle d'un
disque compact ou d'un enregistrement sur bande dans un studio de
radio, il faut échantilloner à 44100 Hz.
Pour les besoins du reportage radio, il est préférable
de toujours choisir cette fréquence, quitte à diminuer
l'échantillonnage par la suite. Ceci est encore plus valable
lorsque vos auditeurs ne sont équipés que de petits
postes récepteurs et que votre radio émet en AM. En
effet, il est très important qu'à la source (prise
de son et numérisation) la qualité du son soit bonne
si, à l'arrivée (transfert du reportage monté
sur cassette ou sur bande, diffusion par la station et réception
sur le poste radio d'un auditeur), vous voulez éviter trop
de perte en qualité. Il ne vous aura servi à rien
d'enregistrer des ambiances subtiles (chants d'oiseaux, belle musique,
etc.) si, déjà à l'étape du montage,
vous faites perdre de la qualité à vos sons. Par contre,
si le son que vous numérisez n'est pas destiné à
un reportage mais, par exemple, à un message vocal que vous
enverrez par courrier électronique, la qualité de
ce son est moins importante et vous pourriez choisir une fréquence
d'échantillonnage beaucoup plus faible. Une fois le montage
terminé et transféré sur bande ou cassette,
vous pourriez aussi décider de ré-échantillonner
votre reportage à une fréquence inférieure
(32075 ou 22050 Hz) pour l'archiver dans l'ordinateur sans qu'il
prenne trop d'espace de mémoire. Pour l'archivage, la compression
du son peut se révéler une meilleure solution parce
qu'elle fait moins perdre en qualité qu'un échantillonnage
faible.
8,000 Hz |
Téléphone |
11,025 Hz |
Radio AM |
22,050 Hz |
Cassette |
32,075 Hz |
Radio FM |
44,100 Hz |
Lecteur CD |
48,000 Hz |
Lecteur DAT |
Il ne faut pas confondre la fréquence d'échantillonnage
à la fréquence du son. Selon le « théorème
de Shannon », la plus haute fréquence pouvant être
restituée par une fréquence d'échantillonnage
donnée est égale à la moitié de cette
fréquence. Par exemple, pour une qualité CD à
44100 Hz, elle vaut 44100/2, soit 22050 Hz. Cette fréquence
se situe largement au-dessus du maximum perceptible par l'oreille
humaine (soit 16 à 20 kHz au maximum).
La taille ou la résolution d'échantillonnage
(en anglais : "resolution")
Pour obtenir un son numérique de qualité, le nombre
élevé d'échantillons ne suffit pas. Il faut
aussi que chaque échantillon soit de bonne qualité.
Pour reprendre l'exemple du cinéma, si chacune des 24 images
qui défilent à la seconde était floue, le film
serait flou. Pour un film de qualité, chaque image fixée
sur la pellicule doit avoir une résolution nette et précise.
Pour le son, c'est la même idée : la résolution
de chaque échantillon (on dit aussi la "quantification")
doit être précise. La résolution définit
l'amplitude de l'oscillation de votre onde, autrement dit, le volume.
La résolution se mesure par le nombre de "bits".
Plus celui-ci est élevé, plus on sera en mesure de
percevoir une amplitude et des fréquences de son précises,
c'est-à-dire à la fois les ambiances de fond discrètes
(chants d'oiseaux, ruissellement de l'eau dans un ruisseau, etc.)
et des sons beaucoup plus forts (passage d'un camion, orchestre
de percussions, etc.)
Comme
le montre le dessin de droite, un son numérisé avec
une résolution de 8 bits (28) se divise en 256
strates (amplitude dynamique de 49,8 dB) alors qu'un son numérisé
à 16 bits (216) pourra être divisé
en 65536 strates (amplitude de 97,8 dB).
Chaque bit supplémentaire élève l'amplitude
dynamique de 6 dB, ce qui correspond au doublement du volume perceptible.
Certains logiciels permettent un encodage à 20 bits (121,8
dB) voire 24 bits (145,8 dB) comme WaveLab.
Les sons encodés à 8 bits fournissent une qualité
des sons bas comparable à celle d'une cassette. Les sons
encodés à 16 bits fournissent une qualité des
sons hauts comparable à celle d'un CD.
Mono ou stéréo ?
Pour les besoins du reportage radio, nous travaillons, règle
générale, en mono, c'est-à-dire sur un seul
canal. Le besoin de créer un fichier stéréo
(deux canaux) intervient seulement au moment du mixage, lorsque,
par exemple, vous voulez doubler une interview (ajouter une traduction
au-dessus de l'interview), ajouter une ambiance sonore sous votre
voix ou créer une ambiance complexe à partir de deux
sons différents. Lorsque vous choisissez de créer
un fichier stéréo, la fenêtre de votre logiciel
de montage sonore se divise horizontalement en deux parties, chaque
partie correspondant à une piste, la piste gauche et la piste
droite.
Quand vos mixages sont terminés, il est souhaitable que
vous fusionniez les deux pistes pour que le résultat final
n'en occupe qu'une seule. Il y a deux raisons à cela. D'abord,
il faut savoir qu'en numérique, le silence dans un fichier
son non compressé, occupe autant d'espace de mémoire
que le son. Un reportage stéréo d'une minute, même
si vous n'utilisez qu'une seule des deux pistes, occupe deux fois
plus d'espace qu'un reportage mono de la même durée.
De la même manière, un fichier son mono d'une minute
dans lequel il y a 50 secondes de silence est aussi lourd qu'un
fichier dans lequel quelqu'un parle du début à la
fin. Ensuite, même si le son diffusé en stéréo
(sur deux canaux) offre une qualité et une profondeur supérieures
au son mono, peu de radios diffusent en stéréo et
très peu d'auditeurs sont équipés de postes
récepteurs stéréo.
Pour préciser le format du fichier son dans...
... Wave Studio
Sélectionnez Paramètres
d'enregistrement dans le menu Options. La boîte de dialogue
Paramètres d'enregistrement s'affiche. Sélectionnez
le format du fichier son.
a) Choisissez Mono ou Stéréo
dans la boîte de groupe Canaux.
b) Choisissez 44100 Hz (ou une autre
fréquence) dans la boîte de groupe Taux d'échantillonnage.
c) Choisissez 16 bits (ou 8 bits)
dans la boîte de groupe Taille d'échantillonnage.
Choisissez OK.
...Cool Edit
Sélectionnez "New"
dans le menu "File" (fichier). La boîte de dialogue
"New Waveform" (nouveau format d'onde) s'affiche.
Sélectionnez le format du fichier son.
a) Choisissez 44100 (ou une autre
fréquence sous "Sample rate" (taux d'échantillonnage)
b) Choisissez Mono ou stéréo
sous "Channels" (canaux)
c) Choisissez 16 bits (ou 8 bits)
"Resolution"
Choisissez OK.
En résumé, il y a un lien direct entre la qualité
du son numérisé et la quantité d'espace de
mémoire nécessaire pour enregistrer le fichier ainsi
créé : un fichier son avec une meilleure qualité
de son exige un plus grand espace de mémoire.
Un enregistrement
mono échantillonné à 8 kHz et 8 bits pèse
600 Ko par minute.
Si on augmente un
de ces paramètres, la place occupée est d'autant plus
grande.
|