Upload
fantine-jeanne
View
118
Download
1
Embed Size (px)
Citation preview
7 - Son
Plan
• Définition du Son• Numérisation du Son• Formats des fichiers de sons • Son et Multimédia
Définition du Son
Définition du Son
• Pression -> Onde• Mécanisme de l’audition
– Grandeurs associées – Analyse du Son – Perception
• Conséquences – Effet de masquage– Effet de précédence – Application à la sonorisation
Transformation d’une pression en onde
Mécanisme de l’audition
Grandeurs associées
Grandeurs Physiques
Attributs perceptifs
fréquence hauteur (pitch)
intensité force (volume)
spectretimbre (couleur tonale)
Exemple d'analyse d'un son
Diagramme amplitude / temps :
Perception de la hauteur d'un son,de la fréquence
• unité Hertz (Hz)• Perception similaire pour un rapport d'une
octave• perception logarithmique de la hauteur des
notes• clavier de piano logarithmique : 27,5 Hz - 55
- 110 - 220 - 440 (note référence) - 880 - 1760 - 3520
• perception plus fine dans les basses fréquences
Perception de l'intensité d'un son
• son = pression (unité Pascal)• Pr = 2 . 10-5 Pa (seuil d'audition pour un son
pur de 1 kHz)• Seuil de douleur = 10 Pa• => adoption d'une échelle logarithmique
SPL = 20 log10 [ P / Pr ] mesure de rendement de puissance acoustique
• Unité : le décibel (dB) est l'unité de mesure relative de la puissance sonore (double tous les 3 dB)
Diagramme de Fletcher
Perception des timbres
• Définition de l'American Standard Association (ASA) : "Le timbre est l'attribut perceptif permettant de distinguer deux sons de hauteurs et d'intensités égales"
• Il permet de discerner les instruments, les voix...• Physiquement : timbre = enveloppe spectrale +
évolution de cette enveloppe au cours du temps• Connaissance des timbres : perception de
fréquences absentes produites par les harmoniques (téléphone, radio...)
Conséquences• Effet de masquage
• Effet de précédence
Application à la sonorisation
Numérisation du Son
Echantillonnage
• Théorème d'échantillonnage de Nyquist/Shannon : « signal correctement reconstruit si fréquence
d'échantillonnage > 2 * plus grande fréquence du signal échantillonné »
• Filtrage préalable préférable• plage audible 20 - 20 000 Hz, d’où
échantillonnage des CD audio à 44 kHz• téléphone : échantillonnage à 11 kHz• Connaissance de la plage de fréquence
permet réduction du débit
Quantification• Passage d'un domaine continu à un domaine discret• Valeur continue - Valeur quantifiée = erreur de
quantification (bruit)• But d'un bon codage : réduire le bruit• Attention : complexité du quantificateur augmente son
coût• Différentes stratégies de quantifications (adaptées au
type d'entrée) :– quantification scalaire
• linéaire• logarithmique
– quantification vectorielle : sur blocs de N échantillons, opération dans espace de dimension N
Quantification (2)• Plusieurs types de quantification :
– Linéaire (uniforme)• Distance identique entre chaque niveau de reconstruction.• Pas les meilleurs résultats (car indépendante de la nature de l'entrée)
mais facile à implémenter.• Pour conversation téléphonique : 13 bits, soit 8192 niveaux de
reconstruction.
– Logarithmique• Adaptée au codage de la parole :
– dynamique du langage peut atteindre 60 db– mais résolution plus importante dans les faibles amplitudes
• Idée : distance entre niveaux de reconstruction augmente avec l'amplitude
• Principe : passer signal d'entrée par compresseur à caractéristique logarithmique
Formats des fichiers de sons
Formats des fichiers de sons
• Nombreux formats : principaux formats avant le mp3– au : format des premières stations Unix (Sun,
NeXT...) très compressé en u-law ou a-law.. compact, mais dégradé
– aiff : format développé par Apple à partir d'un compresseur propriétaire MACE. Meilleure qualité que au, mais plus lourd.
– dvi ADPCM : développé par Intel pour les CDI.. Compression avec perte dans un ratio de 4 pour laisser de la place aux vidéo sur le CDI
Formats des fichiers de sons (2)– mid MIDI (Musical Instrument Digitial Interface) codage des
partitions. Très compact (une symphonie en 40 Ko !), mais nécessite un synthétiseur hard (meilleur) ou soft : très adapté aux musiques sur le Web
– wav Windows Wave : développé à l'origine par IBM, est devenu un standard de fait bien que pas très bon. Comporte beaucoup de formats de compression possibles.
– succès du mp3• tardif, car défini dès 1993 dans le format audio layer 3 du MPEG 1 (d'où le
nom mp3)• compression fréquentielle avec quantification comme le JPEG, mais tenant
aussi compte des l'effet de masquage pour diminuer l'information à coder• format de compression avec perte avec possibilité de réglages pour limiter
la compression avant l'audition des défauts• format de qualité, mais encore lourd pour le Web
Formats des fichiers de sons (3)
• Cas particulier du format Realaudio (.ra)– Propriété de Real Networks (ex Progressive
Networks)– Limité à la transmission de son par flux avec
limitation des conséquences de perte de paquets (transmission en "peigne")
– Format permettant plusieurs niveaux de compression avec choix et changement de taux de compression suivant dégradation du réseau
Formats des fichiers de sons (4)
– Principe du format Realaudio (.ra)
Sans multiplexage Avec
Son et réseau
Son et réseau
• Deux méthodes pour accéder un son sur un serveur distant :– charger le fichier, puis jouer (trop longue attente)– ou liaison par flux tendu (son joué au fur et à mesure de
la réception)
• Pb due à la liaison asynchrone : coupures• Solutions :
– tampon local– multiplexage des échantillons (ex : Real Audio)
Son et réseau (2)
• Possibilité de jouer un son directement dans une page Web :– Avec un plugin QT ou Flash Player
– Par une balise spéciale <embed><embed SRC="wheels.mid"PLUGINSPAGE="http://www.yamaha.co.jp/english/xg/html/mplug.html"WIDTH=200 HEIGHT=55 CONTROLLER=TRUE LOOP=FALSE AUTOPLAY=TRUEautostart=false></embed>
ou flash<object type="application/x-shockwave-flash" data="dewplayer.swf?essai.mp3 width="200"
height="20"> <param name="movie" value="dewplayer.swf?essai.mp3"></object>
Démonstrations