Une difficulté rencontrée lors de la mesure in-vivo est de faire coïncider le ratio de compression affiché par le logiciel de réglage et celui, réel, mesuré in-vivo.
Si vous effectuez une mesure in-vivo avec un signal de balayage, une mesure à 65 puis à 75dB SPL vous donnerons une lecture quasi-immédiate de CR par un calcul simple. Mais il est bien dommage, voire impossible d’effectuer aujourd’hui une MIV avec un tel signal. L’ISTS est pour cela hautement recommandé.
Le problème avec un signal de parole, fluctuant par nature, est qu’il devient très délicat d’associer le CR affiché et l’action (bonne ou mauvaise) de ce taux de compression sur le signal vocal. En effet, si le logiciel dit CR=4.0 entre 65dB SPL et 80dB SPL, malgré l’énormité d’une telle compression, il y a de fortes chances que la “voix moyenne” (65dB SPL) et même la voix forte (75dB SPL) ne soient pas impactées par cette compression. Pourquoi ? car même à niveau “moyen”, l’énergie par bande de tiers d’octave d’un signal vocal ne dépasse pas 60dB SPL, y compris en crêtes:
Une telle compression (CR de 4.0 à TK=65dB SPL) n’aurait quasiment aucun effet à voix moyenne et à voix forte. Les points d’enclenchement nécessaires à une action sur un signal de parole sont situés entre 30 et 60dB SPL.
Cette difficulté de relier “CR affichés” et “CR réels” lors de l’utilisation d’un signal vocal avait été exploré dans ce très bon article.
Mais cela n’empêche pas la dégradation de la dynamique vocale par les compressions de bas niveau d’entrée et autres expansions dont on ne sait en général pas où elles agissent… Si l’on considère la dynamique vocale non-déformée, on retrouvera une valeur d’environ 30dB, correspondant au LTASS +12dB et LTASS -18dB:
Tout facteur de compression excessif positionné à un TK de 55dB SPL aurait tendance à dégrader les crêtes du signal, et à l’opposé, tout TK de la première compression, situé trop haut (ex: 40dB SPL) aurait pour conséquence de ne pas amplifier les “vallées” de la parole.
De retour du congrès, j’ai donc découvert la possibilité, en temps réel, d’analyser la facteur de compression sur la dynamique de la parole, le tout in-vivo.
Du percentile 30 (vallées) au percentile 99 (crêtes), la chaîne de mesure Affinity calcule en temps réel le ratio de compression, et dans chaque bande de tiers d’octave vous affiche le CR:
Cette analyse est intéressante pour les niveaux élevés de parole (ex: 75dB SPL) et peut être effectuée, au choix, sur la dynamique perc. 30/perc. 99 ou bien perc. 60/perc. 99:
Le taux de compression utilisé reflète donc le traitement du signal appliqué mais peut prendre des valeurs inhabituelles: par exemple, un CR de 0.85 reflèterait un premier TK trop haut, une mauvaise amplification des informations de faible niveau (percentiles 30). Un ratio de compression de 1.0 indique donc une dynamique vocale préservée (30dB en entrée, 30dB en sortie amplifiée). Il va sans dire que cet affichage est TRES intéressant lorsque l’on utilise des appareils censés utiliser un “gain linéaire flottant”. S’il est vraiment “linéaire” ce “gain flottant”, la dynamique vocale ne devra pas être détériorée, donc Affinity devrait afficher un CR de 1.0, ou en tout cas décorrélé du CR “classique” ou “affiché”…
Cette fonctionnalité est présente dans la version 2.3 d’Affinity et peut être réalisée in-vivo (exemple précédent) ou au coupleur (exemple ci dessus). Elle correspond à la norme IEC 60318-5.
Je trouve cette mesure extrêmement utile: au-delà de s’assurer qu’il y a “in-vivo” une amplification suffisante, nous allons pouvoir vérifier qu’il n’y a pas de dégradation de la dynamique du signal et que les algorithmes nous assurant un traitement spécifique pour la parole, le font bien.
Pour les puristes, cette version d’Affinity, par simple clic-droit sur le “label” (niveau) de la courbe dans le bandeau de droite, vous donne accès à l’analyse statistique complète des niveaux d’énergie du signal au cours du temps. Preuve en est que nous avons à disposition de bien beaux joujoux !
On progresse toujours…