Cologne, Allemagne, 24 novembre 2014

Procédés et systèmes d'enregistrement et de reproduction sonores en trois dimensions


<— CHAPITRE 1 / CHAPITRE 3 —>


CHAPITRE 2 : MODÈLES D'ANALYSE SPATIALE DES SYSTÈMES ÉLECTROACOUSTIQUES


Nous avons la capacité d'enregistrer et de reproduire les sons depuis environ une centaine d'années. Durant cette période, une multitude de types de support ont été utilisés pour la transmission et le stockage de l'information sonore, les changements de technologie étant généralement justifiés par l'augmentation de la fidélité dans le système. En regard de la fidélité spectrale et dynamique, nous avons atteint un très haut niveau de réalisme. La fidélité spatiale a aussi progressé, mais, à notre avis, les intervenants dans le domaine et le grand public manquent d'outils pour apprécier, comparer et décrire les capacités de spatialisation des différents systèmes.


Au fil de nos recherches, nous avons distingué deux philosophies de conception des systèmes électroacoustiques quant à leurs capacités de spatialisation sonore. Tous les systèmes employant des transducteurs de captation et de reproduction sont issus de l'une ou l'autre de ces philosophies. Quand il s'agit d'enregistrement et de reproduction tridimensionnels, elles ne sont pas réellement en opposition, dans la mesure où elles procèdent du même constat de départ: la stéréophonie, telle qu'exploitée actuellement, n'est pas satisfaisante au niveau de la spatialisation ou du positionnement tridimensionnel des sons.


La première approche prend le système auditif humain comme le point final de la chaîne électroacoustique 81. La conséquence principale de cette prise de position est qu'on peut concevoir un système électroacoustique qui n'utilisera ainsi que deux canaux d'information, étant donné qu'en condition normale d'écoute le cerveau obtient une quantité et une qualité suffisantes d'informations, pour le positionnement spatial des sons, avec un maximum de deux canaux. La deuxième philosophie, qui, dans certains cas, émane de l'expérience pratique plutôt que d'une véritable réflexion scientifique, veut que le point final de la chaîne électroacoustique soit l'espace acoustique, la salle, la pièce, où cette reproduction a lieu 81. Cette approche, qui reste encore pour le moment la plus exploitée, n'a toutefois pas toujours engendré la démarche scientifique nécessaire.


Basé sur ces deux philosophies, nous proposons maintenant deux modèles de captation et de reproduction sonores. Ces deux modèles serviront à l'analyse comparative des différentes théories et ou des différents systèmes. Le premier modèle, basé sur la philosophie du système auditif comme point final de la chaîne, sera appelé modèle binaural. Le deuxième modèle, basé sur la philosophie de l'espace de reproduction comme point final de la chaîne, sera appelé «modèle géométrique» 98. Avec les deux modèles, nous utiliserons une terminologie commune pour qualifier les capacités de positionnements sonores tridimensionnels. Ainsi, un système qualifié d'unidimensionnel pourra capter et reproduire les sons sur un axe donné, un système bidimensionnel pourra capter et reproduire les sons dans un plan donné et un système tridimensionnel pourra capter et reproduire les sons dans un espace ou un volume donné. Cette terminologie est identique, dans les termes et les définitions, à celle proposée par le compositeur de musique électroacoustique Werner Kaegi à la fin des années soixante 8. De cette façon, nous espérons éviter les termes souvent vagues qui sont légions quand vient le temps d'évaluer la tridimensionnalité d'une captation ou d'une reproduction sonore.



2.1 Le modèle binaural


Développé à partir des recherches sur l'audition directionnelle, telles que nous les avons vues au chapitre précédent, le modèle binaural de captation et de reproduction sonores se veut une réplique des facteurs physiques les plus significatifs permettant l'audition directionnelle chez l'humain. Ces facteurs sont connus: deux transducteurs disposés de part et d'autre d'un séparateur, appelé généralement un baffle, de volume assez important (comme la tête) et comportant des filtres acoustiques, physiquement asymétriques, adjacents aux transducteurs (comme les pavillons des oreilles). On doit alors obtenir d'un capteur ou d'un simulateur binaural, par reproduction mécanique ou électronique du modèle, deux canaux d'information qui contiendront des signaux analogues à ceux qui stimulent nos tympans. Si le modèle est respecté, ces signaux contiendront des différences intercanaux de temps et d'amplitude, pour l'encodage des différences directionnelles horizontales, ainsi que des modifications fréquentielles, pour l'encodage des différences directionnelles verticales.


Puisque le tympan est un transducteur répondant aux changements absolus de pression, les transducteurs d'un capteur binaural doivent être du même type pour suivre fidèlement le modèle. À l'autre bout de la chaîne, les transducteurs de reproduction doivent livrer directement aux deux canaux auditifs l'information encodée, pour qu'elle soit convertie par notre système auditif interne et décodée de façon appropriée par le cerveau.


Au chapitre suivant, les systèmes de captation, les systèmes de simulation et les systèmes de reproduction identifiés comme étant binauraux seront analysés pour évaluer leur concordance avec le modèle binaural tel que synthétisé ici et détaillé au premier chapitre sur l'audition directionnelle binaurale.



2.2 Le modèle géométrique


Le modèle géométrique a une genèse un peu moins définie que le modèle binaural et ce n'est que tardivement, disons vers le début des années soixante-dix, qu'il a été énoncé dans sa totalité. Dans le modèle géométrique, les transducteurs audios, microphones et enceintes acoustiques, sont considérés comme des points capteurs et émetteurs dans l'espace. Cette réduction des transducteurs à des points est une convention généralement acceptée 74, 81 et fait évidemment abstraction des particularités physiques et électriques des différents microphones et enceintes acoustiques, autres que les caractéristiques directionnelles de captation et d'émission sonore 78, 85. Ces points transducteurs sont alors interprétés dans l'espace tridimensionnel selon les lois de la géométrie euclidienne.


Ainsi, un point dans l'espace ne peut définir que lui-même; un microphone à la captation et une enceinte acoustique à la reproduction ne peuvent définir que leur propre position dans l'espace. Deux points ne peuvent définir qu'une droite; deux micros et deux enceintes acoustiques ne vont définir qu'une dimension de l'espace. Trois points non alignés peuvent définir un plan; trois micros et trois enceintes acoustiques non alignés pourront définir deux dimensions de l'espace. Finalement, quatre points non aplanis peuvent définir un volume; quatre micros et quatre enceintes acoustiques non aplanis pourront définir les trois dimensions de l'espace. En utilisant la géométrie analytique, on constate que les quatre points non aplanis, s'il sont équidistants, forment le polyèdre régulier le plus simple, appelé tétraèdre, et font l'échantillonnage minimum de la sphère 77 tel qu'on le voit dans la figure 2.1. En résumé, le nombre et la position des transducteurs les uns par rapport aux autres, à la captation et à la reproduction, aura une conséquence directe sur les possibilités d'encodage et de décodage des caractéristiques spatiales du phénomène acoustique original.


Figure 2.1 Tétraèdre régulier échantillonnant une sphère.


Ce modèle géométrique a vu le jour à partir d'expériences indépendantes en France, aux États-Unis et en Angleterre depuis les années cinquante. En 1952, Pierre Scheaffer proposait un tétraèdre dont les sommets étaient définis par des enceintes acoustiques pour la reproduction tridimensionnelle de la musique électroacoustique 45. En 1957, Jacques Poulain testait l'installation proposé par Scheaffer 74. Dans les deux cas cependant, ils n'y ont vu que le point final d'un système électroacoustique, ne concevant pas en apparence sa contrepartie pour la captation acoustique. À la fin des années soixante, on commence à expérimenter, principalement en Angleterre, la captation basée sur le tétraèdre 22, 39. Le modèle géométrique est aussi proposé aux États-Unis par Peter Scheiber, mais de façon tout à fait théorique. Il explique les cas d'encodage bidimensionnel à trois canaux et d'encodage tridimensionnel à quatre canaux 78. En Angleterre, le mathématicien Michael Gerzon notera aussi l'intégration des captations bidimensionnelles et tridimensionnelles au même modèle géométrique 39. Il testera ainsi la captation et la reproduction bidimensionnelles à trois transducteurs 40 et tridimensionnelles à quatre transducteurs 41. Gerzon remarquera plus tard que les conclusions auxquelles il est parvenu, en même temps que Scheiber d'ailleurs, sont entre autre basées sur les recherches du mathématicien anglais Stokes en 1852 et du mathématicien français Poincaré en 1892 43.


Règle générale, on peut dire que les caractéristiques directionnelles des transducteurs en regard du modèle géométrique peuvent être omnidirectionnelles, unidirectionnelles ou bidirectionnelles. Cependant, certaines conditions s'appliquent. À la reproduction, les enceintes acoustiques unidirectionnelles ou bidirectionnelles doivent avoir leur champs d'émission de polarité positive dirigés vers le centre de masse de la figure géométrique qu'elles dessinent. Par ailleurs, pour toutes les caractéristiques directionnelles d'enceintes acoustiques, l'espace de reproduction doit être le moins réverbérant possible, jusqu'à être idéalement anéchoïque. Dans un espace réverbérant, les diverses réflexions sur les parois, en étant des réémetteurs virtuels 88 disposés aux mauvais endroits, vont venir diminuer la qualité de la reproduction directionnelle. Si on ne peut assurer un certain degré d'anéchoïsme, des enceintes unidirectionnelles sont préférables aux autres directivités d'émission sonore.


Pour la captation, l'utilisation de microphones omnidirectionnels exigent une certaine distance ou l'utilisation d'un baffle entre les micros. La distance ou le baffle créera les différences inter-capteurs d'amplitude et de temps nécessaires à l'encodage directionnel. Si des capteurs unidirectionnels sont utilisés, l'orientation vers l'extérieur de la figure géométrique dessinée par l'assemblage de micros, en suivant les droites définies par le centre de masse et les sommets de la figure géométrique, doit être appliqué. De plus, on doit assurer la coïncidence spatiale des capteurs, c'est-à-dire la plus grande proximité possible les uns des autres. Une captation utilisant des capteurs unidirectionnels fait par ailleurs une description de l'espace avec la variation absolue de pression et avec des gradients de pression; les micros de type cardioïde sont en effet un mélange d'omnidirectionnel et de bidirectionnel. Si une captation utilise uniquement des capteurs bidirectionnels coïncidents, la description de l'espace sera incomplète parce qu'elle n'incluera que des gradients de pression. Pour être bidimensionnelle ou tridimensionnelle, une captation avec capteurs bidirectionnels doit aussi inclure la variation absolue de pression. Ceci sera assuré par la présence d'un capteur omnidirectionnel coïncident aux capteurs bidirectionnels. De plus, les capteurs bidirectionnels doivent être idéalement disposés de manière à faire une captation orthogonale de l'espace acoustique. Ce dernier cas, un peu particulier et complexe, de capteurs bidirectionnels, nous amène à parler du modèle sous-jacent au modèle géométrique: le modèle des harmoniques sphériques.



2.2.1 Le modèle des harmoniques sphériques


Jusqu'à maintenant, nous avons parlé de la directionnalité des transducteurs en termes généraux, nous contentant de les désigner comme omnidirectionnels, unidirectionnels ou bidirectionnels. Si, historiquement, ces caractéristiques directionnelles ont souvent été obtenues de manière empirique, il existe toutefois un modèle mathématique permettant de les expliquer et aussi d'imaginer des caractéristiques directionnelles encore plus complexes. Avant d'aller plus loin, procédons ici à une analogie. On peut décomposer le spectre de fréquences des phénomènes sonores complexes en ses fréquences constituantes primaires, appelées harmoniques. On voit alors que les sons complexes ne sont qu'un amalgame d'harmoniques ayant entre eux une relation mathématique. De la même façon, la directivité dans l'espace de tous les phénomènes d'émission ou de réception d'ondes peut être décomposée en constituantes primaires, appelées harmoniques sphériques 36. Le modèle des harmoniques sphériques s'applique à un ensemble de phénomènes physiques, notamment électromagnétiques 69, électrodynamiques, atomiques et acoustiques 42. Nous allons décrire brièvement comment ce modèle peut venir éclairer la question des relations spatiales que les transducteurs établissent entre eux et avec l'espace de captation et de reproduction.


Figure 2.2 Harmoniques sphériques simples des trois premiers ordres. [D'après 96]


La figure 2.2 nous montre les trois premiers harmoniques sphériques simples. On retrouve la fonction de l'harmonique sphérique d'ordre zéro à l'Eq. (1), la fonction de l'harmonique sphérique de premier ordre à l'Eq. (2) et la fonction de l'harmonique de deuxième ordre à l'Eq. (3). Le microphone suivant l'harmonique d'ordre zéro est connu sous le nom d'omnidirectionnel et le microphone suivant l'harmonique de premier ordre simple est connu sous le nom de bidirectionnel ou figure-huit. Mentionnons que les deux sphères de l'harmonique sphérique de premier ordre auront une polarité différente 88. La polarité des lobes, ces derniers étant séparés par des azimuts de sensibilité nulle, alternera toujours d'un lobe à l'autre: un lobe positif sera toujours suivi d'un lobe négatif, qui lui-même sera suivi d'un lobe positif et ainsi de suite. Dans l'harmonique de deuxième ordre, les lobes pointant à 0° et à 180° seront positif et le lobe déterminé par l'axe 90°-270° sera négatif.


(1) Y0(q) = 1

(2) Y1(q) = cos

(3) Y2(q) = 3cosq2 -1


Les harmoniques sphériques simples peuvent se combiner linéairement pour créer ce que nous appellerons des harmoniques sphériques complexes. Nous pouvons combiner par simple addition les signaux de microphones aux propriétés sphériques simples et obtenir des micros virtuels aux propriétés sphériques complexes. Pour obtenir des résultats impliquant une prévision mathématique simple, on doit assurer la coïncidence spatiale des micros de base et l'alignement de leurs axes de rotation, c'est-à-dire l'axe perpendiculaire au diaphragme passant par le centre de ce dernier. Il est évident que cette condition n'est pas complètement réalisable avec des micros aux boîtiers discrets. On peut toutefois assurer sans difficulté la coïncidence spatiale sur deux axes, X et Y par exemple, ce qui garantira l'intégrité de la réponse directionnelle du micro virtuel dans le plan déterminé par les deux axes. Le micro virtuel aura, toujours dans le plan où la coïncidence existe, les qualités de réponse en fréquences de ses microphones constituants. Par exemple, en combinant dans un ratio de 1:1 le signal d'un micro d'ordre zéro coïncident à un micro de premier ordre simple, de telle sorte que leurs gains respectifs soient identiques pour l'azimut 0°, on obtient un micro virtuel de premier ordre complexe. Le gain égal et de même polarité de chaque micro à 0° aura doublé l'amplitude du signal pour cet azimut lors de la combinaison. Cependant le gain égal, mais de polarité opposée à 180°, créera une annulation complète pour cet azimut lors de la combinaison des signaux. Il en va ainsi, et de façon continue bien sûr, pour tous les azimuts. Le micro virtuel ainsi obtenu est connu sous le nom de unidirectionnel ou cardioïde.


Pour que le modèle géométrique soit valable, l'encodage de la directionnalité acoustique doit toujours inclure un ordre donné d'harmonique sphérique et tous les ordres qu'ils lui sont inférieurs 32, 84. Donc, si on capte l'espace avec des micros bidirectionnels, c'est une captation de premier ordre. On doit alors aussi inclure l'ordre zéro, l'omnidirectionnel. C'est aussi pour cette raison qu'une captation avec des cardioïdes de premier ordre est complète puisque ces microphones sont une combinaison linéaire de l'harmonique d'ordre zéro et de premier ordre.


Au quatrième chapitre, les systèmes de captation, de simulation et de reproduction identifiés comme étant géométriques seront analysés pour évaluer leur concordance avec le modèle géométrique tel que nous l'avons décrit au point précédent.


<— CHAPITRE 1 / CHAPITRE 3 —>