Cologne, Allemagne, 23 novembre 2014

Procédés et systèmes d'enregistrement et de reproduction sonores en trois dimensions

 

CHAPITRE 6 : PERSPECTIVES D'AVENIR DANS LES SYSTÈMES ÉLECTROACOUSTIQUES À SPATIALISATION TRIDIMENSIONNELLE

 

Jusqu'à présent, la discussion portant sur les différents systèmes a fait presque abstraction des implications pratiques et des possibilités d'application, en regard des pratiques actuelles, que les différents choix et recommandations que nous avons faits demandent. Nous allons donc voir maintenant, en prenant comme point de référence le state of the art actuel dans le domaine qui nous intéresse, comment peuvent s'appliquer réellement nos recommandations technologiques, sans nécessairement changer les équipements et les apprentissages accumulés au cours des années.

 

 

6.1 Un assemblage hexaédrique pour la reproduction sonore tridimensionnelle

 

La principale exigence d'un système de reproduction sonore tridimensionnelle est de reproduire l'espace sonore entourant le ou les auditeurs. Nous avons vu que la meilleure représentation de cet espace sonore est la sphère. Malheureusement, cette représentation ne s'adapte pas aux systèmes électroacoustiques suivant le modèle géométrique puisque les transducteurs sont semblables, dans une représentation graphique tridimensionnelle de l'espace de captation et de reproduction, à des points ou à des sommets de polyèdres et que la sphère ne comporte pas de sommets. Il serait donc impossible actuellement de reproduire adéquatement cette sphère, si ce n'était que par la multiplication vers l'infini du nombre de points capteurs et du nombre de points diffuseurs. Nous avons vu aussi que le polyèdre le plus simple, soit le tétraèdre, tout en étant un échantillonnage minimum de cette sphère à la captation, convient difficilement aux conditions de reproduction que l'on retrouve couramment. Il faut donc une représentation de la sphère s'adaptant mieux à ces conditions; les salles d'écoute suivant dans la majorité des cas une construction parallélépipédale, il faudrait un système de reproduction tridimensionnelle suivant la même construction.

 

Un système de reproduction à huit enceintes acoustiques est une représentation valable de la sphère et a l'avantage de bien s'adapter aux salles d'écoute 39, 85. Cette disposition, qui remplit au maximum la salle d'écoute, agrandit par le fait même la fenêtre d'audition par rapport au modèle tétraédrique. La disposition dessinant un cube, l'orientation à 90° des enceintes acoustiques les unes par rapport aux autres assure une couverture uniforme de l'espace sonorisé. Par ailleurs, même si dans le cas des expériences de Veit et Sander 85, le but n'était pas de concevoir un système de reproduction sonore, les principes qu'ils appliquent pour leur simulation en laboratoire des conditions de champs sonores diffus sont parfaitement valables à la lumière du modèle géométrique. L'assemblage hexaédrique régulier assure la même neutralité que la disposition tétraédrique de Gerzon puisqu'il ne favorise aucune direction aux dépends d'une autre. Rappelons que l'assemblage hexaédrique a été suggéré nombre de fois par Gerzon lui-même (qui l'appelle cependant «cuboïde» 46) mais sans apparemment avoir été l'objet d'essais documentés 46.

 

L'assemblage hexaédrique d'enceintes acoustiques pourrait être une option intéressante dans la reproduction Ambisonic. Idéalement, un décodeur dédié à cette installation devrait exister: d'après nos informations, le décodeur Ambi-8 de Audio Design ne produit qu'un signal de format D bidimensionnel pour huit enceintes acoustiques. Cependant, il est possible de produire un signal de format D hexaédrique à partir des équipements Ambisonic présentement disponibles. Comme l'on prouvé les gens de l'Office national du film dans la production de Momentum, le signal de format B alimenté au décodeur bidimensionnel n'est pas obligatoirement correspondant au plan horizontal déterminé par les signaux X et Y. Il va alors de soi qu'il est possible de fournir au décodeur un signal de format B préalablement modifié par les commandes de champ sonore de l'unité de contrôle du microphone Soundfield.

 

Dans le cas d'une installation hexaédrique d'enceintes acoustiques, symétrique par rapport aux trois axes spatiaux cartésiens, soit un cube, la façon de procéder est relativement simple, quoiqu'elle implique nécessairement deux unités de contrôle du Soundfield. Il faut d'abord doubler le signal de format B original. À la sortie du magnétophone, chaque canal du format B emprunte un simple doubleur en Y (XLR-3 femelle vers deux XLR-3 mâles) qui conviendra parfaitement. Le format B alimente alors conjointement les deux unités. Sur la première unité, le champ sonore est modifié par une élévation de 45°. Le format B +45° disponible à la sortie de l'unité de contrôle est alors alimenté à un décodeur bidimensionnel conventionnel. Cependant, le signal de format D ainsi produit par le décodeur sera dirigé vers les deux enceintes acoustiques avants-hautes et arrières-basses en respectant bien sûr la gauche et la droite. Avec la deuxième unité de contrôle, on induira au format B une inclinaison négative de 45°. Le signal de format B -45° ainsi créé pourra donc être alimenté à un deuxième décodeur qui produira le format D destiné aux enceintes avants-basses et arrières-hautes.

 

Il faut évidemment faire les réglages appropriés sur les décodeurs, particulièrement en ce qui concerne le réglage de ratio largeur/profondeur et de compensation de distance en fonction du volume de l'hexaèdre. On remarquera que cette façon de créer un signal de format D hexaédrique ne se limite pas au cube et qu'il est possible d'alimenter des parallélépipèdes tant que leurs caractéristiques géométriques peuvent être satisfaites par les capacités de l'unité de contrôle du Soundfield (ratio hauteur/profondeur) et du décodeur (ratio largeur/profondeur). En terminant sur cette question, notons qu'il est fort probable que le format D nécessaire pour alimenter une installation hexaédrique pourra être encore plus facilement synthétisé avec une carte numérique comme celle produite par AGM.

 

 

6.2 Un système de captation tridimensionnelle avec microphones ultradirectionnels de deuxième ordre

 

En Ambisonic, le microphone Soundfield et le format B n'incorporent que les harmoniques sphériques d'ordre zéro et de premier ordre. Si dans des conditions d'écoute domestique cette résolution s'avère être suffisante, il en va autrement dans des conditions d'écoute que nous qualifierons de publique. Tout comme en stéréophonie conventionnelle, la qualité de la reproduction spatiale en Ambisonic est relativement sensible à la position idéale, le sweet spot. Si l'auditeur ne se trouve pas au centre de l'installation d'enceintes acoustiques, il se produit des distorsions spatiales dans la reproduction acoustique qui ne seront pas nécessairement assimilables à l'effet qui serait rencontré par un déplacement de l'auditeur par rapport au phénomène acoustique original 84. Il devient donc important de voir à l'incorporation dans le format B d'harmoniques sphériques non redondantes de deuxième ordre.

 

Ce format B de deuxième ordre a été imaginé il y a déjà vingt ans par Gerzon 42. Un micro Soundfield pouvant produire un tel signal pourrait comporter douze capsules coïncidentes de premier ordre complexe, cardioïdes par exemple, formant un dodécaèdre régulier. Tout comme pour le format B de premier ordre, le format B de deuxième ordre serait obtenu par diverses combinaisons additives et soustractives des douze capsules. Cependant, Gerzon n'en donne pas les formules; on peut tout de même comprendre que l'harmonique d'ordre zéro serait le résultat de l'addition totale des douze capsules et que les trois harmoniques de premier ordre seraient le résultat de la soustraction de regroupements hémisphériques de capsules déterminés par les axes cartésiens. La visualisation de la synthèse des harmoniques de deuxième ordre dépasse toutefois le simple exercice mental et nous invitons le lecteur courageux à s'y soumettre si le coeur lui en dit. Quoi qu'il en soit, l'inclusion des harmoniques de deuxième ordre rajouterait cinq canaux au format B que nous connaissons, pour arriver à un total de neuf canaux 42.

 

Le progrès conséquent à l'inclusion des harmoniques de deuxième ordre dans le format B serait la fabrication de microphones virtuels ultradirectionnels. En combinant dans un ratio de 1:1 une harmonique sphérique simple de premier ordre avec une harmonique sphérique simple de deuxième ordre, les deux étant coïncidentes et alignées sur leur axe de rotation, on obtient un micro de deuxième ordre complexe avec un azimut de captation nulle à 180°; nous l'appellerons ainsi cardioïde de deuxième ordre. Il suffit de comparer avec un cardioïde conventionnel pour voir immédiatement les avantages. D'après ce que nous pouvons voir dans les figures 6.1 et 6.2, ce nouveau micro est très discriminant au-delà de l'axe de rotation. À l'azimut 90°, le cardioïde de premier ordre a un gain de 0,5 (-6 dB) par rapport au gain maximum à 0°. Par contre, le cardioïde de deuxième ordre exhibe un gain nul à 90° suivi d'un petit lobe de polarité négative avec un gain maximum d'environ 0,13 (- 18 dB) à 125°. Le cardioïde de premier ordre a un gain d'environ 0,24 (-12 dB) au même azimut de 125°.

 

 

Figure 6.1 Représentation polaire d'un cardioïde de premier ordre et d'un cardioïde de deuxième ordre.

 

 

 

Figure 6.2 Comparaison linéaire entre un cardioïde de premier ordre et un cardioïde de deuxième ordre.

 

La plus grande discrimination directionnelle du format B à neuf canaux permettrait, dans un plus grand volume, une reproduction sonore dont les caractéristiques spatiales seraient plus conformes au phénomène acoustique original 84. On peut se demander pourquoi, alors, les instruments permettant de capter ou de synthétiser l'espace sonore avec des harmoniques de deuxième ordre n'existent pas déjà. L'explication se trouve d'abord dans le problème de bruit inhérent aux microphones d'ordres supérieurs. Même s'il existe des microphones affichant des caractéristiques sphériques d'ordres élevés, comme les micros canons, ces caractéristiques sont optimisées sur une étroite bande de fréquences. Une performance directionnelle uniforme sur une plus large bande, comme il serait obligatoire pour le format B de deuxième ordre, commanderait de très petites distances entre les diaphragmes 42 et aurait comme conséquence un signal de sortie de plus faible amplitude 89, donc avec un moins bon rapport signal/bruit. Les expérimentations récentes sur les microphones de deuxième ordre, aux laboratoires AT&T Bell 79 ou à l'Université McGill 89 par exemple, mentionnent dès le départ les problèmes de bruit inhérent à ce type de micros. Dans le cas du micro AT&T Bell, le rapport signal/bruit était environ de 15 à 20 dB inférieur à ce que nous retrouvons couramment pour des cardioïdes de premier ordre à condensateur. Nous devons donc composer avec ces contraintes et faire un choix entre la continuité spectrale des caractéristique sphériques et le rapport signal/bruit.

 

Avec ses capsules rapprochées, un micro Soundfield de deuxième ordre serait sérieusement handicapé par le problème de bruit. De plus, cette coïncidence des capsules obligerait l'utilisation de diaphragmes de petites surfaces, contribuant encore au problème du bruit. Ce micro Soundfield deviendrait finalement assez bruyant selon les standards actuels. Toutefois, les récents algorithmes développés pour la réduction du bruit de fond sur du matériel préalablement enregistré pourraient trouver ici un nouvel usage. En effet, des systèmes tel que le module NoNoise du système Sonic ou le CEDAR comportent des modules de réduction de bruit de fond opérant dans le domaine numérique 634, qui, nous croyons, permettraient d'augmenter le rapport signal/bruit des micros de deuxième ordre. On parle ici d'amélioration possible de l'ordre de 20 dB. Pour autant que nous sachions, de tels algorithmes n'ont jamais été utilisés de la sorte; c'est une avenue qui mérite grandement d'être explorée.

 

La manipulation numérique de signal serait aussi la solution au deuxième problème rencontré dans le développement du format B de deuxième ordre: la complexité de manipulation des neuf canaux. Nous avons fait remarquer que la manipulation des quatre canaux du format B de premier ordre était déjà d'une relative complexité et poussait dans leur derniers retranchements les designs analogiques les plus modernes. Nous avons aussi conclu que le système Ambisonic bénéficierait grandement de la mise au point d'appareils opérant entièrement dans le domaine numérique, comme ceux maintenant offerts par AGM. Ces remarques sont ainsi encore plus valides pour le format B de deuxième ordre: la manipulation fonctionnelle et efficace des neuf canaux n'est possible que dans le domaine numérique 68 et l'interface-usager devrait probablement se départir de l'ergonomie conventionnelle des consoles de mixages stéréophoniques.

 

 

6.3 Compatibilité entre les systèmes de spatialisation sonore tridimensionnelle

 

La question de la compatibilité entre les systèmes est certainement importante. Nous croyons tout d'abord que Ambisonic fera d'ici quelques années une pénétration significative dans le marché et qu'ainsi au moins deux systèmes ambiophoniques seront appelés à exister côte à côte. Deuxièmement, les différences fondamentales entre les différents systèmes existants ou à venir (car on en propose déjà plusieurs pour la TVHD 47) résident principalement dans les fonctions mathématiques inhérentes à chaque système selon lesquelles les éléments sonores sont placés dans l'espace. Gerzon appelle ces fonctions «lois de panoramique» 50. L'Ambisonic et le Dolby Stereo/Surround ont effectivement des lois de panoramique qui sont différentes mais qui pourraient être transmises par les mêmes canaux et interprétées par une seule famille de décodeurs.

 

Peu importe le système qui a servi à l'encodage directionnel, l'information peut être transmise sous une forme qui serait une extension de la transmission radio MF stéréo où le signal est matricé sous la forme M-S. Des scénarios de transmission M-S comportant jusqu'à cinq canaux ont déjà fait l'objet de recherches approfondies et les différentes matrices d'encodage basées sur des modèles psychoacoustiques permettraient la préservation des caractéristiques propres aux différentes lois de panoramiques encodées dans le matériel original 49. Cette forme de transmission universelle et hiérarchique permettrait par conséquent l'utilisation d'une seule famille de décodeurs. Selon les budgets des utilisateurs, les décodeurs fonctionneraient avec diverses variantes de dispositions d'enceintes acoustiques et, tout comme les récepteurs MF mono ou stéréo, utiliseraient l'ensemble ou une partie des signaux transmis 51. Il va de soi que l'utilisation du plus grand nombre de signaux transmis donnerait une reproduction spatiale de meilleure qualité.

 

En ce qui concerne les dispositions d'enceintes acoustiques, autant les dispositions uniformes sur 360° que les dispositions avec une résolution accrue dans le quadrant avant, comme en Dolby Surround, pourraient être alimentées par le même signal. Il y a donc un intérêt indéniable à ce que les différents intervenants s'entendent sur un format de transmission universel. En ayant une seule famille de décodeurs, les consommateurs n'auraient plus à optimiser leurs installations pour tel ou tel type de format stéréophonique ou ambiophonique. À l'autre bout de la chaîne, les créateurs garderaient le loisir de choisir le type d'équipement d'encodage en fonction de leurs préférences et des besoins de production. Même si leur équipement ne produisait pas un signal dans la forme standard, des algorithmes de conversion psychoacoustique assureraient une intégration optimale au signal standard 48. Cependant, en attendant qu'un format de transmission universel soit adopté, il faut considérer des méthodes de conversion particulières à chaque combinaison de systèmes électroacoustiques.

 

 

6.3.1 La conversion d'information entre les systèmes

La revue des différents systèmes d'enregistrement et de reproduction sonores tridimensionnels donne l'impression que l'information encodée dans un système particulier devient exclusive à ce système et qu'elle ne peut ainsi être utilisée dans un autre système. Même si notre préférence pour ce type de média penche fortement du côté de Ambisonic, il faut se rendre à l'évidence que les autres technologies, spécialement celles qui ont déjà une forte base industrielle et une importante pénétration du marché comme le Dolby Stereo/Surround, sont là pour rester. Il faut donc penser à aménager la coexistence pacifique. Et celle-ci passe nécessairement par l'échange, d'une technologie à l'autre, du matériel produit avec ces différentes technologies.

 

Avec une description mathématique formelle de la manière dont chaque système encode l'information sonore directionnelle et en tenant compte de leurs particularités psychoacoustiques, il devient possible de créer les algorithmes de conversion qui permettront les différents échanges d'informations 49. Il va de soi cependant que les conversions entre les différents systèmes appartenant au même modèle de captation et de reproduction sonores sont plus faciles à réaliser et devraient théoriquement donner des résultats plus prévisibles et fiables. À cet égard, le système RSS de Roland constitue en fait deux systèmes en un, puisqu'il opère d'abord une simulation binaurale avant de procéder à la conversion transaurale pour rendre le signal compatible avec une écoute sur enceintes acoustiques. À la lumière de cet exemple, on peut donc supposer que, théoriquement, la conversion transaurale d'un signal binaural, que celui-ci soit réel ou simulé, n'introduit pas de distorsion spatiale dans l'information.

 

Ceci étant dit, le succès réel d'une telle conversion repose sur deux aspects importants. Premièrement, les modèles psychoacoustiques servant à créer les algorithmes de conversion peuvent connaître un certain nombre d'inexactitudes, introduites par les limites humaines et technologiques inhérentes aux recherches scientifiques qui ont proposé ces modèles psychoacoustiques. Un échantillon trop petit, le manque de précision des instruments de mesure ou encore simplement l'ignorance de certains phénomènes physiques ou psychologiques ayant un impact sur la perception spatiale des sons, fournissent autant de raisons pouvant expliquer l'apparition de distorsions dans une étape de conversion. Deuxièmement, en supposant même que les algorithmes soit parfaits, il y a les limites de traitement de l'information par les appareils effectuant la conversion. Dans le cas de la conversion transaurale, si l'inhibition des modifications spectrales normalement présentes dans un signal binaural, pour les sons ayant une provenance frontale, est relativement facile et demande un traitement statique de l'information, le contrôle de la diaphonie acoustique est un traitement dynamique demandant une capacité de traitement de beaucoup supérieure. Ainsi ces observations sur les limites pratiques actuelles de la conversion transaurale s'appliquent de la même façon à la simulation binaurale. Cette dernière remarque, si elle est un peu à l'extérieur du sujet de la compatibilité entre les différents systèmes de spatialisation sonore, explique toutefois les demi-succès que l'on remarque avec les systèmes n'exploitant que deux canaux pour véhiculer l'information sonore tridimensionnelle.

 

Du côté des systèmes multi-canaux et multi-enceintes acoustiques, la question de compatibilité pose des problèmes différents. S'il est vrai que Dolby Stereo/Surround et Ambisonic appartiennent tous deux à ce regroupement, leurs détails de conception sont suffisamment différents pour que la conversion ne soit pas abordée de façon empirique. Dans le Dolby Stereo/Surround, le signal a toujours des correspondances précises avec des positions d'enceintes acoustiques dans l'espace de reproduction. Par contre, en Ambisonic, le signal de format B ou de format C, qui est le format de transmission, ne correspond à aucun positionnement particulier d'enceintes acoustiques. Donc une conversion de Ambisonic vers le Dolby Stereo/Surround implique nécessairement une conversion du format B ou C à un format D, le format de reproduction, correspondant aux positions habituelles en Dolby Stereo/Surround pour quatre ou six canaux. Ensuite, le signal Dolby Stereo/Surround ainsi obtenu est traité de la manière conventionnelle pour cette technologie, c'est-à-dire laissé sans modification en quatre ou six canaux ou en transformant les quatre canaux dans une matrice à deux canaux comme sur les supports pour consommateurs courants tels que le disque compact, la vidéocassette ou le vidéodisque. Mentionnons à titre d'exemple la musique du film Howard's End, enregistrée et distribuée par la compagnie Nimbus en Ambisonic; toutefois, la bande-son du film est en format Dolby Stereo et la version vidéo du film est distribuée en Dolby Surround.

 

Pour la conversion inverse, Dolby Stereo/Surround vers Ambisonic, on doit faire passer le signal Dolby Stereo/Surround dans l'unité de panoramique/rotation du Ambisonic Mastering Package pour donner à chaque canal, et à l'enceinte acoustique pour laquelle il est destiné, une correspondance azimutale en format B. Cette correspondance azimutale en format B n'oblige pourtant aucune disposition particulière d'enceintes acoustiques sinon celles commandées par les limites du décodeur Ambisonic qui sera employé. Le Dolby Stereo/Surround devient en quelque sorte, une fois converti en Ambisonic, plus flexible quant à l'optimisation des conditions de reproduction. En présumant que le Dolby Stereo/Surround manipule adéquatement les images fantômes, c'est-à-dire les positions sonores entre les enceintes, la conversion ne devrait pas dégrader la qualité spatiale de l'information. Nous savons cependant que le Dolby Stereo/Surround manipule seulement de façon convenable les images fantômes dans le quadrant avant délimité par un angle de 45° de part et d'autre de l'axe X. Ambisonic de son côté, puisqu'il n'a pas été spécifiquement conçu pour accompagner un média visuel sur écran, manipule adéquatement les images fantômes sur 360° en mode bidimensionnel ou tridimensionnel. Nous pouvons donc affirmer que la conversion du Dolby Stereo/Surround vers Ambisonic maintiendra la qualité de l'information spatiale et la reproduction sera équivalente à ce qui serait obtenu avec un décodeur Dolby Surround passif.

 

Dans le processus de conversion inverse, Ambisonic vers Dolby Stereo/Surround, on assistera cependant à une certaine dégradation de la qualité de l'information spatiale, particulièrement à l'extérieur du quadrant avant décrit plus haut. S'il s'agit de musique acoustique, où les sons directs proviennent par convention du quadrant avant, le manque de précision azimutale dans les autres quadrants ne devrait pas poser de véritables problèmes esthétiques. S'il s'agit de musique électronique, dans le sens générique du terme, ou d'effets sonores, les deux pouvant contenir potentiellement des stimuli sonores distribués sur 360°, ce manque de précision introduira d'importantes distorsions spatiales pouvant déplaire aux concepteurs originaux des différents programmes. Il faudra aussi probablement s'abstenir d'utiliser un décodeur logic qui dirigerait de façon excessive les images fantômes vers des enceintes acoustiques spécifiques.

 

La conversion de l'information d'un système multi-canaux vers un système binaural ou transaural demande que chaque canal du signal multi-canaux qui sera converti ait une correspondance azimutale; il faut donc qu'il soit prêt pour la diffusion sur enceinte acoustique. Pour une conversion Dolby Surround vers binaural, cela ne complique pas le procédé puisque le Dolby Surround est déjà sous cette forme. Pour Ambisonic, il faut donc convertir le format B ou C en format D. Cependant le format D n'a pas l'obligation d'être d'une forme prescrite particulière: s'il s'agit d'un signal tridimensionnel, le format D pourrait même correspondre tout simplement au format A du microphone Soundfield. En fait, une fois connus l'azimut et l'élévation des enceintes correspondantes aux différents canaux d'un signal en format D Ambisonic ou Dolby Surround, les coordonnées de chaque canal sont inscrites dans un simulateur binaural. Les signaux composites sont donc traités comme n'importe quel autre signal à l'entrée du simulateur binaural: les relations spatiales existantes entre les canaux d'un même signal composite sont préservées. Une fois le signal multi-canaux converti sous forme binaurale, il peut être laissé tel quel pour une écoute avec casque d'écoute ou encore converti sous forme transaurale pour écoute sur deux enceintes acoustiques.

 

La conversion d'un signal binaural ou transaural vers un système multi-canaux n'est pas complexe, mais exige, comme mentionné au premier paragraphe de ce point, que les modèles psychoacoustiques, et les algorithmes qui en sont dérivés, soient exempts d'erreurs. De plus, la capacité de traitement informatique doit être suffisante pour assurer le succès dans l'application des algorithmes. Effectivement, la conversion d'un signal binaural vers un système multi-canaux passera par une conversion transaurale. Si cette étape n'est pas satisfaisante, la conversion subséquente, transaural vers multi-canaux, devient inutile. Une fois le signal sous forme transaurale, il peut être décodé directement par une matrice 4:2:4 Dolby Surround: idéalement toutefois, cette matrice devrait comporter les modifications suggérées par Cook 17. Un décodeur logic serait trop non-musical et affecterait sans aucun doute le traitement d'élimination de diaphonie acoustique propre aux signaux transauraux.

 

Compte tenu des qualités inhérentes à Ambisonic dans le traitement neutre de toutes les directions spatiales, une conversion d'un signal transaural, ou d'un signal binaural d'abord converti en transaural, ne devrait pas dégrader le signal original. En passant le signal transaural dans une unité de panoramique/rotation, on donne aux canaux gauche et droit les azimuts à partir desquels les algorithmes de conversion binaurale/transaurale ont été calculés en premier lieu. Même que le format B ainsi créé permet une installation d'enceintes acoustiques plus flexible que l'installation prescrite par le signal transaural original. Comme indiqué plus haut, une conversion binaurale/transaurale demande, pour fonctionner adéquatement, des azimuts précis pour la position des enceintes acoustiques. En reproduction stéréophonique conventionnelle, le signal transaural, s'il n'est pas reproduit par des enceintes ayant exactement les positions pour lesquelles il a été prévu, exhibe une distorsion dans son illusion spatiale. Mais un signal transaural converti en format B gardera toujours les azimuts qu'on lui a donnés à la conversion. Puisqu'une installation Ambisonic bidimensionnelle reproduit de façon neutre toutes les directions sur 360°, le signal transaural sera reproduit à partir des bons azimuts et ce, qu'il y ait des enceintes acoustiques à ces positions ou non.

 

 

6.3.2 Les installations multi-systèmes

 

La coexistence des différents systèmes, si elle est souhaitable, n'en est pas nécessairement une vision utopique. Un centre de production de Munich en Allemagne, Touchdown, possède un studio équipé d'un système de monitoring à quinze enceintes acoustiques pouvant accommoder la stéréophonie standard, le Dolby Stereo et l'Ambisonic tridimensionnel 73. Tout le traitement d'encodage et de décodage ambiophonique se fait par une unité de contrôle entièrement numérique développée par AGM Digital; c'est donc une réalisation des recommandations que nous formulions au chapitre précédent. Cette unité permet, en combinaison avec la console, d'effectuer des modifications de champ en format B tridimensionnel et aussi de procéder au mixage de différents formats B. L'unité peut traiter de front les systèmes déjà mentionnés et la comparaison entre les différents systèmes pour un même programme peut se faire en temps réel. Puisque les capacités de traitement ne sont pas encore saturées, les concepteurs prévoient l'incorporation d'algorithmes de correction spectrale, transformant ainsi l'unité de traitement ambiophonique numérique en console de mixage complète. Reste à savoir si l'interface-usager permettra aux utilisateurs d'obtenir le maximum des possibilités d'un mixage sonore tridimensionnel.

 

Du côté consommateur, les appareils mentionnés au chapitre 5 sont aussi un exemple de coexistence pacifique. Sachant cependant, d'après nos observations personnelles, que la majorité des utilisateurs sont paresseux, dans le mesure où ils veulent que la technologie soit transparente, et qu'ils ne sont pas nécessairement prêts à faire les efforts pour optimiser la reproduction des différents formats ambiophoniques, il devient impératif que les appareils traitant les signaux reconnaissent les formats qui leur sont alimentés. Cette question n'est pas réellement problématique si la transmission et le traitement de signal est sous forme numérique comme cela se fait déjà avec les produits fabriqués par les compagnies Mitsubishi et Onkyo. Il devient alors relativement aisé d'insérer un drapeau (flag) qui identifiera le format ambiophonique utilisé, pour que les appareils se mettent automatiquement en mode de décodage approprié 47. Nous observons toutefois que la pratique habituelle en Dolby Stereo/Surround d'utiliser différents types d'enceintes acoustiques, selon le canal qui leur sera alimenté, ne convient plus dans une installation multi-systèmes. En effet, puisque Ambisonic encode l'information directionnelle de façon uniforme pour tous les azimuts et élévations, la véracité de reproduction implique obligatoirement des enceintes acoustiques identiques peu importe leur position dans la salle ou leur fréquence d'utilisation. Le studio du centre Touchdown comportait déjà deux moniteurs pour la stéréo conventionnelle qu'il aurait été ridicule de sacrifier, ne serait-ce que pour des raisons financières. Pour l'installation ambiophonique, les concepteurs ont donc opté pour des moniteurs de la même compagnie (Quested) ayant des caractéristiques spectrales similaires à la paire principale, mais plus petits. C'est ainsi que le studio s'est vu équipé de treize moniteurs supplémentaires: ceci signifie qu'en Dolby Stereo le canal de centre et le canal surround sont reproduits par le même modèle d'enceintes acoustiques, contrairement à ce qui se fait normalement, comme nous l'avons mentionné plus haut. Cette installation est aussi un compromis économique honorable pour Ambisonic.