La voix humaine constitue le premier outil d’expression et de communication à la disposition de notre espèce. À travers cette conférence universitaire passionnante, Nathalie Henrich Bernardoni, directrice de recherche au CNRS, nous invite à explorer les coulisses physiologiques, acoustiques et culturelles de cet instrument dissimulé au cœur de notre intimité.

Entre science de pointe et traditions musicales du monde entier, cette intervention met en lumière l’extraordinaire plasticité d’un organe unique, capable de parler, de s’étirer, de siffler ou de faire vibrer des structures insoupçonnées pour donner vie à une infinie diversité d’expressions esthétiques.

Ce qu’il faut retenir

  • Un instrument unique pour une infinie diversité de timbres : bien que la structure anatomique de départ reste la même chez tous les êtres humains, les ajustements biomécaniques et les interactions fluides-structures permettent de créer des signatures vocales radicalement différentes, allant du chant lyrique occidental aux techniques traditionnelles de l’Oural ou des Balkans.
  • La gestion des mécanismes laryngés et des résonances : la production de la voix repose sur quatre configurations distinctes des plis vocaux. Le contrôle subtil de l’espace pharyngé et de la cavité buccale permet d’amplifier sélectivement certaines fréquences pour chanter dans l’extrême aigu ou modifier la perception des voyelles.
  • Les défis acoustiques de l’écoute individuelle et collective : le chant non amplifié utilise des ruses anatomiques comme le formant du chanteur pour surmonter la puissance d’un orchestre. Au sein d’un chœur, la balance entre la perception de sa propre voix et celle des autres dépend fortement de la directionnalité des fréquences, de la disposition physique et de la réverbération de la salle.

Mise en contexte de la voix humaine

L’étude de la voix se confronte immédiatement à une réalité physique particulière : il s’agit d’un instrument de musique caché à la vue, logé à l’intérieur du corps.

Cette situation implique une approche scientifique spécifique. L’exploration nécessite des techniques parfois invasives pour comprendre comment l’énergie aérodynamique se transforme en énergie acoustique.

Le système phonatoire s’articule autour de différents niveaux de contrôle. Le premier niveau est respiratoire : les poumons fournissent le flux d’air nécessaire.

Cet air interagit ensuite avec le larynx, puis traverse les cavités supérieures. C’est l’ajustement de ces parois mobiles qui détermine la texture finale du son.

Une même configuration de départ peut ainsi donner naissance à des esthétiques opposées. La chercheuse illustre ce propos en faisant écouter une grande variété d’artistes.

On passe de la pureté émotionnelle d’un chant traditionnel aux expressions saturées du rock ou du métal. Les femmes bulgares exploitent un chant de plein air très timbré.

D’autres cultures transforment la voix pour imiter la nature : un chanteur utilise son organe pour incarner une grenouille solitaire. Un interprète de l’Oural produit des sons si graves qu’ils évoquent le vrombissement d’un moteur.

La biomécanique du pli vocal

Pour comprendre cette flexibilité, il convient de se pencher sur les plis vocaux, dénomination scientifique des cordes vocales.

Ces structures possèdent des propriétés mécaniques remarquables. Elles font preuve d’une endurance et d’une rapidité exceptionnelles.

Lors d’une simple élocution de dix minutes, les plis vocaux d’une femme vibrent en moyenne cent quatre-vingt fois par seconde. Cela représente une distance physique cumulée de près de deux cents mètres et plus de quatre-vingt-six mille chocs répétés.

La nature a conçu ces tissus pour supporter de telles contraintes. Cependant, la prudence reste de mise : il est indispensable de ménager sa voix et de s’accorder des temps de repos pour éviter le surmenage.

L’anatomie interne du pli vocal révèle une organisation multi-couches. Cette structure complexe amortit l’impact des collisions quotidiennes.

Le muscle vocal, situé au centre, peut se contracter pour modifier la géométrie de la zone en la rendant plus bombée. Autour de lui, la lamina propria contient des fibres de collagène ondulées.

Sous l’effet de la tension, ces fibres se déplient à la manière d’un cheveu frisé que l’on étire. Cette capacité de déformation atteint parfois cinquante pour cent de la longueur initiale.

Grâce à cette élasticité, l’être humain est capable de couvrir une plage de fréquences fondamentales allant de quelques hertz à plus de mille cinq cents hertz.

Les mécanismes laryngés

L’être humain dispose de quatre configurations laryngées distinctes pour produire des sons du plus grave au plus aigu.

Le mécanisme principal, le mécanisme un, correspond généralement à la voix de poitrine. C’est la configuration universellement adoptée pour la parole quotidienne.

Dans ce mode, les plis vocaux se révèlent courts et épais. Ils vibrent sur toute leur épaisseur avec une participation active du muscle interne.

Le mécanisme deux, souvent associé à la voix de tête, propose un fonctionnement différent. Les plis s’allongent et s’amincissent.

La masse vibrante en action se réduit à la couche superficielle du tissu. La vibration s’effectue alors principalement dans un plan horizontal.

Pour imager ce phénomène, la chercheuse propose une analogie avec les lèvres d’un trompettiste : souffler ne suffit pas, il faut appliquer une tension et un rapprochement précis pour déclencher l’oscillation.

Aux extrémités du spectre vocal se trouvent deux autres mécanismes plus rares. Le mécanisme zéro, ou friture vocale, génère des fréquences extrêmement basses.

L’oreille humaine ne perçoit pas ces vibrations comme des notes musicales définies, mais plutôt comme une succession d’impulsions acoustiques distinctes. Ce mode requiert un relâchement musculaire absolu.

À l’autre opposé, le mécanisme trois régit la voix de sifflet. Très prisé par les enfants, ce mode permet d’atteindre des fréquences aiguës vertigineuses avec une dépense d’énergie minimale.

L’oreille humaine affiche une sensibilité maximale dans cette zone spectrale. Par conséquent, un sifflement léger peut paraître extrêmement sonore et perçant.

Illustrations dans le chant à travers le monde

L’examen des styles musicaux mondiaux montre que les artistes jonglent constamment avec ces mécanismes selon leurs besoins artistiques.

Dans l’opéra occidental, l’usage varie selon les interprètes. Certains ténors choisissent de pousser le mécanisme un jusqu’au sommet de leur tessiture pour conserver une puissance maximale.

D’autres préfèrent basculer subtilement vers le mécanisme deux pour aborder les aigus avec plus de légèreté. Les voix féminines explorent également ces transitions.

Une chanteuse mezzo-soprano peut utiliser le mécanisme un de manière très appuyée dans les graves pour donner l’illusion d’une voix masculine. Les sopranos coloratures montent quant à elles fréquemment dans le mécanisme trois pour exécuter leurs notes piquées.

En dehors du répertoire classique, les musiques populaires et traditionnelles exploitent ces bascules de façon décomplexée. Dans le rythm and blues ou le jazz, les artistes font évoluer leur timbre d’une texture soufflée et rauque vers un éclat métallique puissant.

Des chanteuses pop célèbres naviguent ainsi sur plusieurs octaves en masquant le passage entre la voix de poitrine et la voix de tête par des techniques de mixage vocal. Certaines traditions font de l’alternance des mécanismes le fondement même de leur art.

Le chant persan utilise des micro-bascules très rapides pour créer des ornements subtils qui diffèrent du vibrato classique. Le yodel, présent dans les Alpes mais aussi chez les Pygmées d’Afrique, repose entièrement sur un saut marqué entre les notes graves en mécanisme un et les notes aiguës en mécanisme deux, un jeu acoustique renforcé par l’articulation alternée de voyelles ouvertes et fermées.

Analyse en temps réel de la voix et résonances

La modification de la géométrie de la bouche et du pharynx transforme radicalement le spectre sonore de la voix.

Chaque voyelle correspond à une forme spécifique donnée au conduit vocal par les mouvements combinés de la langue, de la mâchoire et du voile du palais. L’acoustique traduit ces postures par des zones d’amplification ou d’atténuation appelées résonances.

À l’aide d’un logiciel d’analyse spectrale, la conférencière démontre que la voix parlée est de nature harmonique. Le son comprend une fréquence fondamentale accompagnée de ses multiples.

En utilisant le mécanisme zéro, il devient possible de visualiser la courbe de résonance sous-jacente du conduit vocal sans être gêné par les lignes harmoniques. On découvre ainsi que la voyelle « a » possède deux fréquences de résonance très proches l’une de l’autre, situées assez haut dans le spectre.

À l’inverse, des voyelles comme le « i » ou le « ou » font chuter la première résonance vers des valeurs graves. Ces propriétés physiques posent un problème concret aux chanteurs, en particulier aux sopranos.

Lorsqu’une note doit être chantée à une fréquence supérieure à la résonance naturelle de la voyelle écrite, le son perd son énergie. Pour surmonter cet obstacle, les interprètes modifient leur articulation dans l’aigu.

L’observation par imagerie par résonance magnétique révèle que plus une soprano monte dans l’aigu, plus sa langue adopte une position identique, quelle que soit la voyelle pensée. Les distinctions phonétiques s’estompent au profit de la puissance acoustique, obligeant l’artiste à ouvrir grand la bouche pour forcer la première résonance à suivre la hauteur de la note.

Le chant des bandes ventriculaires ou fausses cordes vocales

Le paysage vocal s’enrichit également d’autres structures vibratoires situées juste au-dessus des plis vocaux : les plis vestibulaires, communément appelés fausses cordes vocales.

Dans la phonation courante, ces bandes restent écartées et ne participent pas à la création du signal sonore. Cependant, certaines techniques traditionnelles les sollicitent volontairement.

Le chant diphonique mongol offre une parfaite illustration de ce phénomène. En faisant entrer les plis vestibulaires en contact avec les plis vocaux, les chanteurs créent un système d’oscillateurs couplés.

Les caméras ultra-rapides montrent qu’un cycle vibratoire sur deux, la masse supérieure vient masquer et interférer avec la glotte. Ce processus technique engendre un phénomène acoustique de doublement de période.

Le signal résultant se retrouve divisé par deux en fréquence, ce qui génère une note perçue comme deux fois plus grave par l’auditeur. Les plis vocaux réels continuent pourtant de vibrer à leur rythme initial.

Cette méthode permet d’obtenir un bourdon grave d’une grande richesse harmonique. Sur ce tapis sonore, le chanteur déplace ensuite sa langue et ses lèvres pour isoler et amplifier un harmonique précis, donnant l’illusion que deux voix distinctes s’élèvent d’un seul et même corps.

Le formant du chanteur et l’écoute de sa propre voix

Pour se faire entendre au-dessus d’un orchestre symphonique sans l’aide d’un microphone, le chanteur d’opéra utilise une stratégie acoustique ciblée.

Le spectre d’un orchestre affiche une forte concentration d’énergie dans les basses fréquences et décroît rapidement vers l’aigu. La parole humaine suit exactement la même courbe, ce qui rend la voix parlée inaudible face à une masse d’instruments.

L’être humain a contourné ce problème en développant le formant du chanteur. Cette technique consiste à concentrer l’énergie vocale dans une zone précise autour de trois mille hertz.

Cette plage de fréquences correspond précisément à la zone de sensibilité maximale de l’oreille humaine. Pour générer cette amplification, le chanteur maintient son larynx en position basse tout en élargissant l’espace de son pharynx.

Cette configuration crée un résonateur indépendant qui permet à la voix de percer le mur sonore de l’orchestre. Enfin, la conférence aborde la question complexe du chant en chœur et de la perception de soi.

L’oreille d’un choriste perçoit sa propre production de deux manières : par voie externe aérienne et par voie interne osseuse. La conduction interne favorise les graves et atténue les aigus, modifiant la perception du timbre réel.

De plus, la diffusion de la voix dans l’espace dépend de la fréquence. Les sons graves se propagent de façon omnidirectionnelle, tandis que les composants aigus s’avèrent hautement directifs et se projettent exclusivement vers l’avant.

Un choriste entendant ses voisins par l’arrière perd ainsi une partie de leurs fréquences aiguës. Les études montrent qu’un chanteur a besoin que sa propre voix dépasse le niveau du chœur de six décibels pour conserver un confort de chant optimal, un équilibre fragile qui dépend directement de la disposition géométrique du groupe et du temps de réverbération de la salle.