top of page
DSC_0036.png

A partir de maintenant, tu rentres dans l'intro du cours.

ETRE INGENIEUR DU SON

En studio d'enregistrement de musique

Pourquoi ce document

Ce document a été produit dans l’idée d’accompagner les formations proposées par le studio Ma. Ce document est mis en libre circulation sur les interwebs. De nouvelles versions seront régulièrement mises en ligne ; Abonnez vous à la page instagram pour suivre celles ci, ou rendez vous ici .

Je vous invite, si vous trouvez des coquilles, des erreurs, si vous voulez rajouter une section, précisez un concept, demander à reformuler des passages, à m’écrire à studio.ma.mod@gmail.com . C’est avec plaisir que je recevrais vos corrections et propositions.

Ce document est protégé en droit. Toute utilisation commerciale de celle ci est formellement interdite, toute utilisation dans un autre cadre que celui individuel est interdit.

Sommaire

II.B.1. Acoustique d’une control room et monitoring

II.B.2. Informatique et MAO

II.B.3. La console de mixage

II.B.4. Le mixage

II.B.4.a. Introduction

II.B.4.b. Edition

II.B.4.c. Le mixage et ses outils.

II. Processus de production

II.A. Enregistrement

II.A.1. Musicien.n.e

II.A.2. Acoustique

II.A.3. Instrument

II.A.4. Micro

II.A.4.a. Caractéristiques

II.A.4.b. Types

II.A.4.c. Positionnement

II.A.4.d. Multimiking

II.A.5. DI & reamping

II.A.6. Traitements à la prise ; Égalisation, compression.

II.A.7. Conversion analogique/numérique

II.B. Mixage

II.C. Mastering

Sommaire

Comment me lire ?

En plusieurs fois. Un chapitre par matinée, c'est pas mal. Sautez par dessus ce que vous ne comprenez pas, revenez y plus tard. Soyez libres comme Angèle ; Allez, depuis le sommaire, directement à ce qui vous intéresse. Si c'est votre première lecture, sautez tout ce qui est précédé de "Pour aller plus loin", ou "Fun fact". 

2f1a7c21-8354-4078-a4f2-5b5a38a9b112.jpg

I. Introduction et théorie

Introduction au métier d'ingénieur du son

DSC_0161v2.jpg

Être ingénieur son en studio d'enregistrement de musique c'est dans l’idéal ;

  1. Accompagner la production de la meilleure version possible d'une chanson enregistrée.

  2. Etre au service de l'artiste.

  3. Gagner sa vie. Selon le positionnement que vous avez, vous allez donc surement également gérant de structure

Concepts de base, théories et connaissances.

Nous allons voir ici les pures bases théoriques. Difficiles à absorber, elles sont nécessaires pour comprendre comment se comporte le son afin de prendre les bonnes décisions de mixage, les bons choix de micros, bien utiliser les outils tels que les égaliseurs, la compressions, etc..

A.1.a. Qu'est ce qu'un son ?

  • Un son est un ensemble de vibrations variants en volume dans le temps. Décodé par l'oreille, cet ensemble devient alors un signal électrique transmis de l'oreille au cerveau et interprété par celui ci.

    • Cette variation de volume dans le temps est l'enveloppe d'un son, c'est à dire sa dynamique, et peut être définie avec le concept d'enveloppe ADSR ; Attack, Decay, Sustain, Release. Nous allons expliquer ça en cinq points, avant de les réduire ;

Enveloppe

ADSR.png

01

Déclenchement (Trigger)

Un son est considéré comme ayant un début ; C'est le t0 (temps 0, t=0s) et correspond au déclenchement du son en question.

Le déclenchement d'un son provient en général d'une action humaine qui vient exciter, c'est à dire actionner, le mécanisme d'un instrument ; Frapper une caisse claire avec une baguette, appuyer sur une touche de piano, souffler dans un bec de saxophone, chanter une syllabe. Le déclenchement est donc considéré comme "instantané", il n'a pas de durée propre ; Il est seulement l'action de départ, le t0.

03

Decay

Le Decay est une durée, mesurée en millisecondes ou secondes (s) ; C'est le temps que met un son à redescendre à son volume moyen (le sustain) après avoir atteint son plus haut volume, c'est à dire après l'attack.

05

Release

C'est une durée mesurée en ms ou s ; C'est le temps que met un son à s'éteindre une fois que l'instrument arrête d'être excité.

02

Attack

L'attack d'un son est une durée, mesurée en général en millisecondes (ms) ; C'est le temps que met un son donné à atteindre son volume maximum une fois le son déclenché.

04

Sustain

Ce volume moyen est appelé Sustain; C'est un volume, mesuré en décibels (dB). C'est le volume moyen que produit un instrument tant celui ci reste excité.

Un instrument reste excité tant que le musicien continue de le faire; Par exemple en maintenant la touche de piano enfoncée, en continuant de souffler dans le saxophone, en maintenant la note chantée (la corde vocale continue d'être excitée)... L'excitation d'une percussion est superbement court ; De l'ordre de millisecondes ; C'est seulement le temps que le baguette, la main, la pédale, frappe la percussion.

transitoires.png

Le schéma ci dessus montre l’enveloppe d’un son percussif ; Les percussions arrêtant d'être excitées aussitôt qu'elles le sont, leur sustain n'existent donc pas (le sustain étant le volume moyen tant que l’instrument produisant le son reste excité). Si le sustain n’existe pas, le decay non plus. Ou plutôt, leur release et leur decay forment une seule et même entité. On parle donc surtout d'AR (Attack/release) pour les percussions, qu'on appelle également transitoire et corps (transient et body).

Les transitoires (transients) sont donc la partie très élevée en volume et très courte dans le temps. Le corps (body) est la partie plus faible en volume et plus longue dans le temps.

 

• Exemples ; Un clappement de main arrête d'être excité très rapidement ; Son excitation provenant du contact d'une main sur l'autre. Son attack est très courte (très rapide), son sustain et son decay se confondent entre l'attaque et la release, sa release est très courte.

Une caisse claire a une attaque très rapide, un decay qui peut aller jusqu'à 2s, un sustain inexistant (la caisse claire arrête d'être excité aussitôt quelle arrète d'être frappée). On voit clairement sur l'image ci dessous la transitoire, très élevée en volume, puis le corps.

 

Un violon tenu peut avoir une attaque assez longue, un decay long, sustain élevé et release courte.

Un son est donc comme on l’a vu un ensemble de vibrations variants en volume dans le temps. On vient de voir comme nommer et analyser cette variation dans le temps ; L’enveloppe ADSR. Parlons maintenant des vibrations en question ;Ces vibrations sont appelés fréquences.

fréquences

output-onlinepngtools (6)_edited.png

Considérons ici une onde sinusoïdale, comme sur le schéma ci dessus. Une période est la durée nécessaire pour qu'un phénomène ou un événement se répète complètement, revenant à son état initial. C'est le temps que cela prend pour qu'un cycle se termine et recommence identiquement. Autrement dit, un cycle complet, c’est à dire une période, correspond au retour d’une valeur à sa valeur originale après être passée par sa valeur positive maximale et sa valeur négative maximale, comme vu sur le schéma ci dessus.

Imaginez une vague à la plage. Quand vous la regardez, elle monte, puis redescend, puis remonte de nouveau.

La période de cette vague est le temps que cela prend pour qu'elle fasse un cycle complet, c'est-à-dire qu'elle monte, redescend, et remonte à son point de départ. Certaines vagues ont des périodes plus courtes (les petites vagues proches de la rive), d’autres ont des périodes plus longues (celles vers le large).

Une fréquence est simplement le nombre de cycles qui se produisent en une seconde. Elle est mesurée en hertz (Hz), qui représente le nombre de cycles (périodes) par seconde.

Une fréquence de 100hz signifie que le phénomène observé a un nombre de 100 cycles complets à la seconde. En audio, cela correspond à ce qu’on on interprète comme un son. Plus la fréquence est élevée, plus le son est aigu, tandis qu'une fréquence plus basse correspond à un son plus grave.

L'être humain peut entendre de 20hz (soit 20 cycles par secondes) à 20 000hz (soit 20 000 cycles par secondes).

En réalité, les fréquences entre 20 et 40hz sont plus ressenties qu’entendues ; Ce sont les sub basses, celles qu’on ressent dans le torse lors d’un concert à volume élevé. De plus, avec l'âge l’oreille se détériore et les fréquence très élevées ne sont plus audibles ; Passé l'âge adulte, on entend rarement au dessus de 16 000hz.

Pour éviter d’écrire 16 000, à partir des milliers on parle en général en kilo hertz ; 16 000 hz est écrit 16khz, 1000hz est écrit 1khz, 1500hz est écrit 1,5khz, etc..

 On trie ces fréquences usuellement en quatre zones ; Les bas (low) de 20hz à 200hz, les bas medium (low mids) de 200hz à 1khz, les haut médiums (high mids) de 1khz à 6khz, les aigus (highs) de 6khz à 20khz. Ces mesures ne sont pas universelles, mais des repères généraux.

Bas (20hz/200hz)

Dans les bas, vous avez en général ; Certaines percussions (Grosse caisse, cajon, djembe..), basses, piano quand joués bas, violoncelles quand joués bas, puis du buzz, du bruit, du souffle

Bas medium (200hz/1khz)

Le corps de la voix humaine, fondamentales de certaines percussions, corps des guitares, notes hautes des basses électriques, et en réalité une bonne partie des instruments.

Haut medium (1khz/6khz)

Voix aigus, quelques consonnes, timbre de la caisse claire, fondamentales de cymbales, violons, saxophones alto/sopranos..

Aigus (6khz/20khz)

Sifflantes (S,Z, et F), charleys, bruits de bouches, bruits de cordes frottées..

On découpe aussi parfois les basses en deux zones ; Les sub basses, de 20h à 60hz, et les basses, de 60hz à 200hz, ainsi que les aigus, de 6khz à 12khz, puis de 16khz à 20khz. Encore une fois, ces repères de fréquences ne sont pas absolues, mais généraux, ce sont des fourchettes.

Fondamentales et harmonies

La fondamentale est la fréquence dominante d'un son qui détermine la hauteur de sa note. C'est la fréquence dominante la plus basse du son. Cette fréquence donne son nom à la note.

L’intégralité des instruments, percussions comprises ont une fondamentale, c’est à dire une note. C’est pourquoi il convient d’accorder sa batterie ; Ceci en tendant ou détendant la peu des fûts.

La fondamentale est la fréquence de référence autour de laquelle les harmoniques s'articulent. Les sons sont en effets composés de plusieurs fréquences, appelées harmoniques, qui sont des multiples entiers de la fréquence fondamentale. Ces harmoniques définissent la couleur et le timbre du son, quand la fondamentale détermine sa note.

Chaque note à l'octave décidé a donc la même fondamentale, peu importe l'instrument. La note « La » de la 3eme octave aura toujours la même fondamentale, c’est à dire la même fréquence, pour tous les instruments. Un violon, un trombone, un synthé, jouant un La auront tous leur fréquence fondamentale à 440hz. Notre cerveau pourra ensuite distinguer de quel instrument il s’agit par ses harmoniques ; Chaque instrument a un nombre d’harmoniques spécifiques, certaines plus élevés que d’autres. En voici un exemple si dessous ;

timb1.jpg

La fondamentale est le 440hz ; Toutes les harmoniques sont des multiples ; La première est 880hz, soit 2x440.

Fun fact ; Un son n'étant au final qu'un ensemble de fréquences variants en volume dans le temps avant d'être interprété par le cerveau humain, ce dernier peut distinguer une note privée de sa fondamentale s'il peut en entendre ses harmoniques. Le cerveau "reconstitue" les éléments manquants, comme lorsqu'on lit un mot avec les lettres dans le désordre ; Tnat que les prermièes et dneirères letrtes sont présnetes, nuos arvvions à lrie.

DIAPASON.jpg

Une fréquence est finalement donc une note ; Le La sur lequel la majorité des musicien.n.es s'accordent est le La440 ; C'est une fréquence de 440hz, c'est à dire un total de 440 cycles en 1 seconde. Vous avez peut être déjà vu un diapason ; Cet outil, une fois excité, c'est à dire frappé, vibre à exactement 440hz, soit 440 fois par seconde. Sa vibration produit donc un La parfait, sur lequel les musicien.ne.s peuvent s'accorder.

Pour aller plus loin ; Une octave est un intervalle musical qui sépare deux notes de même nom (comme deux Do, deux Ré, etc.) et dont les fréquences sont dans un rapport de 2:1. En d'autres termes, lorsque vous montez d'une octave, la fréquence de la note double, et lorsque vous descendez d'une octave, la fréquence est divisée par deux. Par exemple, si vous partez d'un La à 440 Hz, en montant d'une octave, vous obtenez un La à 880 Hz, et en descendant d'une octave, vous obtenez un La à 220 Hz.Pour simplifier, un La à l'octave au dessus, est la même note "plus aiguë".

• L'audition humaine suit une échelle logarithmique plutôt qu'une échelle linéaire, ce qui signifie que nous percevons les écarts de fréquence en termes de ratios plutôt que de différences absolues. C'est pourquoi pour monter d'une octave nous devons doubler la fréquence, et non l’augmenter d’un nombre défini. Il y a donc finalement, en terme de perception, la même différence entre 220hz et 440hz qu'il n'y en a entre 10 000hz et 20 0000hz, et ce bien qu’en premier on monte de 220hz, et en second de 10 000hz. C’est également pourquoi les basses ne contiennent que 200hz, soit 200 valeurs possibles, quand les aigues en contiennent 14 000 ! C'est pourquoi aussi les égaliseurs et analyseurs spectraux sont en général organisés de cette manière ; Les fréquences sont doublés à chaque intervalle, permettant une représentation proche de notre perception.

Pour le dire autrement ; Une différence de 50hz est relative aux fréquences qu'elle sépare ; N’importe qui entend la différence entre 100hz et 150hz. Personne au monde ne peut entendre la différence entre 10 100 hz et 10 150hz.

Pour aller encore plus loin ; On peut donc découper le bande d'audition humaine en octave, comme ceci ;

Première octave : 20 Hz - 40 Hz

Deuxième octave : 40 Hz - 80 Hz

Troisième octave : 80 Hz - 160 Hz

Quatrième octave : 160 Hz - 320 Hz

Cinquième octave : 320 Hz - 640 Hz

Sixième octave : 640 Hz - 1 280 Hz

Septième octave : 1 280 Hz - 2 560 Hz

Huitième octave : 2 560 Hz - 5 120 Hz

Neuvième octave : 5 120 Hz - 10 240 Hz

Dixième octave : 10 240 Hz - 20 480 Hz

A.1.A Qu'est ce qu'un son
Fréquences
Def periode
Def hertz
Decoupag zones frequentielles spectre audible
Def transtoire
def fondamentale
A.1. Concepts de base, théories et connaissances
Enveloppe
Un son est un ensemble de vibrations variants en volume dans le temps. Comment quantifier ce volume ? En décibel !
DSC_0304v2.jpg

Qu'est ce qu'un décibel ?

On mesure le volume d'un signal en décibel. Un décibel est un rapport en deux grandeurs ; Il est donc toujours référencé, comme les degrés ; Degrés celcius, degrés fahrenheit, etc..

On utilise principalement trois types de dB, qui se réfère à leur référence ; Le dB SPL (dans le monde réel), le dBu (en volt, dans les cables), le dbFS (le décibel numérique)

dBSPL

Le dB SPL (Sound Pressure Level), est l'unité de mesure du niveau de pression acoustique. Pour vulgariser, c'est donc le volume d'un son dans le "monde réel" ; Dans une pièce, en extérieur, etc.. On part de 0db (seul d'audibilité), et monte, virtuellement, en illimité, en réalité comme sur cette échelle 

Le dB SPL est défini par la formule suivante :dB SPL = 20 * log10(P / Pref)où :dB SPL est le niveau de pression acoustique en décibels.P représente la pression sonore effective de l'onde acoustique en Pascal (Pa).Pref est la pression de référence standard, généralement définie comme 20 micropascals (µPa).En pratique, le dB SPL mesure la pression de l'onde sonore par rapport à cette pression de référence. Par exemple, si le niveau de pression acoustique est mesuré à 40 dB SPL, cela signifie que la pression sonore effective est 100 fois supérieure à la pression de référence (20 µPa).

dBFS

Le dBFS (decibel Full Scale) est une unité de mesure utilisée pour l'audio numérique. Il indique le niveau relatif du signal par rapport au niveau maximum que peut représenter un système numérique sans provoquer une distorsion numérique. La valeur maximale du dbFS avant distorsion est 0dbFS. On mesure donc ensuite les dbFS en valeurs negatives ; -10dbFS, -14dbFS, etc.. Son échelle est donc comprise en général du plus faible au plus élevé ; entre -140dbFS et 0dbFS. -140dbFS étant ici le plus faible, et 0dBFS le plus élevé.

dBu

Le dBu est une unité de mesure utilisée pour quantifier le niveau de tension dans le domaine de l'audio électronique. On l'appelle parfois aussi dBv. C'est le volume qui circule dans les câbles analogiques.

1 dBu équivaut à 0,775 volts en tension continue (Vdc). Ainsi, lorsque vous mesurez une tension en dBu, vous exprimez le niveau de tension par rapport à cette référence de 0,775 Vdc. Par exemple, si vous mesurez une tension de 2 dBu, cela signifie que la tension alternative (AC) correspondante est équivalente à 0,775 Vdc multipliée par 10^(2/20), soit environ 0,9807 VAC (volts en alternatif). Son échelle est donc comprise en général, du plus faible au plus élevé ; de -120dBu à + 30dBu. Et oui, le 0dBu c’est qu’une valeur intermédiaire, ce n’est pas le minimum. Encore une fois, comme pour les degrés celcius ; Le minimum, comme le savez trop souvent les nuits d’hivers, n’est pas 0°C ; On peut aller en dessous. En France, l’échelle est de -10° à +40°C en moyenne

dbS.png

Rapports entre les différents dB

Attention ; Ce qui suit est complexe et nécessite une compréhension plus approndie des rapports entre les outils du studio (micro, préamplis, convertisseurs). Lisez le maintenant et revenez y plus tard, vous le comprendrez mieux, ou plutôt vous comprendrez en quoi c'est pertinent et utile plus tard.

Ces différentes mesures en dB vont parfois se croiser, interagir. Un micro capte par exemple de la pression acoustique (dBSPL)) et transforme celle-ci en signal électrique (dBu). Le signal analogique électrique est ensuite convertit en signal numérique (dBFS).

Nous reviendrons sur le concept de conversion plus tard, mais voilà ce qu’il faut retenir de ce qu’est la conversion analogique/numérique ou numérique/analogique ; Un signal analogique est une tension avec une infinité de valeurs possibles. Le numérique est lui une série limitée de 0 et de 1. Il faut donc convertir régulièrement l’analogique en numérique ; C’est ce que fait votre téléphone quand il transforme le son analogique du micro du téléphone en informations numériques, pour pouvoir l’envoyer dans les airs. Il le fait de nouveau pour que vous entendiez votre interlocuteur.ice ; Il transforme le son numérique en analogique pour que le haut parleur de votre téléphone puisse vibrer. C’est aussi ce que fait une carte son pour transporter le signal son via son câble USB, etc.. Pour convertir, il faut donc un convertisseur, dont c’est en général l’unique et seul job ; transformer un signal analogique en numérique.

 

Le dBu mesure le niveau de tension analogique, tandis que le dBFS mesure le niveau numérique. Le rapport entre les deux dépendra du système audio (il n'y a pas de norme, même si en général il y a peu d'écarts entre les machines) ; Le dBu devient dbFS lors de la conversion analogique à numérique, le dBFS devient dBu lors de la conversion numérique à analogique (Dans les deux sens donc). Les fabricants indiquent dans les spécifications de leur convertisseur la valeur en dBu correspondant à 0 dBFS ;

Par exemple, pour la conversion d’entrée pour du convertisseur Antelope Orion 32  ; +20dBu=0dBFS. Cela signifie que l’Orion 32 transformera un signal de +20dBu en 0dbFS, et tous ses dérivés ; +18dBu = -2dBFS, +10dBu = -10dbFS, 0dBu = -20dbFS, -20dBu =-40dbFS, etc..  Ces valeurs ne valent que pour ce convertisseur spécifique. Pour le convertisseur RME M32 ; +24dBu=0dBFS, le rapport change donc. Etc..

Les machines analogiques précisent elles aussi leur niveau de sortie maximal ; En général entre +18dBu et +26dBu. Vous devez donc accordez l'un à l'autre, pour éviter la saturation.

dBSPL et dBu ; Il n'y a pas de rapport direct entre dBSPL et dBu. Un niveau de pression acoustique (dBSPL) sera transformé en tension (dBu) avec des outils précis ; en général des micros. Cette transformation dépendra donc du micro, de ses caractéristiques, de son positionnement, etc.. Par exemple, votre oreille transforme la pression acoustique en signal électrique pour votre cerveau. Elle transforme donc un dBSPL en dBu. Mais ce dBu dépendra de où vous vous placez ; Si vous êtes proche de votre téléphone vous entendez bien, si vous êtes loin non ; Malgré une pression acoustique semblable, le niveau en dBu sera différent. Vous entendrez également moins bien si vous avez passé la veille la tête dans le caisson du Dub Festival, si ça existe. Pareil pour un micro, même si ce dernier ne se réveille pas avec -45e au bar du festoche et un mal de crâne à faire pâlir Charles Xavier. On ne peut donc pas mettre de rapport absolu entre dBSPL et dBu ; Cela dépendra toujours des conditions, du micro, etc..

20210920_124741920_iOS.jpg

La phase

Partie la plus indigeste, vous pouvez la sauter pour le moment si vous le désirez. Il faudra cependant y revenir pour comprendre la relation entre les signaux audios et la possible destruction de ceux ci lors de l’enregistrement à plusieurs micros.

La phase fait référence à la position relative d'un événement ou d'un phénomène par rapport à un point de référence dans le temps ou dans un cycle. Autrement dit, la phase se rapporte à la position d'une onde sonore par rapport à un point de départ dans un cycle d'oscillation. La phase est généralement exprimée en degrés (°) ou en radians (rad). La phase est donc, entre autre, un phénomène temporel exprimé en degrés. 

phase.png

La phase est juste une autre manière de quantifier un évènement audio ; Au lieu de considérer  comme valeur son temps, ou considérer son amplitude, on décide de considérer son degrès. C’est finalement comme considérer une vague non par son positionnement sur l’océan entier, ni par sa temporalité ou sa hauteur, mais par le fait qu'elle monte ou descende !  

C’est simplement une autre manière de parler de la vague ; La vague étant en forme de demi cercle, on en parle alors en degrés (Un cercle complet, soit deux demi cercles, c'est à dire un cycle complet, fait 360°, un demi cercle 180°, un quart 90°, etc..). Une vague va passer par 90° à différents moments de sa vie ; Quand elle est à 60°, comme on le voit sur le schéma ci dessous, on sait qu'elle monte. A 90, elle ne peut que descendre. A 270, que monter, etc... La phase est donc relative au temps, à la distance, et à son amplitude, mais décrit seulement la position d'une onde dans son cycle d'oscillation.

La phase est donc une caractéristique d’un son. Bien que paraissant complexe et purement théorique, nous sommes constamment en studio confrontés aux problèmes de phase ; Typiquement lorsque qu’il y a déphasage entre deux signaux. Le déphasage se produit lorsque deux signaux sonores ont une différence de phase, c’est à dire lorsque leur phase n’a pas le même degrés au même instant.

Par exemple, un déphasage de 180 degrés signifie que les deux signaux sont en opposition de phase, ce qui signifie qu'ils sont exactement décalés d'un demi-cycle. Ces phénomènes arrivent régulièrement en audio, surtout lorsqu’on capture une même source avec plusieurs micros. Si deux signaux sont en parfaite opposition de phase, le premier signal atteint sa valeur positive maximal à l’instant où le second atteint sa valeur négative maximal. Dans notre domaine, considérons deux sinusoïdes dont l’une est à 90° quand l’autre est à 270° (soit un décalage de 180°). C’est à dire dans notre exemple que l’une est à +15dB et l’autre à -15dB. Additionnons ces deux valeurs ; (+15db)+( – 15dB) = 0dB. Ces deux signaux additionnés donnent donc un signal nul ; Un silence.

Cafs4.jpg

On peut opposer facilement la phase, analogiquement ou numériquement. Pour par exemple utiliser des câbles TRS !

Dans la réalité, nous ne traiterons jamais de sinusoïde parfaite, mais des ensembles de fréquences variants chacune différemment dans le temps. Deux signaux parfaitement en opposition de phase n’existeront pas ; Seules une partie des fréquences le seront et s’annuleront. Il en va de même pour la « parfaite » opposition de phase. Nous seront plus souvent confronté à un déphasage de quelques dizaines de degrés. Ce déphasage créera cependant l’opposition de phase de plusieurs fréquences, et créera des « notch » dans la plage fréquentielle ; Des fréquences entières disparaîtront, détruisant notre mix.

RGYNFQIUPRAGBD754SCRQHBQNM.jpg

Mais dis jamy, comment des problèmes de phases peuvent exister dans le monde reel ?

En vrai c'est une photo de Jamy, pas de Fred, donc ça marche pas dans ce sens, mais vous avez l'idée

Facile ! Un son est une onde variant dans le temps. Le son parcourt 340 mètres par seconde en moyenne. Une fréquence étant un nombre de cycle par seconde, on peut la traduire.. en mètres !

Formule (bouuuh) ; λ=c/f ou λ est la longueur d'onde en mètre (m), c la célérité de propagation de l'onde en mètre par seconde  et f la fréquence (Hz)

Une fréquence de 100hz, assez basse, a une longueur d'onde de c/f, soit 340/100, soit 3,4mètres. Une fréquence de 100hz a donc besoin de 3,4 mètres pour effectuer un cycle complet.

Qu'est ce que ça veut dire pour nous ? Et bien, selon si vous êtes à 2m de la source produisant l'onde de 100hz, ou a 3m.. Vous n'ètes pas au même degrès de l'onde ! Pas au même endroit de la phase ! Si vous enregistrez donc un trombone produisant une note dont la fondamentale est à 100hz avec deux micros, un situé à 1m7, et l'autre à 3m4, vous enregistrez le signal en parfaite opposition de phase. Une fois vos deux signaux micros additionnés, vous obtenez une annulation de phase complète, soit.. un silence.

Deux micros  à une distance différente d'une même source auront donc inévitablement un décalage de phase, qui dépendra lui même de la fréquence donnée. Un son étant composé de plusieurs fréquences, ça devient le bazar.. Oh pétard ! Relisez le tout maintenant. Ca devrait être plus clair. Il est impératif de comprendre la phase, sinon, malgré vos milliers d'euros de micros, vous ne comprendrez pas pourquoi ils sonnent mal une fois additionnés.

Dans le cas d'une batterie, on utilise en effet jusqu'à 15 micros, pour un total d'en moyenne 8 sources (chaque éléments de la batterie). 

Nous verrons précisément plus tard comment remédier à ces problèmes. Soit en plaçant les micros à la même distance de la source, soit numériquement, en décalant dans le temps les prises des micros.

Stereo ?

Un son est un ensemble de vibrations variants en volume dans le temps. Décodé par l'oreille, cet ensemble devient alors un signal électrique transmis de l'oreille au cerveau et interprété par celui ci. 

On a vu ce qu'est une vibration, c'est qu'est le volume (les dB), c'est qu'est le temps (enveloppe et phase). Qu'en est il de l'interprétation du cerveau ? Nous aurons plein d'occasions pendant le cours de parler l'importance cruciale du cerveau, et de tout ce que implique (goûts, subjectivité, etc...). Mais pour le moment, voyons seulement à quel point c'est important via la stéréo.

Stereo, L-R et Mid /Side

Depuis plusieurs dizaines d’années, nous consommons la musique avec des système stéréo ; Il y a une enceinte gauche, et une droite. Sur les casques il y a un côté gauche, et un côté droit, etc.. La musique est donc mixée en fonction ; On entend, particulièrement quand on écoute au casque, qu’il se passe des choses à droite, d’autres à gauche, d’autres au centre, etc.

Nv3.gif

Seulement, en réalité, le centre n’existe pas ; Quand vous mettez votre casque, vous avez l’impression que la voix est devant vous, vous l'entendez au centre alors que vous n’avez pas « d’oreille centrale » sur le front. D’où vient donc alors cette impression de centre, de mono ?

Eh bien le cerveau construit une image sonore placée au centre lorsque un son est exactement similaire à gauche comme à droite.

Votre cerveau interprète et reconstruit l’image stéréo ; Ce qui est mono (au centre) est donc en réalité la somme de signaux gauche et droite identiques

On peut donc considérer d'une part l'image mono (un seul canal), et d'autre part l’image stéréo (deux canaux) de deux manières ; En gauche-droite (Left Right, L-R) ou en Mid/Side (M/S), comme sur le schéma si dessous ;

Ce sont de pures considérations théoriques, mais qui nous serons utiles tout au long du processus d’enregistrement, de mixage et de mastering. En effet, certains outils permettent d’agir sur le L-R, c’est à dire les deux canaux gauche et droit (stéréo), ou bien seulement le canal gauche, ou le canal droit (double mono). On peut également agir seulement sur le Mid (Le centre) ou seulement sur le Side (Les côtés).

DSC_0350v2.jpg

milieux de propagation

On a vu la définition d'un son. Un son se propage dans différents milieux ; Quels sont-ils et comment réagissent ils au son ? Quels type de signaux existent, et à quels câbles correspondent ils ?

À propos

Un son va suivre cette chaîne avant d'être entendu ; Un être humain excite un instrument. L’instrument entre en vibration selon ses propres caractéristiques, et diffuse le son autour de lui dans différentes directions. Le son se déplace alors dans la pièce, qu'on considère comme un espace acoustique. Cet espace module le son. Il est ensuite capturé, c’est à dire transformé en signal électrique (en tension) par un micro. Il se transporte ensuite dans un câble qu'on appelle parfois câble basse tension. Il peut être analogique (tension avec une infinité de valeurs) ou numérique (tension avec un nombre de valeurs fini et donc limité).

Nous verrons comment le son se diffuse dans l’espace plus tard. Nous allons pour le moment nous intéresser aux différents types de câbles qui existent. On en distingue donc deux types ; Les câbles analogiques et les câbles numériques. Dans ces catégories se trouvent différentes caractéristiques internes. Regardons le.

1 ; Signal analogique

Un signal analogique circule dans des câbles adaptés. C’est typiquement le câble jack entre l’ampli et la guitare, le câble XLR entre le micro et le pré-ampli, etc..

Quels sont les possibles caractéristiques du signal analogique ?

Symétrique/asymétrique

Les câbles symétriques sont aussi appelés "Balanced" ou TRS pour Tip Ring Sleeve (3 conducteurs), les asymétrique "unbalanced" ou TS pour Tip Sleeve (2 conducteurs)

On les appelle aussi câbles stéréo et mono.

Asymétrique ; Un signal asymétrique n'a que deux conducteurs internes ; un conducteur de masse, et un conducteur de signal (point chaud). La masse est la référence, et ne contient pas de son. Le point chaud lui transporte le son, à un voltage et une impédance propre.

 

Symétrique ; Un câble symétrique comprend trois conducteurs internes : un conducteur de masse, et deux conducteurs de signal (point chaud et point froid). La masse ne porte toujours pas de signal. Les deux conducteurs portent eux le même signal audio, sauf que l'un est en opposition de phase par rapport à l'autre (remember me?). Les deux signaux sont plus tard remis en phase par les machines les recevant. Les interférences reçues sur le trajet sont alors en opposition de phase, et s'annulent.

En effet, les câbles sont sujets aux interférences, aux parasites, provenant d’alimentation croisées sur le chemin, de LED au champ magnétique puissant, d’ondes téléphones, etc.. C’est le « beepbeep » que vous entendez quand vous téléphonez proche d’une enceinte. La symétrisation du signal permet donc de palier au problème, comme indiqué ci dessous.

Les câbles symétriques sont donc moins sujets aux interférences et peuvent transporter des signaux sur de longues distances sans problème. Ils sont cependant plus coûteux à fabriquer, et la création même du signal symétrisé en amont du câble, et sa dé-symétrisation à la réception implique l'existence de transformateurs en amont et aval du dit signal, augmentant les coûts totaux de la chaine.

Impédance

L'impédance d'un signal est une mesure de la résistance électrique totale qu'il présente lorsqu'il est soumis à une variation de tension. Elle est exprimée en ohms (Ω). Plus l'impédance d'un signal est élevée, plus sa tension, donc son niveau, chutera avec la longueur de câble.

 

L'impédance est cruciale pour assurer une adaptation correcte entre les différents composants d'un système audio. Par exemple, il est important que l'impédance de la source audio (comme un microphone ou un instrument) corresponde à l'impédance de charge de l'entrée de l'appareil qui le reçoit (comme une console de mixage ou un préamplificateur). Si l'impédance n'est pas adaptée, cela peut entraîner une perte de qualité du signal, une distorsion ou une mauvaise transmission de l'énergie du signal.

Niveau

C'est la tension en volt, exprimée en audio en dBu. Plus elle est élevé, plus le signal est "fort en volume". Plus la tension est élevée, plus le signal peut traverser de grandes longueurs de câbles.

Pour résumer ; Un signal asymétrique sera plus sujet aux interférences qu’un symétrique. Un signal à haute impédance ne pourra pas traverser de longues distances (Moins de 10m). Un signal à trop bas niveau ne pourra pas traverser de d’immenses distances (moins de 100m)

Niveau instrument
(Hi-Z) 

Asymétrique, faible niveau, haute impédance. C’est typiquement la sortie d’une guitare électrique, ou d’un synthé.

Impédance ; de 1000ohm pour les synthés à jusqu'à 15000 pour les guitares. Niveau ; quelques centaines de millivolts (mV) à quelques volts (V), soit -40 à -20dbu

En raison de sa haute impédance et son asymétrisation, un signal instrument ne peut pas parcourir trop de longueur ; Il se détériore vite, au bout de 15m selon le câble utilisé. On conseille en général une longueur max de 6m. Ce signal circule en général à travers un jack asymétrique, comme l’image qui suit.

Niveau ligne

Symétrique ou asymétrique, basse impédance, haut niveau. C’est la sortie d'un préampli, d'un effet externe, l’entrée d’un convertisseur..

Impédance ; de 50 à 600ohm. Niveau ; 0,775 volt en général, soit 0dbu.

En symétrique, un signal ligne peut parcourir, selon le câble, jusqu'à 300m sans perte ni détérioration. En asymétrique, on évite les grandes longueurs, car même si le signal ne se détériorera que peu, les perturbations altéreront le signal.

Les niveaux lignes asymétriques circulent dans des jacks mono ou bien des RCA/Cinch (utilisés en Hifi mais très rarement en audio pro). Les symétriques dans des jacks TRS et/ou du XLR.

output-onlinepngtools (2).png

Niveau micro

Symétrique, basse impédance, faible niveau. C’est typiquement la sortie d’un micro, ou d’une DI.

Impédance ; de 150 à 600ohm. Niveau ; quelques mV à quelques dizaines de mV, soit -60 à -40dbu. Ayant une faible impédance et étant symétrisé, un signal micro peut parcourir jusqu'à 100m, selon le câble utilisé.

output-onlinepngtools (1).png

Comme on l’a vu, on utilise principalement en studio (pour l’analogique) deux types de connecteurs ; Les jacks et les XLR.

Le jack utilisé le plus couramment est le jack 6,3mm ; C’est le gros jack. Il y a aussi le jack 3,5mm ; Le mini jack, celui utilisé sur les baladeurs, téléphones, etc.. Plus fragile de par sa taille, on lui privilégie le 6,3mm en studio. Dorénavant, quand nous parlerons de jack, nous parlerons toujours du jack 6,3mm. Les câbles jacks viennent en général en « mâle-mâle », c’est à dire que les deux extrémités du câble sont des jacks mâle.

Le XLR à l’inverse lui vient généralement en câble « mâle-femelle », c’est à dire qu’une extrémité est en mâle et l’autre en femelle ; ils peuvent donc s’emboîter. Il est ainsi possible de connecter plusieurs XLR à la suite pour former des grandes longueurs. Les connecteurs XLR viennent avec un système de sécurité qui « bloque » les connecteurs mâles et femelles entre eux ; Il n’y a ainsi que peu de risque de déconnexion impromptue ; pratique. Les connecteurs XLR (nous parlons bien du connecteur, pas du câble, c'est à dire l'extrémité du câble) cependant prennent deux fois plus de place qu’un connecteur jack 6,3mm ; Sur un même espace, par exemple ici sur un rack 1U, on peut mettre presque 3 fois plus de jacks que de XLR ; 48 jacks d’un côté, 16 XLR de l’autre.

output-onlinepngtools (5).png
output-onlinepngtools (4).png

Un rack 1u ? C'est quoi ça encore ?

Un rack, ou plus précisément un rack 19”, est un format aux dimensions normalisées ; 483mm de longueur. Une unité représente 45mm de hauteur a peu près. Les machines utilisées en studio sont généralement au format rack, et font entre 1U et 2U, rarement plus. Les racks sont vendus normalisés aux bonnes dimensions et vous permettent de racker, d’additionner, toutes vos machines, de les visser sur les côtés n’importe où à l’intérieur de vos armoires à rack. Leurs "oreilles" permettent de les visser le long de rails prévus à cette effet.

rack.jpg

Cette armoire à rack, faite par studioTone, est un assemblage de plusieurs modules, dont un pouvant contenir 2U, deux 4U, et une base de 1U. On voit qu’elle est remplie, de haut en bas, d’un patchbay, d’une MOTU128, d’une Vermona VSR3, d’un Fill 1U (remplissage de rack pour cacher le « trou »), d’un Gyraf Bus Comp, puis d’un nouveau patchbay. Les 4U du dessous et la dernière U tout en bas sont vides.

2 ; Signal numérique

Nous avons vu les trois types de signaux analogiques principaux ; Niveau instrument, niveau ligne, et niveau micro.

Ce signal est ensuite enregistré analogiquement, c’est à dire sur bande, ou bien il est convertit numériquement pour être enregistré sur disque dur. En effet, le signal analogique, une tension continue avec une infinité de valeurs, est converti en signal numérique (digital en anglais), c'est à dire en une série de 0 et de 1, grâce un appareil dont c'est le seul but ; Le convertisseur. Il récupère un signal analogique et le transforme en signal numérique.

Certains appareil sont équipés d’un convertisseur intégré ; L’Heritage Audio Super 8 par exemple est un rack 2U proposant 8 préamplis micros en un, avec sorties lignes analogiques mais également avec un convertisseur intégré pour sortir en numérique si besoin, sur câble ADAT.

output-onlinepngtools (7)_edited_edited.

Un signal numérique passe à travers un câble adapté. Les câbles numériques ont plusieurs avantages, dont celui de pouvoir transporte plusieurs canaux, c’est à dire plusieurs signaux en un seul câble, réduisant l’encombrement et les coûts. En effet, quand un câble XLR ne peut transporter qu’un seul canal analogique, c’est à dire qu’un seul son, un câble ADAT peut par exemple lui transporter jusqu’à 8 canaux simultanément. Nous allons voir ici les principaux types de câbles numériques.

ADAT

Câble optique, jusqu'à 8 canaux transportables.

Nombre de canaux selon fréquence d'échantillonnage ;

44.1khz/48khz ; 8 canaux

88,2khz/96khz ; 4 canaux

176,4khz/192khz ; 2 canaux

output-onlinepngtools (8).png

aes/EBU

XLR, deux canaux

output-onlinepngtools (1).png

madi

Câble optique, jusqu'à 64 canaux

Nombre de canaux selon fréquence d'échantillonnage (voir plus bas) ;

44.1khz/48khz ; 64 canaux

88,2khz/96khz ; 32 canaux

176,4khz/192khz ; 16 canaux

output-onlinepngtools (9).png

USB / FireWire / Thunderbolt

Même si ce n'est pas à proprement parler un signal audio numérique, l'audio numérique est régulièrement transporté du convertisseur à l'ordinateur via un câble USB ; C'est ce qui se passe sur votre carte son favorite. Il l'était également avant par du FireWire, délaissé depuis longtemps, ou encore actuellement du Thunderbolt, qui est en train d'être abandonné pour l'USB C.

output-onlinepngtools (12).png

s/pdif

Coaxial ou optique, deux canaux

output-onlinepngtools (10).png

mais pourquoi le nombre de canaux transportables change-t-il selon la frequence ?

On parle ici de fréquence d'échantillonage.

La fréquence d'échantillonnage est une caractéristique clé des convertisseurs analogique-numérique (AN) et numérique-analogique (NA). Cette fréquence est réglable et modifiable.

Elle fait référence au nombre d'échantillons (samples) , c'est à dire de mesures, de l'amplitude d'un signal audio qui sont pris par seconde pour convertir le signal  analogique en numérique.

En d'autres termes, la fréquence d'échantillonnage détermine à quelle fréquence le convertisseur AD prend des instantanés de la tension (amplitude) d'un signal audio continu et à quelle fréquence le convertisseur DA reconstruit ce signal à partir des échantillons numériques. Plus la fréquence d'échantillonnage est élevée, plus le signal audio est précisément reproduit.

output-onlinepngtools (14)_edited.png

Une fréquence d'échantillonnage de 44.1khz signifie que le convertisseur prend 44100 mesures par secondes du signal analogique pour construire son signal numérique. C'est ainsi qu'il transforme une tension continue en signal "binaire".

On comprend donc pourquoi un câble donné peut transporter deux fois moins de canaux si la fréquence est deux fois supérieure ; Il aura deux fois plus de données à transporter.

Par exemple :

Avec 4 canaux échantillonnés à 44 100 khz (c'est à dire mesuré 44 100 fois par seconde), il aura 4x44100 données par secondes à transporter soit 1 764 000 données par secondes. C'est son maximum. A une fréquence d'échantillonnage de 88 200khz, on sera à 4 x 88 200, soit 3 528 000 .. beaucoup trop de données à transporter ; Il ne transportera alors que deux canaux, pour un total de 88 200 x 2, soit 1 764 000 donnés.. C'est à dire autant que 4 canaux à 44.1khz !

La fréquence d'échantillonnage, c'est comme filmer en 30 ou 60 images par secondes.. Plus on en a, mieux c'est ! En dessous de 25images par secondes, on commence à voir les images en saccadées. En dessous de 44.1khz, le son perd radicalement en qualité. C'est pourquoi le format CD (qui est un format numérique) est en 44.1khz.

A21 cable TS TRS
Def RACK
Niveaux
Niveaux caractéristiques
Rack definition
A.2.2. Signal numérique
DALL·E 2024-01-18 19.04.29 - Create a pencil-on-paper style illustration for a music cours

BPM, mesurE & temps

La connaissance des bases telles que les signatures rythmiques et les gammes est cruciale en studio. Ces éléments forment le squelette de la musique, ce qui est votre métier, avant tout autre considération technique propres à nous autres geekos de studio. Une compréhension solide de ces concepts permet à de mieux saisir l'intention artistique, d'effectuer des ajustements précis lors de l'enregistrement et du mixage, et de communiquer efficacement avec les musiciens. Cela conduit à des productions de haute qualité qui respectent fidèlement la vision de l'artiste.

Rythme et tempo

Le BPM (Beats Per Minute, ou battements par minute)

C'est une mesure du tempo de la musique. Il indique combien de battements se répète en une minute, fournissant ainsi une indication de la vitesse de la musique. Une valeur élevée de BPM signifie que la musique est rapide, tandis qu'une valeur faible indique un rythme plus lent. Vous réglez dans votre DAW (Digital audio workstation, c'est à dire le logiciel que vous utilisez) le BPM du morceau. Les delays et effets se synchroniseront alors avec le rythme pour être synchro avec le morceau. De plus, vous pourrez déplacer à la souris des parties du morceau, comme les voix du refrain, plus tôt ou plus tard dans le morceau ; Celles ci seront toujours correctement dans les temps, sans effort, car elles s'aligreront sur le tempo. Si vous ne l'avez pas rentré, faudra faire à l'oreille, et tout le groupe s'y mettra pour dire que c'est "un chouilla en avance" "mmmh non un chouilla plus tard" "mmmh t'as une feuille steuplait ?"

La mesure

C'est une unité de temps dans la musique qui regroupe un nombre fixe de battements, divisée par des barres de mesure dans la partition. Chaque mesure contient généralement un nombre défini de temps, qui représente la pulsation régulière de la musique.

La signature rythmique

Les signatures rythmiques telles que 4/4 et 3/4 définissent la structure rythmique dans la musique. Dans une signature 4/4 (la plus utilisé), quatre battements par mesure sont indiqués par des noires. C'est courant en musique populaire. Contrastant, le 3/4, avec trois battements par mesure, est typique des valses. Le premier chiffre de la signature indique le nombre de battements par mesure, tandis que le second chiffre représente la valeur de ces battements. Par exemple, en 6/8, il y a six battements par mesure, chaque battement étant une croche. En 2/4, deux battements par mesure sont indiqués, chacun étant une noire. La signature 7/8, moins commune, implique sept battements par mesure, généralement divisés en motifs rythmiques complexes. Enfin, le 12/8 est souvent utilisé dans le blues, avec douze battements par mesure, chacun étant une croche, donnant un rythme swing. Comprendre ces signatures aide à interpréter correctement la structure rythmique d'une pièce. Cette signature est réglable dans votre DAW à côté du BPM.

La subdivision d'un temps

C'est la division de chaque temps en parties plus petites. Cela permet d'ajouter de la complexité rythmique à la musique. Par exemple, un temps peut être divisé en deux, trois, quatre ou plus de parties égales, ce qui permet de créer des rythmes plus variés et complexes..

Les temps forts et les contretemps jouent également un rôle crucial dans la structure rythmique. Les temps forts sont les battements principaux d'une mesure, généralement les premiers battements, qui sont plus accentués. Dans une mesure à 4/4, les temps forts sont souvent les premier et troisième battements. Le contretemps fait référence aux battements qui se produisent entre les temps forts, souvent utilisés pour ajouter de la syncopation et de l'énergie à la musique. Par exemple, dans une mesure à 4/4, les deuxième et quatrième battements sont généralement des contretemps.

Notes & gamme

Les Notes: La base

Les notes sont les fondations de toute composition musicale. Chaque note représente une fréquence particulière. En studio, la connaissance des notes est essentielle pour l'accordage des instruments, l'égalisation, et pour équilibrer les fréquences lors du mixage. Chaque note est séparée de sa voisine par un semi ton ; Le Ré est un semi-ton plus haut que le do#, un plus bas que le re#. Un ton est la somme de semi ton. Le dièse indique que la note donnée est un semi ton plus haut que sa note de base. Le bémol indique l'inverse ; Qu'il est un semi ton plus bas. Ainsi, un do# et un ré bémol sont la même note.

La notation anglaise est C D E F G A B au lieu de do ré mi fa sol la si

Gamme

Une gamme en musique est une suite ordonnée de notes suivant un schéma prédéfini de tons et demi-tons, qui crée une structure harmonique spécifique. Par exemple, la gamme majeure est caractérisée par l'ordre de tons et demi-tons suivant : ton, ton, demi-ton, ton, ton, ton, demi-ton. Pour la gamme de do majeur, cela correspond aux notes : do, ré, mi, fa, sol, la, si, do. Chaque gamme crée une ambiance et une couleur sonore différentes, influençant la sensation et l'émotion transmises par la musique. Les gammes sont fondamentales dans la composition et l'interprétation musicale, car elles déterminent les notes qui seront utilisées et celles qui seront évitées, formant ainsi la base mélodique et harmonique de toute pièce musicale.

Les Octaves:​ Élargir les Possibilités

Une octave est l'intervalle entre une note et une autre note ayant le double (ou la moitié) de sa fréquence. Les octaves permettent d'explorer la même note à différents niveaux de hauteur, ajoutant de la profondeur et de la variété à la musique.

Fausse Note: Nuances Cruciales

 Une "fausse note" peut se référer soit à une note jouée hors de la gamme prévue, soit à une note jouée de manière incorrecte (comme un doigté imprécis sur un violon, légèrement décalé).

L'Autotune: L'autotune est en réalité le nom d'un algorithme développé par Antares, qui permet de corriger automatiquement les notes. Ca tune (accorder en anglais) automatiquement. Le plugin detecte la note que l'interprète essaye de chanter, et remonte et redescend la hauteur de celle ci pour qu'elle soit parfaitement juste. Pour faire correctement son travail, l'outil a besoin d'être informé de la gamme du morceau. Un autotune mal réglé c'est l'enfer ; L'autotune corrigera des notes vaguement fausses en notes.. carrément hors gamme.

output-onlinepngtools (15).png

Mieux les artistes jouent juste et dans les temps, mieux le morceau sera. Vous pouvez cependant de nos jours corriger numériquement toutes les notes avec Vari audio, Melodyne ou Autotune, et quantifier, c'est à dire remettre dans les temps, tout évenement audio. Spoiler alert ; C'est relou à faire et pas naturel. Enregistrez des prises correctes, jetez une canette sur la personne qui vous dit "Bah, on verra ça au mix non ?"

bottom of page