Guide

Comment transcrire un entretien

Un guide concret pour les journalistes, les chercheurs et tous ceux qui ont besoin de citations exactes et attribuables – pas d'un mur d'approximations.

La réponse en bref

Pour transcrire un entretien, partez d'un enregistrement net, puis déposez-le dans un outil de transcription pour obtenir en quelques minutes un brouillon horodaté avec les locuteurs identifiés. Relisez ce brouillon à l'écoute, corrigez les noms, le jargon et les citations que vous allez réellement publier, et gardez les horodatages pour pouvoir revérifier chaque ligne. Confier le premier jet à l'IA et le nettoyage à la main est bien plus rapide que de tout taper soi-même – et plus fiable là où ça compte.

L'enregistrement décide 80 % de votre précision

Aucun outil ne peut transcrire ce que le micro n'a jamais capté. Le plus grand levier sur la qualité d'une transcription, ce n'est pas le logiciel – c'est le son qui y entre. Pour un entretien en présentiel, placez un enregistreur près de chaque interlocuteur, loin des surfaces dures qui résonnent, et à l'écart des bouches d'aération, des réfrigérateurs et de la machine à expresso du café. Un micro-cravate à 30 € accroché au revers bat à tous les coups un téléphone posé à l'autre bout de la table.

Pour les entretiens à distance, enregistrez chaque participant sur sa propre piste si votre plateforme le permet. L'option « enregistrer un fichier audio distinct par participant » de Zoom et l'enregistrement local par piste de Riverside isolent chacun des locuteurs, ce qui rend la diarisation (l'identification des locuteurs) nettement plus propre – l'outil ne devine plus qui parle quand deux personnes se chevauchent. Si vous n'avez qu'un seul fichier mixé, ce n'est pas grave ; attendez-vous simplement à corriger davantage de tours de parole à la main.

Avant de commencer, prononcez le nom de chaque personne et la date dans l'enregistrement. Ça paraît tatillon, mais ça horodate le consentement, ancre l'identité de « Locuteur 1 » et vous évite de réécouter pour deviner quelle voix est la source et laquelle est la vôtre.

Pourquoi un premier jet par l'IA bat la frappe – et où il échoue

Taper une transcription à la main prend environ quatre à six fois la durée de l'audio : un entretien d'une heure, c'est une demi-journée au clavier. Un premier jet par l'IA transforme cette heure en quelques minutes de traitement suivies d'un nettoyage ciblé, et la reconnaissance vocale actuelle est assez précise pour que vous corrigiez plutôt que vous retranscriviez. Pour la plupart des entretiens, vous changerez une poignée de mots par minute, pas des phrases entières.

Là où l'IA a encore besoin de vous : les noms propres (personnes, entreprises, lieux), le jargon et les acronymes d'un domaine, les chiffres dits trop vite, et les passages où deux personnes parlent en même temps. Ce sont précisément les endroits qui comptent le plus pour une citation attribuable – la bonne méthode consiste donc à laisser la machine traiter le gros du volume et à concentrer votre attention sur les 5 % qui portent tout.

Si un passage est vraiment inaudible dans l'enregistrement, notez [inaudible] avec l'horodatage plutôt que de deviner. Un blanc signalé est honnête ; une citation fausse énoncée avec aplomb est un rectificatif en puissance.

Verbatim strict, verbatim nettoyé ou lisible ?

Choisissez votre style avant d'éditer, car il change chaque ligne. Le verbatim strict conserve chaque « euh », chaque faux départ et chaque répétition – c'est ce qu'il vous faut pour l'analyse du discours, un contexte juridique, ou quand la manière de dire est le sujet. Le verbatim nettoyé supprime les tics de langage et les bafouillages mais garde les mots et la grammaire exacts du locuteur – le réglage par défaut pour la plupart du journalisme et de la recherche. Le verbatim intelligent (lisible) corrige légèrement la grammaire pour qu'une citation se lise sans accroc à l'imprimé, sans en changer le sens.

Choisissez-en un et appliquez-le sans dévier. Le chemin le plus rapide consiste à partir d'un brouillon net avec locuteurs identifiés, puis, pour les citations que vous allez vraiment publier, à les resserrer dans le style choisi. Ne peaufinez pas toute la transcription au niveau publication – la majeure partie ne sera jamais citée. Concentrez l'effort sur les lignes qui iront dans l'article.

Quel que soit votre choix, ne corrigez jamais en douce une erreur de fait commise par une source. Si elle se trompe d'année, la citation garde la mauvaise année ; vous gérez ça avec un [sic] ou une reformulation, pas par une retouche discrète.

Gardez les horodatages – c'est votre piste de vérification

Une transcription horodatée, c'est la différence entre « je crois qu'elle a dit ça » et « elle l'a dit à 14:32 ». Pour chaque citation que vous publiez, vous voulez pouvoir revenir directement à l'audio et l'entendre dans son contexte avant qu'elle ne sorte. Des horodatages au mot ou à la phrase vous permettent de vérifier en quelques secondes au lieu de fouiller l'enregistrement.

Les horodatages rendent aussi navigable un entretien fleuve. Servez-vous-en pour bâtir un index rapide des moments qui comptent – la réponse où l'histoire bascule, le chiffre que vous mettrez en avant, la phrase que vous tirerez pour le titre – afin qu'au moment d'écrire vous sautiez à ces points au lieu de relire 9 000 mots.

Si vous collaborez ou faites du fact-checking, partagez la transcription en conservant les horodatages. Un vérificateur qui peut entendre la ligne exacte travaille bien plus vite et fait davantage confiance à la citation que celui qui n'a que du texte devant lui.

Consentement, sources sensibles et stockage : faites-le en pro

Obtenez le consentement à l'enregistrement de façon explicite, idéalement capté dans l'audio lui-même. Les lois sur l'enregistrement varient – de nombreux États américains pratiquent le consentement d'une seule partie, plusieurs exigent l'accord de tous, et c'est différent ailleurs – alors dans le doute, demandez et obtenez un oui clair avant d'entrer dans le vif.

Pour un contenu sensible ou off, faites attention à l'endroit où vivent l'audio et la transcription. Utilisez un outil qui n'entraîne pas son IA sur vos fichiers, qui vous laisse supprimer les enregistrements après traitement et qui ne les conserve pas en douce. Pepys n'entraîne jamais son IA sur votre audio ni vos textes, et vous pouvez supprimer automatiquement les fichiers une fois transcrits.

Anonymisez directement dans la transcription quand une source a besoin d'être protégée : remplacez les noms par une fonction au fil du nettoyage du brouillon, et gardez la version originale non caviardée dans un espace à accès contrôlé. N'envoyez pas la transcription brute par e-mail à tout-va si un nom peut mettre quelqu'un en danger.

Les étapes, dans l'ordre

01
Enregistrez un son net et séparé
Approchez un micro de chaque interlocuteur, tuez le bruit de fond, et enregistrez par piste pour les appels à distance afin de garder les locuteurs séparables. Annoncez les noms et la date au début.
02
Déposez-le pour un premier jet par l'IA
Glissez le fichier (ou collez un lien) dans Pepys et obtenez en quelques minutes un brouillon horodaté avec les locuteurs identifiés, au lieu d'une demi-journée de frappe.
03
Relisez le brouillon à l'écoute
Parcourez les endroits où l'IA peine – noms, jargon, chiffres, voix qui se chevauchent – et corrigez-les. Notez tout passage flou [inaudible] avec son horodatage.
04
Nettoyez les citations à publier
Appliquez votre style de verbatim (strict, nettoyé ou lisible) aux lignes qui comptent, en gardant les horodatages pour que chaque citation reste revérifiable.
05
Exportez et archivez
Exportez en DOCX ou TXT pour la rédaction, ou en SRT/VTT pour les sous-titres. Stockez la version originale en sécurité et supprimez l'audio source s'il est sensible.

Les conseils de ceux qui le font souvent

Enregistrez un test de 10 secondes avant le vrai entretien et réécoutez-le – repérer un micro mort ou un ventilateur qui bourdonne maintenant vous évite un entretien inexploitable plus tard.
L'enregistrement par locuteur (Zoom, Riverside, micros-cravate séparés) est de loin le plus gros gain sur l'identification des locuteurs – bien plus que n'importe quel réglage de l'outil de transcription.
Ne nettoyez pas toute la transcription. Ne peaufinez que les passages que vous allez citer ; le reste doit seulement être consultable.
Construisez un index de citations à partir des horodatages au fil de la lecture – sautez à ces moments pendant l'écriture plutôt que de relire toute la transcription.
Gardez une version originale non caviardée dans un endroit sûr et faites l'anonymisation sur une copie, pour ne jamais perdre l'attribution d'origine si vous devez vérifier une citation.

Comment transcrire un entretien – vos questions, nos réponses

Quel est le moyen le plus rapide de transcrire un entretien ?

Obtenez un premier jet par l'IA, puis nettoyez à la main. Déposez votre enregistrement (ou collez un lien) pour avoir en quelques minutes un brouillon horodaté avec les locuteurs identifiés, puis ne corrigez que les noms, le jargon et les citations que vous allez publier. C'est bien plus rapide que tout taper, ce qui prend quatre à six fois la durée de l'audio.

Comment obtenir des locuteurs bien identifiés ?

Enregistrez chaque interlocuteur sur une piste séparée quand vous le pouvez – l'audio par participant de Zoom ou des micros-cravate distincts – pour que l'outil ne devine pas pendant les chevauchements. Avec un seul fichier mixé, vous aurez quand même les locuteurs identifiés, mais attendez-vous à corriger plus de tours de parole à la main autour des voix qui se superposent.

Faut-il transcrire mot à mot ou nettoyer ?

Ça dépend de l'usage. Le verbatim strict (chaque « euh » et faux départ) convient à l'analyse du discours ou juridique ; le verbatim nettoyé (tics retirés, mots intacts) est la norme du journalisme ; le verbatim lisible corrige légèrement la grammaire pour l'imprimé. Choisissez un style et appliquez-le sans dévier aux citations que vous allez vraiment utiliser.

Est-il légal d'enregistrer et de transcrire un entretien ?

Obtenez le consentement, idéalement capté dans l'enregistrement. Les lois varient – certains endroits admettent le consentement d'une seule partie, d'autres exigent l'accord de tous – alors dans le doute, demandez un oui clair avant d'entrer dans le vif. Nous ne donnons pas de conseil juridique, mais consentir explicitement et de façon enregistrée reste l'option sûre.

Mon audio d'entretien sera-t-il conservé ou utilisé pour entraîner l'IA ?

Pas avec Pepys. Nous n'entraînons jamais d'IA sur votre audio ni vos transcriptions, et vous pouvez supprimer automatiquement les fichiers après traitement – ce qui compte pour les sources sensibles et le contenu off.

Continuer la lecture

Comment transcrire un podcast

Ne nous croyez pas sur parole.

Demandez à ChatGPT, Claude ou Perplexity ce qu'est Pepys et à qui ça s'adresse. Un clic, et votre IA préférée fait le travail à votre place.

Demander à ChatGPT Demander à Claude Demander à Perplexity

Comment transcrire un entretien – gratuit pour commencer

Payez à l'usage – les crédits n'expirent jamais, rien à résilier. Ou commencez gratuitement avec 60 minutes, sans carte.

Commencer gratuitement – 60 minutes

L'enregistrement décide 80 % de votre précision

Pourquoi un premier jet par l'IA bat la frappe – et où il échoue

Verbatim strict, verbatim nettoyé ou lisible ?

Gardez les horodatages – c'est votre piste de vérification

Consentement, sources sensibles et stockage : faites-le en pro

Les étapes, dans l'ordre

Enregistrez un son net et séparé

Déposez-le pour un premier jet par l'IA

Relisez le brouillon à l'écoute

Nettoyez les citations à publier

Exportez et archivez

Les conseils de ceux qui le font souvent

Comment transcrire un entretien – vos questions, nos réponses

Ne nous croyez pas sur parole.

Comment transcrire un entretien – gratuit pour commencer