De opname bepaalt 80% van je nauwkeurigheid
Geen enkele tool kan transcriberen wat de microfoon nooit heeft opgevangen. De grootste hefboom op de kwaliteit van je transcript is niet de software – het is de audio die erin gaat. Bij een interview ter plaatse zet je een recorder dicht bij elke spreker, weg van harde oppervlakken die galmen, en uit de buurt van ventilatieroosters, koelkasten en de espressomachine in het café. Een dasspeldmicrofoon van 30 euro op een revers wint het elke keer van een telefoon aan de overkant van de tafel.
Bij interviews op afstand neem je elke kant op een eigen kanaal op als je platform dat toelaat. Zooms functie "een aparte audiobestand per deelnemer opnemen" en Riversides lokale opname per spoor geven je allebei geïsoleerde sprekers, wat de diarisatie (het labelen van sprekers) flink schoner maakt – de tool hoeft niet te raden wie er praat als twee mensen door elkaar heen praten. Lukt alleen één gemixt bestand, dan is dat prima; reken er dan alleen op dat je meer sprekerwissels met de hand corrigeert.
Voor je begint, spreek je de naam van elke persoon en de datum in op de opname. Het klinkt pietluttig, maar het zet een tijdstempel op je toestemming, verankert wie 'Spreker 1' is, en bespaart je het terugluisteren om te achterhalen welke stem de bron is en welke jij bent.
Waarom een AI-eerste ronde het typen verslaat – en waar niet
Een transcript met de hand uittypen kost ruwweg vier tot zes keer de lengte van de audio: een interview van een uur is een halve dag achter het toetsenbord. Een AI-eerste ronde maakt van dat uur een paar minuten verwerking plus een gerichte opschoning, en moderne spraakherkenning is nauwkeurig genoeg dat je redigeert in plaats van opnieuw transcribeert. Bij de meeste interviews verander je een handvol woorden per minuut, geen hele zinnen.
Waar AI je nog nodig heeft: eigennamen (personen, bedrijven, plaatsnamen), vakjargon en afkortingen, snel uitgesproken getallen, en kruisgesprekken waarin twee mensen tegelijk praten. Dat zijn precies de plekken die het zwaarst wegen voor een toewijsbaar citaat – dus de juiste werkwijze is de machine het gros laten doen en je aandacht besteden aan de dragende 5%.
Is een passage echt onduidelijk in de audio, markeer die dan als [onverstaanbaar] met de tijdstempel in plaats van te gokken. Een gemarkeerd gat is eerlijk; een zelfverzekerd fout citaat is een rectificatie die ligt te wachten om te gebeuren.
Letterlijk, opgeschoond letterlijk of leesbaar?
Bepaal je stijl voor je gaat redigeren, want hij verandert elke regel. Strikt letterlijk houdt elke 'eh', valse start en herhaling – dat wil je voor discoursanalyse, een juridische context, of als hoe iets gezegd werd het punt is. Opgeschoond letterlijk schrapt stopwoorden en gestamel maar houdt de daadwerkelijke woorden en grammatica van de spreker – de standaard voor de meeste journalistiek en onderzoek. Leesbaar letterlijk poetst de grammatica licht bij zodat een citaat soepel leest in print zonder de betekenis te veranderen.
Kies er één en pas die consequent toe. De snelste route is beginnen met een schoon concept met sprekerlabels en dan, voor de citaten die je echt publiceert, aanscherpen naar je gekozen stijl. Polijst niet het hele transcript tot publicatiekwaliteit – het meeste citeer je toch nooit. Steek de moeite in de regels die in het stuk belanden.
Wat je ook kiest, corrigeer nooit stilletjes een feitelijke misser van een bron. Zegt iemand het verkeerde jaar, dan houdt het citaat het verkeerde jaar; dat los je op met een [sic] of een parafrase, niet met een stille bewerking.
Behoud tijdstempels – ze zijn je controlespoor
Een transcript met tijdstempels is het verschil tussen 'ik denk dat ze dat zei' en 'ze zei het op 14:32'. Bij elk citaat dat je publiceert wil je rechtstreeks terug naar de audio springen en het in context horen voor het naar buiten gaat. Tijdstempels op woord- of zinsniveau laten je in seconden steekproeven nemen in plaats van eindeloos te scrubben.
Tijdstempels maken een lang interview ook navigeerbaar. Gebruik ze om snel een index aan te leggen van de momenten die ertoe doen – het antwoord waar het verhaal kantelt, het getal waarmee je opent, de regel die je voor de kop trekt – zodat je tijdens het schrijven naar die punten springt in plaats van 9.000 woorden te herlezen.
Werk je samen of laat je feiten controleren, deel het transcript dan met de tijdstempels intact. Een factchecker die de exacte regel kan horen werkt veel sneller en vertrouwt het citaat meer dan iemand die alleen naar tekst staart.
Ga met toestemming, gevoelige bronnen en opslag om als een prof
Vraag toestemming voor de opname op de band, idealiter vastgelegd in de audio zelf. Opnameregels verschillen – in veel landen volstaat de toestemming van één partij, elders moet iedereen instemmen, en weer andere landen regelen het anders – dus vraag het bij twijfel en haal een duidelijk ja voor de inhoud begint.
Bij gevoelig of vertrouwelijk materiaal let je op waar de audio en het transcript staan. Gebruik een tool die je bestanden niet gebruikt om AI te trainen, die je opnames na de verwerking laat verwijderen en ze niet stiekem bewaart. Pepys traint nooit op je audio of tekst, en je kunt bestanden automatisch laten verwijderen nadat ze getranscribeerd zijn.
Anonimiseer in het transcript zelf als een bron bescherming nodig heeft: vervang namen door een rolaanduiding terwijl je het concept opschoont, en bewaar de niet-geredigeerde brontekst op een plek met toegangsbeheer. Mail het ruwe transcript niet rond als een naam iemand in gevaar kan brengen.