Inspelningen avgör 80 % av din träffsäkerhet
Inget verktyg kan transkribera det mikrofonen aldrig fångade. Det som påverkar transkriptets kvalitet allra mest är inte programmet – det är ljudet som går in i det. Vid en intervju på plats: placera en inspelare nära varje talare, bort från hårda ytor som ekar och långt från ventilation, kylskåp och caféets espressomaskin. En mygga för en hundralapp fäst på kavajslaget slår en telefon på andra sidan bordet varje gång.
Vid distansintervjuer: spela in varje part på sin egen kanal om plattformen tillåter det. Zooms "spela in en separat ljudfil för varje deltagare" och Riversides lokala inspelning per spår ger dig isolerade talare, vilket gör diariseringen (talaretiketterna) dramatiskt renare – verktyget behöver inte gissa vem som pratar när två personer pratar i mun på varandra. Får du bara en enda mixad fil går det också bra; räkna då bara med att rätta fler talarbyten för hand.
Innan du börjar: säg varje persons namn och datumet rakt in i inspelningen. Det låter pedantiskt, men det tidsstämplar samtycket, fäster vem 'Talare 1' är och besparar dig att lyssna om för att lista ut vilken röst som är källan och vilken som är du.
Varför en första AI-genomgång slår att skriva själv – och var den inte gör det
Att skriva ett transkript för hand tar ungefär fyra till sex gånger ljudets längd: en timmes intervju är en halv dag vid tangentbordet. En första AI-genomgång gör den timmen till några minuters bearbetning plus en fokuserad finputsning, och dagens tal-till-text är tillräckligt exakt för att du redigerar snarare än transkriberar om. För de flesta intervjuer ändrar du en handfull ord per minut – du bygger inte om meningar.
Där AI fortfarande behöver dig: egennamn (namn, företag, ortnamn), fackjargong och förkortningar, snabbt uttalade siffror, och överlappande tal där två personer pratar samtidigt. Det är precis de ställen som betyder mest för ett citat som ska kunna tillskrivas någon – så rätt arbetssätt är att låta maskinen ta huvuddelen och lägga din uppmärksamhet på de 5 % som bär.
Är ett parti verkligen otydligt i ljudet, märk det [ohörbart] med tidsstämpeln i stället för att gissa. En markerad lucka är ärlig; ett självsäkert felaktigt citat är en rättelse som väntar på att hända.
Ordagrant, rensat ordagrant eller läsbart?
Bestäm din stil innan du redigerar, för den påverkar varenda rad. Strikt ordagrant behåller varje 'öh', varje halvfärdig start och varje upprepning – det vill du ha för diskursanalys, juridiska sammanhang eller när hur något sägs är själva poängen. Rensat ordagrant tar bort utfyllnad och stamningar men behåller talarens faktiska ord och grammatik – standard för det mesta inom journalistik och forskning. Intelligent (läsbart) ordagrant snyggar lätt till grammatiken så att ett citat flyter smidigt i tryck utan att meningen ändras.
Välj en stil och tillämpa den konsekvent. Snabbaste vägen är att utgå från ett rent utkast med talaretiketter och sedan, för de citat du faktiskt ska publicera, stramt putsa till din valda stil. Polera inte hela transkriptet till publiceringsnivå – det mesta kommer du aldrig att citera. Lägg kraften på raderna som ska in i texten.
Vad du än väljer: rätta aldrig tyst en faktamiss som en källa gör. Säger källan fel årtal behåller citatet det felaktiga årtalet; det hanterar du med ett [sic] eller en omskrivning, inte en tyst redigering.
Behåll tidsstämplarna – de är ditt spårningsunderlag
Ett transkript med tidsstämplar är skillnaden mellan 'jag tror hon sa så' och 'hon sa det 14:32.' För varje citat du publicerar vill du kunna hoppa rakt tillbaka till ljudet och höra det i sitt sammanhang innan det går ut. Tidsstämplar på ord- eller meningsnivå låter dig stickprovskolla på sekunder i stället för att spola fram och tillbaka.
Tidsstämplar gör också en lång intervju navigerbar. Använd dem för att bygga ett snabbt register över ögonblicken som spelar roll – svaret där berättelsen vänder, siffran du ska inleda med, repliken du ska lyfta till rubriken – så att du när du skriver hoppar till de punkterna i stället för att läsa om 9 000 ord.
Samarbetar du eller faktagranskar du, dela transkriptet med tidsstämplarna intakta. En faktagranskare som kan höra den exakta repliken arbetar långt snabbare och litar mer på citatet än en som bara stirrar på text.
Hantera samtycke, känsliga källor och lagring som ett proffs
Inhämta samtycke till inspelning på band, helst fångat i själva ljudet. Inspelningsreglerna varierar – många amerikanska delstater kräver bara en parts samtycke, flera kräver att alla parter går med på det, och andra länder skiljer sig – så vid minsta tvivel: fråga och få ett tydligt ja innan det viktiga börjar.
För känsligt eller off the record-material: tänk på var ljudet och transkriptet hamnar. Använd ett verktyg som inte tränar AI på dina filer, låter dig radera inspelningar efter bearbetning och inte tyst behåller dem. Pepys tränar aldrig på ditt ljud eller din text, och du kan radera filer automatiskt efter att de transkriberats.
Anonymisera i själva transkriptet när en källa behöver skydd: byt ut namn mot en rollbeteckning när du rensar utkastet, och förvara den oredigerade originalversionen någonstans med åtkomstkontroll. Mejla inte runt råtranskriptet om ett namn kan utsätta någon för risk.