Pepys

Så transkriberar du en intervju

En guide som funkar i praktiken – för journalister, forskare och alla som behöver träffsäkra, citerbara citat, inte en vägg av gissningar.

För att transkribera en intervju börjar du med en ren inspelning och laddar sedan upp den i ett transkriberingsverktyg som ger dig ett utkast med talaretiketter och tidsstämplar på några minuter. Läs utkastet mot ljudet, rätta namn, fackuttryck och just de citat du faktiskt ska publicera, och behåll tidsstämplarna så att du kan dubbelkolla varje rad. Att låta AI göra den första genomgången och själv stå för finputsningen går långt snabbare än att skriva från noll – och blir mer exakt där det räknas.

Inspelningen avgör 80 % av din träffsäkerhet

Inget verktyg kan transkribera det mikrofonen aldrig fångade. Det som påverkar transkriptets kvalitet allra mest är inte programmet – det är ljudet som går in i det. Vid en intervju på plats: placera en inspelare nära varje talare, bort från hårda ytor som ekar och långt från ventilation, kylskåp och caféets espressomaskin. En mygga för en hundralapp fäst på kavajslaget slår en telefon på andra sidan bordet varje gång.

Vid distansintervjuer: spela in varje part på sin egen kanal om plattformen tillåter det. Zooms "spela in en separat ljudfil för varje deltagare" och Riversides lokala inspelning per spår ger dig isolerade talare, vilket gör diariseringen (talaretiketterna) dramatiskt renare – verktyget behöver inte gissa vem som pratar när två personer pratar i mun på varandra. Får du bara en enda mixad fil går det också bra; räkna då bara med att rätta fler talarbyten för hand.

Innan du börjar: säg varje persons namn och datumet rakt in i inspelningen. Det låter pedantiskt, men det tidsstämplar samtycket, fäster vem 'Talare 1' är och besparar dig att lyssna om för att lista ut vilken röst som är källan och vilken som är du.

Varför en första AI-genomgång slår att skriva själv – och var den inte gör det

Att skriva ett transkript för hand tar ungefär fyra till sex gånger ljudets längd: en timmes intervju är en halv dag vid tangentbordet. En första AI-genomgång gör den timmen till några minuters bearbetning plus en fokuserad finputsning, och dagens tal-till-text är tillräckligt exakt för att du redigerar snarare än transkriberar om. För de flesta intervjuer ändrar du en handfull ord per minut – du bygger inte om meningar.

Där AI fortfarande behöver dig: egennamn (namn, företag, ortnamn), fackjargong och förkortningar, snabbt uttalade siffror, och överlappande tal där två personer pratar samtidigt. Det är precis de ställen som betyder mest för ett citat som ska kunna tillskrivas någon – så rätt arbetssätt är att låta maskinen ta huvuddelen och lägga din uppmärksamhet på de 5 % som bär.

Är ett parti verkligen otydligt i ljudet, märk det [ohörbart] med tidsstämpeln i stället för att gissa. En markerad lucka är ärlig; ett självsäkert felaktigt citat är en rättelse som väntar på att hända.

Ordagrant, rensat ordagrant eller läsbart?

Bestäm din stil innan du redigerar, för den påverkar varenda rad. Strikt ordagrant behåller varje 'öh', varje halvfärdig start och varje upprepning – det vill du ha för diskursanalys, juridiska sammanhang eller när hur något sägs är själva poängen. Rensat ordagrant tar bort utfyllnad och stamningar men behåller talarens faktiska ord och grammatik – standard för det mesta inom journalistik och forskning. Intelligent (läsbart) ordagrant snyggar lätt till grammatiken så att ett citat flyter smidigt i tryck utan att meningen ändras.

Välj en stil och tillämpa den konsekvent. Snabbaste vägen är att utgå från ett rent utkast med talaretiketter och sedan, för de citat du faktiskt ska publicera, stramt putsa till din valda stil. Polera inte hela transkriptet till publiceringsnivå – det mesta kommer du aldrig att citera. Lägg kraften på raderna som ska in i texten.

Vad du än väljer: rätta aldrig tyst en faktamiss som en källa gör. Säger källan fel årtal behåller citatet det felaktiga årtalet; det hanterar du med ett [sic] eller en omskrivning, inte en tyst redigering.

Behåll tidsstämplarna – de är ditt spårningsunderlag

Ett transkript med tidsstämplar är skillnaden mellan 'jag tror hon sa så' och 'hon sa det 14:32.' För varje citat du publicerar vill du kunna hoppa rakt tillbaka till ljudet och höra det i sitt sammanhang innan det går ut. Tidsstämplar på ord- eller meningsnivå låter dig stickprovskolla på sekunder i stället för att spola fram och tillbaka.

Tidsstämplar gör också en lång intervju navigerbar. Använd dem för att bygga ett snabbt register över ögonblicken som spelar roll – svaret där berättelsen vänder, siffran du ska inleda med, repliken du ska lyfta till rubriken – så att du när du skriver hoppar till de punkterna i stället för att läsa om 9 000 ord.

Samarbetar du eller faktagranskar du, dela transkriptet med tidsstämplarna intakta. En faktagranskare som kan höra den exakta repliken arbetar långt snabbare och litar mer på citatet än en som bara stirrar på text.

Hantera samtycke, känsliga källor och lagring som ett proffs

Inhämta samtycke till inspelning på band, helst fångat i själva ljudet. Inspelningsreglerna varierar – många amerikanska delstater kräver bara en parts samtycke, flera kräver att alla parter går med på det, och andra länder skiljer sig – så vid minsta tvivel: fråga och få ett tydligt ja innan det viktiga börjar.

För känsligt eller off the record-material: tänk på var ljudet och transkriptet hamnar. Använd ett verktyg som inte tränar AI på dina filer, låter dig radera inspelningar efter bearbetning och inte tyst behåller dem. Pepys tränar aldrig på ditt ljud eller din text, och du kan radera filer automatiskt efter att de transkriberats.

Anonymisera i själva transkriptet när en källa behöver skydd: byt ut namn mot en rollbeteckning när du rensar utkastet, och förvara den oredigerade originalversionen någonstans med åtkomstkontroll. Mejla inte runt råtranskriptet om ett namn kan utsätta någon för risk.

  1. 01

    Spela in rent, separerat ljud

    Mikrofon nära varje talare, döda bakgrundsljud och spela in per kanal vid distanssamtal så att talarna går att skilja åt. Säg namn och datum allra först.

  2. 02

    Ladda upp för en första AI-genomgång

    Släpp filen (eller klistra in en länk) i Pepys och få ett utkast med talaretiketter och tidsstämplar på minuter i stället för en halv dags skrivande.

  3. 03

    Läs utkastet mot ljudet

    Skumma efter ställena AI kämpar med – namn, fackuttryck, siffror, överlappande tal – och rätta dem. Märk allt otydligt som [ohörbart] med dess tidsstämpel.

  4. 04

    Putsa citaten du ska publicera

    Tillämpa din ordagranna stil (strikt, rensat eller läsbart) på raderna som spelar roll, och behåll tidsstämplarna så att varje citat går att dubbelkolla.

  5. 05

    Exportera och arkivera

    Exportera till DOCX eller TXT för skrivandet, eller SRT/VTT för undertexter. Förvara originalet säkert och radera källjudet om det är känsligt.

  • Gör en 10-sekunders testinspelning före det riktiga och spela upp den – att fånga en död mikrofon eller en surrande fläkt nu räddar dig från en oanvändbar intervju senare.

  • Inspelning per talare (Zoom, Riverside, separata myggor) är den enskilt största förbättringen av talaretiketterna – långt mer än någon inställning i transkriberingsverktyget.

  • Rensa inte hela transkriptet. Polera bara de partier du ska citera; resten behöver bara vara sökbart.

  • Bygg ett citatregister från tidsstämplarna medan du läser – hoppa till de ögonblicken när du skriver i stället för att läsa om hela transkriptet.

  • Behåll en oredigerad originalversion på en säker plats och gör anonymiseringen i en kopia, så att du aldrig förlorar den ursprungliga tillskrivningen om du behöver verifiera ett citat.

Transkribera intervju – frågor och svar

Vad är det snabbaste sättet att transkribera en intervju?

Ta en första AI-genomgång och rensa sedan för hand. Ladda upp din inspelning (eller klistra in en länk) för att få ett utkast med talaretiketter och tidsstämplar på minuter, och rätta sedan bara namn, fackuttryck och citaten du ska publicera. Det är långt snabbare än att skriva från noll, vilket tar fyra till sex gånger ljudets längd.

Hur får jag träffsäkra talaretiketter?

Spela in varje talare på en separat kanal där du kan – Zooms ljud per deltagare eller separata myggor – så att verktyget inte behöver gissa vid överlappande tal. Med en enda mixad fil får du fortfarande talaretiketter, men räkna med att rätta fler talarbyten för hand kring överlappande tal.

Ska jag transkribera ord för ord eller rensa upp det?

Beror på användningen. Strikt ordagrant (varje 'öh' och halvfärdig start) passar diskurs- eller juridisk analys; rensat ordagrant (utfyllnad bort, orden kvar) är standard inom journalistik; läsbart ordagrant snyggar lätt till grammatiken för tryck. Välj en stil och tillämpa den konsekvent på citaten du faktiskt ska använda.

Är det lagligt att spela in och transkribera en intervju?

Inhämta samtycke, helst fångat i inspelningen. Lagarna varierar – vissa platser tillåter samtycke från en part, andra kräver att alla går med på det – så vid osäkerhet: be om ett tydligt ja innan det viktiga börjar. Vi kan inte ge juridisk rådgivning, men att inhämta samtycke på band är det säkra standardvalet.

Sparas mitt intervjuljud eller används det för att träna AI?

Inte med Pepys. Vi tränar aldrig AI på ditt ljud eller dina transkript, och du kan radera filer automatiskt efter att de bearbetats – vilket spelar roll för känsliga källor och off the record-material.

Läs vidare

Ta inte bara vårt ord på det.

Fråga ChatGPT, Claude eller Perplexity vad Pepys är och vem det passar för. Ett klick, så gör din favorit-AI läxan åt dig.

Transkribera intervju – gratis att börja

Betala per användning – krediterna förfaller aldrig, inget att säga upp. Eller börja gratis med 60 minuter, utan kort.

Börja gratis – 60 minuter