Opptaket avgjør 80 % av nøyaktigheten din
Ingen verktøy kan transkribere det mikrofonen aldri fanget opp. Det som har størst betydning for kvaliteten på transkripsjonen, er ikke programvaren – det er lyden som går inn i den. Ved et intervju ansikt til ansikt: plasser en opptaker tett på hver taler, vekk fra harde flater som runger, og langt fra ventilasjon, kjøleskap og kafeens espressomaskin. En myggmikrofon til en femtilapp festet på jakkeslaget slår en telefon på den andre siden av bordet hver eneste gang.
Ved fjernintervjuer: ta opp hver part på sin egen kanal hvis plattformen tillater det. Zooms "ta opp en separat lydfil for hver deltaker" og Riversides lokale opptak per spor gir deg isolerte talere, noe som gjør diariseringen (talernavnene) langt renere – verktøyet slipper å gjette på hvem som snakker når to personer snakker i munnen på hverandre. Kan du bare få én samlet, mikset fil, går det også – bare regn med å rette flere talerbytter for hånd.
Før du setter i gang: si navnet på hver person og datoen rett inn i opptaket. Det høres pedantisk ut, men det tidsstempler samtykket, fastslår hvem 'Taler 1' er, og sparer deg for å lytte om igjen for å finne ut hvilken stemme som er kilden og hvilken som er deg.
Hvorfor en første AI-gjennomgang slår å skrive selv – og hvor den ikke gjør det
Å skrive en transkripsjon for hånd tar omtrent fire til seks ganger lengden på lyden: et intervju på en time er en halv dag ved tastaturet. En første AI-gjennomgang gjør den timen om til noen få minutters behandling pluss en fokusert finpuss, og dagens tale-til-tekst er nøyaktig nok til at du redigerer i stedet for å transkribere på nytt. For de fleste intervjuer endrer du en håndfull ord i minuttet – du bygger ikke setninger opp igjen.
Der AI fortsatt trenger deg: egennavn (navn, selskaper, stedsnavn), fagsjargong og forkortelser, tall sagt fort, og overlappende tale der to personer snakker samtidig. Det er nettopp disse stedene som betyr mest for et sitat noen skal kunne tilskrives – så den riktige fremgangsmåten er å la maskinen ta hovedtyngden og bruke oppmerksomheten din på de 5 % som bærer.
Er en passasje virkelig utydelig i lyden, så marker den [uhørbart] med tidsstemplet i stedet for å gjette. Et merket hull er ærlig; et selvsikkert feil sitat er en korrigering som bare venter på å skje.
Ordrett, renset ordrett eller lesbart?
Bestem stilen din før du redigerer, for den påvirker hver eneste linje. Strengt ordrett beholder hvert 'eh', hver halvferdig start og hver gjentakelse – det er det du vil ha til diskursanalyse, juridiske sammenhenger, eller når hvordan noe blir sagt er selve poenget. Renset ordrett fjerner fyllord og stamming, men beholder talerens faktiske ord og grammatikk – standarden for det meste av journalistikk og forskning. Intelligent (lesbar) ordrett retter grammatikken lett opp, så et sitat flyter sømløst på trykk uten å endre betydningen.
Velg én og bruk den konsekvent. Den raskeste veien er å ta utgangspunkt i et rent utkast med talernavn og så, for de sitatene du faktisk skal publisere, stramme opp til den stilen du har valgt. Ikke puss hele transkripsjonen opp til publiseringsnivå – det meste av den kommer du aldri til å sitere. Bruk kreftene på linjene som skal inn i teksten.
Uansett hva du velger: rett aldri stilltiende en faktafeil en kilde gjør. Sier kilden feil årstall, beholder sitatet feil årstall; det håndterer du med en [sic] eller en omskriving, ikke en taus redigering.
Behold tidsstemplene – de er sporet ditt tilbake
En transkripsjon med tidsstempler er forskjellen på 'jeg tror hun sa det' og 'hun sa det kl. 14:32.' For hvert sitat du publiserer, vil du kunne hoppe rett tilbake til lyden og høre det i sin sammenheng før det går ut. Tidsstempler på ord- eller setningsnivå lar deg stikkprøve på sekunder i stedet for å spole frem og tilbake.
Tidsstempler gjør også et langt intervju enkelt å navigere i. Bruk dem til å bygge et raskt register over øyeblikkene som betyr noe – svaret der historien snur, tallet du skal innlede med, replikken du skal trekke frem til tittelen – så du, når du skriver, hopper til de punktene i stedet for å lese 9 000 ord på nytt.
Samarbeider du eller faktasjekker du, så del transkripsjonen med tidsstemplene intakte. En faktasjekker som kan høre den eksakte replikken, jobber langt raskere og stoler mer på sitatet enn en som bare stirrer på tekst.
Håndter samtykke, sensitive kilder og lagring som en proff
Innhent samtykke til å ta opp på opptaket, helst fanget i selve lyden. Reglene for opptak varierer – mange amerikanske delstater krever bare samtykke fra én part, flere krever at alle parter sier ja, og andre land skiller seg ut – så ved minste tvil: spør, og få et tydelig ja før det vesentlige begynner.
Til sensitivt eller off the record-materiale: tenk på hvor lyden og transkripsjonen havner. Bruk et verktøy som ikke trener AI på filene dine, lar deg slette opptak etter behandling og ikke beholder dem i det skjulte. Pepys trener aldri på lyden eller teksten din, og du kan automatisk slette filer etter at de er transkribert.
Anonymiser i selve transkripsjonen når en kilde trenger beskyttelse: bytt ut navn med en rollebetegnelse mens du renser utkastet, og oppbevar den uredigerte originalen et sted med tilgangskontroll. Ikke send rå-transkripsjonen rundt på e-post hvis et navn kan sette noen i fare.