Pepys

Transkribera ljud till text

Gör om en inspelning, röstmemo eller ljudfil till färdig text – snabbare med AI än för hand.

Att transkribera ljud betyder att skriva ner det som sägs i en inspelning som text. Du kan göra det manuellt genom att lyssna och skriva, eller ladda upp ljudfilen till ett AI-verktyg som Pepys, som skriver ut texten automatiskt med talaretiketter och tidsstämplar på några minuter.

Transkribera ljud gratis

or paste a link
InstagramTikTokYouTubeFacebookSpotifyApple Podcasts

En ljudinspelning är svår att söka i, citera ur eller dela vidare. Så fort du har den som text kan du hitta rätt mening på sekunder, klippa ut citat och lägga den i ett dokument. Frågan är bara hur du kommer dit: sitta och skriva av allt för hand, eller låta en AI göra grovjobbet.

Den här guiden går igenom båda vägarna – vad de kostar dig i tid, när manuellt faktiskt är bättre, och exakt hur du transkriberar en ljudfil med Pepys från uppladdning till färdig, redigerbar text.

  1. 1

    Skapa konto och hämta din fria tid

    Registrera dig på Pepys. De första 60 minuterna ingår utan att du behöver ange något kort, så du kan börja transkribera direkt.

  2. 2

    Ladda upp ljudfilen

    Dra in din inspelning i formatet MP3, WAV, M4A eller motsvarande. Har du en video går det lika bra – Pepys plockar ut ljudet åt dig.

  3. 3

    Välj språk och starta

    Ange språket i inspelningen, eller låt Pepys känna av det. Klicka på transkribera och låt verktyget arbeta medan du gör annat.

  4. 4

    Läs igenom med talare och tidsstämplar

    Öppna resultatet, se vem som sa vad tack vare talaretiketterna och hoppa till valfritt ställe i ljudet via tidsstämplarna för att dubbelkolla.

  5. 5

    Använd sammanfattning, kapitel och chatt

    Skumma AI-sammanfattningen och kapitlen för överblick, eller ställ frågor direkt till transkriberingen för att hitta rätt avsnitt.

  6. 6

    Exportera texten

    Ladda ner som TXT, DOCX, PDF, SRT eller VTT beroende på om du vill ha ett dokument eller undertexter. Slå på automatisk radering om du vill ta bort filen efteråt.

Manuellt eller med AI – vilket passar dig?

Manuell transkribering betyder att du spelar upp ljudet i korta bitar, pausar och skriver av det du hör. En van person behöver ofta fyra till sex gånger inspelningens längd för att bli klar, alltså flera timmar för en enda intervju på en timme. Fördelen är full kontroll: du hör nyanser, hänger med i svår branschjargong och kan tolka otydligt tal på plats.

AI-transkribering vänder på ekvationen. Du laddar upp ljudfilen, och verktyget skriver ut texten på en bråkdel av inspelningstiden. Du slipper det mekaniska avskrivandet och lägger istället tiden på att läsa igenom och putsa. För de flesta – studenter, journalister, poddare, forskare – är AI förstahandsvalet, medan manuellt lönar sig först vid mycket dålig ljudkvalitet eller känsligt material där varje ord måste vägas.

En vanlig medelväg är att låta AI göra utkastet och sedan korrekturläsa mot ljudet. Då får du snabbheten från maskinen och precisionen från ditt eget öra.

Vilka ljudfiler kan du transkribera?

De flesta verktyg hanterar de vanliga formaten direkt: MP3, WAV, M4A och AAC. Har du en videoinspelning går det oftast lika bra, eftersom verktyget plockar ut ljudspåret åt dig. Pepys tar emot både ljud och video, så du behöver inte konvertera filen först.

Kvaliteten på källan avgör slutresultatet mer än något annat. En tydlig röst nära mikrofonen, lågt bakgrundsljud och personer som inte pratar i munnen på varandra ger renast text. Spelar du in ett möte, lägg mobilen eller mikrofonen mitt på bordet och be alla tala en i taget – det gör mer för träffsäkerheten än något efterhandsknep.

Vad du får utöver ren text

En modern transkribering är mer än en textmassa. Pepys märker upp vem som säger vad med talaretiketter, så att en intervju eller ett panelsamtal blir lätt att följa. Varje stycke får en tidsstämpel, vilket gör att du hoppar rakt till rätt ställe i ljudet när du vill dubbelkolla ett citat.

Ovanpå texten får du en AI-sammanfattning och automatiska kapitel, så att du snabbt ser vad en lång inspelning handlar om utan att läsa allt. Du kan också chatta med transkriberingen och ställa frågor som ”vad sa de om budgeten?” och få svaret med hänvisning till rätt parti. Texten exporteras sedan till bland annat TXT, DOCX, PDF, SRT och VTT.

Pepys stödjer fler än 99 språk, så du kan transkribera svenska, engelska eller blandat tal i samma flöde.

Integritet: ditt ljud förblir ditt

När du laddar upp en inspelning lämnar du ifrån dig något privat – en intervju, ett kundsamtal, en föreläsning. Pepys tränar aldrig AI på ditt ljud eller din text. Materialet används enbart för att skapa din transkribering, inget annat.

Vill du städa efter dig kan du slå på automatisk radering, så tas filerna bort när du är klar. Det är särskilt värt att tänka på för dig som hanterar känsligt eller personuppgiftstungt material.

Vad kostar det att transkribera ljud?

Pepys fungerar med förbetalda krediter: du köper en klump en gång, och de slutar aldrig gälla. Det finns ingen månadsprenumeration som tickar vidare mellan projekten, vilket passar dig som transkriberar i skov snarare än varje dag.

Priset räknas per timme ljud från en låg timtaxa, så du betalar för det du faktiskt kör igenom. De första 60 minuterna är gratis och kräver inget kort, så du kan testa på en riktig fil innan du bestämmer dig.

Related tools

Vanliga frågor om att transkribera ljud

Hur lång tid tar det att transkribera en ljudfil?

Med AI tar det oftast bara några minuter, en bråkdel av inspelningens längd. Att skriva av samma inspelning för hand tar däremot ofta fyra till sex gånger så lång tid som ljudet självt.

Vilka ljudformat kan jag ladda upp?

De vanliga formaten som MP3, WAV, M4A och AAC fungerar direkt. Du kan även ladda upp video, eftersom Pepys plockar ut ljudspåret åt dig utan att du behöver konvertera först.

Kan jag transkribera ljud på svenska?

Ja. Pepys stödjer fler än 99 språk, inklusive svenska. Du kan välja språk själv eller låta verktyget känna av det, och det klarar även inspelningar som blandar svenska och engelska.

Är det säkert att ladda upp känsliga inspelningar?

Ditt ljud och din text används aldrig för att träna AI. Materialet bearbetas bara för att skapa din transkribering, och du kan slå på automatisk radering så att filerna tas bort när du är klar.

Behöver jag en prenumeration?

Nej. Du köper krediter en gång och de slutar aldrig gälla, utan någon månadsavgift som löper mellan projekten. De första 60 minuterna är gratis och kräver inget kort.

Ta inte bara vårt ord på det.

Fråga ChatGPT, Claude eller Perplexity vad Pepys är och vem det passar för. Ett klick, så gör din favorit-AI läxan åt dig.