Talaridentifiering
Ta reda på vem som sa vad – ladda upp en fil eller klistra in en länk och få ett transkript uppdelat per talare, med talarbyten och taltid för varje röst.
Tar emot MP3, M4A, WAV, MP4 och andra ljud- eller videofiler – eller en länk · levererar ett vem-sa-vad-transkript med talaretiketter, tidsstämplar per tur och taltid.
Talaretiketterna kommer från röstseparation, inte från en identitet – Pepys märker åtskilda röster som Talare 1, Talare 2 och så vidare. Den känner inte igen någon på namn eller röstprofil; de riktiga namnen anger du själv genom att byta namn på etiketterna.
60 min gratis · inget kort krävs · vi tränar aldrig på ditt ljud
Hur fungerar talaridentifiering?
Pepys kör talaridentifiering på din inspelning: ljudet delas upp efter röst, varje tur märks (Talare 1, Talare 2 …) och taltiden per talare redovisas. Ladda upp en fil eller klistra in en länk och få ett vem-sa-vad-transkript med tidsstämplar i minuter, på 99+ språk. Dina första 60 minuter är gratis, utan kort.
Så fungerar talaridentifiering
Ladda upp ljud eller klistra in en länk
Dra in en inspelning med flera talare eller klistra in en länk – vilket format som helst, vilket språk som helst.
Få ett uppdelat transkript
Pepys delar upp ljudet efter röst och märker varje tur, med tidsstämplar som visar var varje talare börjar och slutar.
Byt namn, kontrollera och exportera
Ersätt de generiska etiketterna med riktiga namn, stäm av turerna mot ljudet och exportera till TXT, Markdown, DOCX, PDF, SRT, VTT eller strukturerad JSON.
Talaridentifiering svarar på en fråga som ett platt transkript lämnar öppen: vem talar, och när? Pepys delar in en inspelning i talarturer – Talare 1, Talare 2 och så vidare – så att en intervju, en panel, en fokusgrupp eller en podd med två värdar läses som ett rent fram och tillbaka i stället för en odifferentierad textvägg. Varje tur har en start- och sluttidsstämpel, och du får total taltid per röst för frågorna som följer: vem dominerade, vem kom knappt till tals, var skedde överlämningarna.
Den är byggd för alla som behöver veta vem som sa vad – forskare som kodar kvalitativa intervjuer, journalister som tillskriver citat, utvecklare som matar in talarturer i ett verktyg för mötesanteckningar eller analys. Etiketterna byter du namn på inline (Talare 2 blir "Dr. Okafor"), och varje tur exporteras som strukturerad JSON – varje segment med sin talare, start- och sluttidsstämpel och taltid per talare – eller som ett rent transkript med talaretiketter. Vi tränar aldrig på ditt ljud, och krediter förfaller aldrig.
Rena stycken. Slut på alla ehm och öh.
Till vänster ser du vad Pepys lämnar tillbaka – logiska stycken där utfyllnadsorden är borttagna, med skiljetecken och lätta att läsa. Till höger är den råa dumpen med en rad per segment som de flesta transkriberingstjänster lämnar efter sig.
ehm så ja alla säger ju hela tiden att man liksom ska börja med sin bästa replik va men öh ärligt talat om du typ ger bort hela svaret redan första sekunden så finns det ju liksom ingen anledning för nån att fortsätta titta så hooken är liksom inte det smartaste du säger utan mer som en loop du öppnar som de måste stänga och ehm det är just den biten som faktiskt får folk att stanna kvar
RåttVem-sa-vad-turer med start-/sluttidsstämplar och taltid per talare
Byt namn på generiska etiketter till riktiga namn inline – utan att köra om något
Strukturerad JSON-export – segment, talaretiketter, tidsstämplar och taltid för din pipeline
99+ språk, automatiskt identifierade · vi tränar aldrig på ditt ljud · krediter förfaller aldrig
Fungerar med plattformarna du lever i.
Klistra in en länk från YouTube, TikTok, Instagram, Facebook, Spotify eller Apple Podcasts – eller släpp in vilken ljud- eller videofil som helst. Vi transkriberar den en gång, sedan exporterar du den precis som ditt arbetsflöde kräver.
- YouTube
- TikTok
- Spotify
- Apple Podcasts
- eller vilken fil som helst
Exportera till valfritt format
- TXT
- Markdown
- DOCX
- SRT
- VTT
- JSON
Tidsstämplar, talaretiketter och undertexternas timing följer med i varje export.
Talaridentifiering – frågor och svar
Hur fungerar talaridentifiering?
Talaridentifiering delar upp en inspelning efter vem som talar – den delar in ljudet i turer och märker var och en (Talare 1, Talare 2 …). Den svarar på "vem talade när", skilt från vad som sades. Pepys gör båda: den identifierar talarna och transkriberar i ett svep.
Hur skiljer sig detta från vanlig transkribering?
Ett vanligt transkript ger dig orden. Talaridentifiering lägger talarstrukturen ovanpå: turgränser, en etikett per röst och total taltid. Så läses en inspelning med flera talare som ett tillskrivet fram och tillbaka i stället för ett enda löpande block.
Hur exakt är talarmärkningen?
Turgränser och etiketter är starka på rena, tydligt åtskilda röster. Mycket prat i munnen på varandra, nästan identiska röster eller brusigt ljud kan sudda ut en tur eller två – därför börjar etiketterna generiska (Talare 1, 2 …) och du byter namn och korrigerar enskilda turer inline före export.
Talar den om för mig vad varje talare heter?
Talaridentifiering separerar röster, den känner inte igen identiteter – talarna kommer alltså ut som Talare 1, Talare 2 och så vidare. Du anger de riktiga namnen en gång inline, och namnbytet gäller för alla turer för den rösten.
Kan jag exportera talardatan som strukturerad JSON?
Ja. JSON-exporten ger dig varje segment med sin talaretikett, start- och sluttidsstämpel och taltid per talare i ett Whisper-kompatibelt format som du kan mata rakt in i ett skript, ett analysverktyg eller ett forskningsflöde – eller exportera TXT, Markdown, DOCX, PDF, SRT eller VTT för läsbar användning och undertexter.
Fler gratisverktyg
Läs vidare
Ta inte bara vårt ord på det.
Fråga ChatGPT, Claude eller Perplexity vad Pepys är och vem det passar för. Ett klick, så gör din favorit-AI läxan åt dig.
Talaridentifiering – gratis att börja
Betala per användning – krediterna förfaller aldrig, inget att säga upp. Eller börja gratis med 60 minuter, utan kort.