Talergenkendelse – hvem sagde hvad
Find ud af, hvem der sagde hvad – upload en lydfil eller indsæt et link og få et transskript opdelt på talere, med talerskift og taletid pr. stemme.
Accepterer MP3, M4A, WAV, MP4 og andre lyd- eller videofiler – eller et link · leverer et hvem-sagde-hvad-transskript med talernavne, tidsstempler pr. taleskift og taletid.
Talernavnene stammer fra stemmeadskillelse, ikke fra en identitet – Pepys mærker adskillelige stemmer som Taler 1, Taler 2 og så videre. Den genkender ikke nogen på navn eller stemmeprofil; de rigtige navne tildeler du selv ved at omdøbe navnene.
60 min. gratis · intet kort nødvendigt · vi træner aldrig på din lyd
Hvad er talergenkendelse?
Pepys kører talergenkendelse på din optagelse: den opdeler lyden efter stemme, mærker hvert taleskift (Taler 1, Taler 2 …) og viser taletid pr. taler. Upload en lydfil eller indsæt et link og få et hvem-sagde-hvad-transskript med tidsstempler i minutter, på 99+ sprog. Dine første 60 minutter er gratis, uden kort.
Sådan fungerer talegenkendelse af hvem der taler
Upload lyd eller indsæt et link
Træk en optagelse med flere talere ind, eller indsæt et link – ethvert format, ethvert sprog.
Få et opdelt transskript
Pepys opdeler lyden efter stemme og mærker hvert taleskift, med tidsstempler der viser, hvor hver taler begynder og slutter.
Omdøb, tjek og eksportér
Erstat de generiske navne med rigtige navne, hold taleskiftene op mod lyden, og eksportér til TXT, Markdown, DOCX, PDF, SRT, VTT eller struktureret JSON.
Talergenkendelse besvarer et spørgsmål, som et fladt transskript ikke kan: hvem taler, og hvornår? Pepys deler en optagelse op i taleskift – Taler 1, Taler 2 og så videre – så et interview, en paneldebat, en fokusgruppe eller en podcast med to værter læses som et rent frem og tilbage i stedet for en udifferentieret væg af tekst. Hvert taleskift har et start- og sluttidsstempel, og du får taletid pr. stemme til spørgsmålene, der følger: hvem dominerede, hvem kom næsten ikke til orde, hvor lå overgangene.
Det er bygget til alle, der har brug for at vide, hvem der sagde hvad – forskere der koder kvalitative interviews, journalister der tilskriver citater, udviklere der sender taleskift videre til et mødereferat- eller analyseværktøj. Navnene er dine at omdøbe inline (Taler 2 bliver til "dr. Okafor"), og hvert taleskift kan eksporteres som struktureret JSON – hvert segment med sin taler, start- og sluttidsstempel og taletid pr. taler – eller som et rent transskript med talernavne. Vi træner aldrig på din lyd, og kreditter udløber aldrig.
Rene afsnit. Slut med øh og altså.
Til venstre ser du, hvad Pepys giver tilbage – logiske afsnit uden fyldord, korrekt tegnsat og læsbart. Til højre står den rå udskrift med én linje pr. segment, som de fleste transskriberingstjenester efterlader dig med.
øh altså ja alle bliver jo ved med at sige til dig at du ligesom skal starte med din bedste sætning ikke men øh helt ærligt hvis du sådan giver hele svaret væk i det første sekund så er der jo dybest set ingen grund til at nogen bliver ved med at se så hooket er på en måde ikke det smarteste du siger det er ligesom en sløjfe du åbner som de skal lukke og øh det er præcis den del der faktisk holder folk fanget
RåHvem-sagde-hvad-taleskift med start-/sluttidsstempel og taletid pr. taler
Omdøb generiske navne til rigtige navne inline – uden at køre noget igen
Struktureret JSON-eksport – segmenter, talernavne, tidsstempler og taletid til din pipeline
99+ sprog, registreret automatisk · vi træner aldrig på din lyd · kreditter udløber aldrig
Fungerer med de platforme, du lever på.
Indsæt et link fra YouTube, TikTok, Instagram, Facebook, Spotify eller Apple Podcasts – eller slip en hvilken som helst lyd- eller videofil ind. Vi transskriberer den én gang, og derefter eksporterer du den præcis, som dit workflow har brug for.
- YouTube
- TikTok
- Spotify
- Apple Podcasts
- eller en hvilken som helst fil
Eksportér til ethvert format
- TXT
- Markdown
- DOCX
- SRT
- VTT
- JSON
Tidsstempler, talernavne og undertekst-timing følger med i hver eneste eksport.
Talegenkendelse af hvem der taler – spørgsmål besvaret
Hvad er talergenkendelse?
Talergenkendelse er processen, der opdeler en optagelse efter, hvem der taler – den deler lyden op i taleskift og mærker hvert af dem (Taler 1, Taler 2 …). Den besvarer "hvem talte hvornår", adskilt fra "hvad blev der sagt". Pepys gør begge dele: den genkender talere og transskriberer i én arbejdsgang.
Hvordan adskiller det sig fra almindelig transskribering?
Et almindeligt transskript giver dig ordene. Talergenkendelse lægger talerstrukturen ovenpå: skiftegrænser, et navn pr. stemme og taletid i alt. Så en optagelse med flere talere læses som et tilskrevet frem og tilbage i stedet for én sammenhængende blok.
Hvor præcis er talermærkningen?
Skiftegrænser og navne er stærke ved rene, tydeligt adskilte stemmer. Kraftig overlappende tale, næsten identiske stemmer eller støjende lyd kan sløre et taleskift eller to – derfor starter navnene generisk (Taler 1, 2 …), og du omdøber og retter hvert taleskift inline før eksport.
Fortæller den mig hver talers navn?
Talergenkendelse adskiller stemmer, den genkender ikke identiteter – så talerne kommer ud som Taler 1, Taler 2 og så videre. Du tildeler de rigtige navne én gang inline, og omdøbningen gælder for alle taleskift med den stemme.
Kan jeg eksportere talerdataene som struktureret JSON?
Ja. JSON-eksporten giver dig hvert segment med talernavn, start- og sluttidsstempel og taletid pr. taler i et Whisper-kompatibelt format, du kan sende direkte ind i et script, et analyseværktøj eller en forskningsarbejdsgang – eller du kan eksportere TXT, Markdown, DOCX, PDF, SRT eller VTT til læsbar brug og undertekster.
Flere gratis værktøjer
Læs videre
Tag ikke bare vores ord for det.
Spørg ChatGPT, Claude eller Perplexity, hvad Pepys er, og hvem det er til. Ét klik, så laver din foretrukne AI benarbejdet.
Talegenkendelse af hvem der taler – gratis at gå i gang
Betal efter forbrug – kreditter udløber aldrig, intet at opsige. Eller start gratis med 60 minutter, uden kort.