Sprekerherkenning
Ontdek wie wat zei – upload een bestand of plak een link en krijg een transcript dat per spreker is opgesplitst, met sprekerwisselingen en spreektijd per stem.
Accepteert MP3, M4A, WAV, MP4 en andere audio- of videobestanden – of een link · levert een wie-zei-wat-transcript met sprekerlabels, tijdstempels per beurt en spreektijd.
De sprekerlabels komen uit stemscheiding, niet uit een identiteit – Pepys kenmerkt te onderscheiden stemmen als Spreker 1, Spreker 2, enzovoort. Het herkent niemand op naam of stemprofiel; de echte namen ken je zelf toe door de labels te hernoemen.
60 min gratis · geen kaart nodig · we trainen nooit op je audio
Wat is sprekerherkenning?
Pepys voert sprekerherkenning uit op je opname: het splitst de audio per stem, labelt elke beurt (Spreker 1, Spreker 2 …) en toont de spreektijd per spreker. Upload een bestand of plak een link en krijg een wie-zei-wat-transcript met tijdstempels in minuten, in 99+ talen. Je eerste 60 minuten zijn gratis, zonder kaart.
Zo werkt sprekerherkenning
Upload audio of plak een link
Sleep een opname met meerdere sprekers erin of plak een link – elk formaat, elke taal.
Krijg een gesplitst transcript
Pepys splitst de audio per stem en labelt elke beurt, met tijdstempels die aangeven waar elke spreker begint en stopt.
Hernoem, controleer en exporteer
Vervang de generieke labels door echte namen, leg de beurten naast de audio en exporteer naar TXT, Markdown, DOCX, PDF, SRT, VTT of gestructureerde JSON.
Sprekerherkenning beantwoordt een vraag die een doorlopend transcript openlaat: wie praat er, en wanneer? Pepys verdeelt een opname in sprekerbeurten – Spreker 1, Spreker 2, enzovoort – zodat een interview, een paneldiscussie, een focusgroep of een podcast met twee hosts leest als een helder heen en weer in plaats van een ongedifferentieerde muur van tekst. Elke beurt krijgt een begin- en eindtijdstempel, en je krijgt de spreektijd per stem voor de vragen die daarna komen: wie domineerde, wie kwam nauwelijks aan het woord, waar lagen de overgangen.
Gemaakt voor iedereen die moet weten wie wat zei – onderzoekers die kwalitatieve interviews coderen, journalisten die citaten toeschrijven, developers die sprekerbeurten doorsturen naar een notulen- of analysetool. De labels hernoem je inline (Spreker 2 wordt "dr. Okafor"), en elke beurt exporteer je als gestructureerde JSON – elk segment met spreker, begin- en eindtijdstempel en spreektijd per spreker – of als een schoon transcript met sprekerlabels. We trainen nooit op je audio, en tegoed verloopt nooit.
Nette alinea's. Geen geh en geuh meer.
Links zie je wat Pepys teruggeeft – logische alinea's zonder stopwoorden, netjes geïnterpuncteerd en leesbaar. Rechts staat de ruwe uitvoer met één regel per fragment, zoals de meeste transcriptiediensten je achterlaten.
uhm dus ja iedereen blijft maar zeggen dat je weet wel met je beste zin moet openen toch maar eh eerlijk gezegd als je het hele antwoord al in de eerste seconde weggeeft dan is er eigenlijk gewoon geen reden meer voor iemand om verder te kijken dus de hook is zegmaar niet het slimste wat je zegt het is meer zoiets als een lus die je opent en die ze moeten sluiten en uhm dat is nou net het deel dat mensen echt laat blijven hangen
RuwWie-zei-wat-beurten met begin-/eindtijdstempel en spreektijd per spreker
Hernoem generieke labels inline naar echte namen – zonder iets opnieuw te draaien
Gestructureerde JSON-export – segmenten, sprekerlabels, tijdstempels en spreektijd voor je pipeline
99+ talen, automatisch gedetecteerd · we trainen nooit op je audio · tegoed verloopt nooit
Werkt met de platforms waar jij actief bent.
Plak een link van YouTube, TikTok, Instagram, Facebook, Spotify of Apple Podcasts – of zet een willekeurig audio- of videobestand neer. We transcriberen het één keer, daarna exporteer je het precies zoals jouw workflow het nodig heeft.
- YouTube
- TikTok
- Spotify
- Apple Podcasts
- of een willekeurig bestand
Exporteren naar elk formaat
- TXT
- Markdown
- DOCX
- SRT
- VTT
- JSON
Tijdstempels, sprekerlabels en ondertiteltiming worden in elke export meegenomen.
Sprekerherkenning – vragen, beantwoord
Wat is sprekerherkenning?
Sprekerherkenning verdeelt een opname op basis van wie er spreekt – het splitst de audio in beurten en labelt elke beurt (Spreker 1, Spreker 2 …). Het beantwoordt "wie sprak wanneer", los van wat er gezegd werd. Pepys doet beide: het herkent de sprekers en transcribeert in één keer.
Wat is het verschil met een gewoon transcript?
Een gewoon transcript geeft je de woorden. Sprekerherkenning legt de sprekerstructuur erbovenop: beurtgrenzen, een label per stem en de spreektijd. Zo leest een opname met meerdere sprekers als een toegeschreven heen en weer in plaats van één doorlopend blok.
Hoe nauwkeurig is het toewijzen van sprekers?
Beurtgrenzen en labels zijn sterk bij schone, duidelijk te onderscheiden stemmen. Veel door elkaar praten, bijna identieke stemmen of ruizige audio kunnen een beurt vertroebelen – daarom starten de labels generiek (Spreker 1, 2 …) en hernoem en corrigeer je losse beurten inline vóór het exporteren.
Noemt het de naam van elke spreker?
Sprekerherkenning scheidt stemmen, het herkent geen identiteiten – sprekers komen er dus uit als Spreker 1, Spreker 2, enzovoort. Je kent de echte namen één keer inline toe, en de hernoeming geldt voor alle beurten van die stem.
Kan ik de sprekerdata als gestructureerde JSON exporteren?
Ja. De JSON-export geeft je elk segment met sprekerlabel, begin- en eindtijdstempel en spreektijd per spreker in een gestructureerde vorm die je rechtstreeks in een script, analysetool of onderzoeksworkflow kunt voeren – of je exporteert TXT, Markdown, DOCX, PDF, SRT of VTT voor leesbaar gebruik en ondertitels.
Meer gratis tools
Verder lezen
Geloof ons niet zomaar op ons woord.
Vraag aan ChatGPT, Claude of Perplexity wat Pepys is en voor wie het bedoeld is. Eén klik en je favoriete AI zoekt het voor je uit.
Sprekerherkenning – gratis te beginnen
Betalen naar gebruik – tegoed verloopt nooit, niets op te zeggen. Of begin gratis met 60 minuten, zonder kaart.