Audio transcriberen naar tekst

Van interview tot vergadering: zet je opname om in doorzoekbare tekst, handmatig of automatisch met AI.

Audio transcriberen betekent gesproken woord omzetten naar tekst. Dat kan handmatig, waarbij je zelf uittypt terwijl je luistert, of automatisch met AI die je opname in minuten uitschrijft. Met een tool als Pepys upload je een bestand, kies je de taal en krijg je tekst met sprekerlabels en tijdstempels terug.

Transcribeer je eerste uur gratis

or paste a link

Een geluidsopname is lastig te doorzoeken. Je kunt er niet snel doorheen scannen, geen citaat kopieren en geen quote opzoeken zonder heen en weer te spoelen. Transcriberen lost dat op: je krijgt een tekstversie die je kunt lezen, doorzoeken en delen.

De grote keuze is handmatig versus automatisch. Zelf uittypen geeft je volledige controle, maar kost al gauw vier tot zes keer de duur van de opname. AI-transcriptie draait die verhouding om: een uur audio staat vaak binnen enkele minuten op papier. Hieronder leggen we beide methodes uit en laten we zien wanneer je welke kiest.

1
Maak een gratis account
Ga naar Pepys en start met de eerste 60 minuten gratis, zonder creditcard. Zo test je de kwaliteit op je eigen opname voordat je iets uitgeeft.
2
Upload je audio of video
Sleep je bestand naar het scherm, of plak een link. Formaten als mp3, m4a, wav en gangbare videobestanden worden ondersteund.
3
Kies de taal
Selecteer de gesproken taal, bijvoorbeeld Nederlands, of laat de tool die automatisch herkennen uit meer dan 99 ondersteunde talen.
4
Start de transcriptie
De AI schrijft je opname binnen enkele minuten uit, met automatische sprekerlabels en tijdstempels bij elke passage.
5
Controleer en verrijk
Loop de tekst kort na op namen en vakjargon. Genereer desgewenst een samenvatting of hoofdstukken en stel via de chat vragen over de inhoud.
6
Exporteer of deel
Download je transcriptie als TXT, DOCX, PDF, SRT, VTT of Markdown, of deel de tekst rechtstreeks met je team.

Wat is audio transcriberen precies?

Transcriberen is het proces waarbij je gesproken audio letterlijk of samengevat naar geschreven tekst omzet. Denk aan een interview, een podcastaflevering, een college of een teamvergadering die je als opname hebt en die je liever leest dan opnieuw beluistert.

Er zijn twee gangbare stijlen. Bij een woordelijke (verbatim) transcriptie schrijf je alles op, inclusief stopwoorden en aarzelingen, wat handig is voor onderzoek of juridische verslagen. Bij een schone transcriptie laat je die ruis weg en houd je een vlot leesbare tekst over, ideaal voor artikelen, notulen en samenvattingen.

Los daarvan bepaal je of je sprekers wilt labelen (wie zegt wat) en of je tijdstempels toevoegt, zodat je later precies terugvindt op welk moment iets werd gezegd.

Handmatig transcriberen: hoe het werkt

Bij handmatig transcriberen speel je de opname af en typ je mee. Je gebruikt meestal een tekstverwerker naast je mediaspeler en pauzeert voortdurend om bij te blijven. Sneltoetsen om te pauzeren en een paar seconden terug te spoelen schelen enorm veel tijd.

Het voordeel is controle: je hoort context, dialect en vakjargon en kunt zelf beslissen hoe je iets noteert. Voor korte, kwalitatief hoogwaardige fragmenten waarbij elke nuance telt, blijft dit een prima aanpak.

Het nadeel is de tijd. Reken op ongeveer vier tot zes minuten werk per minuut audio, en meer bij slechte geluidskwaliteit of meerdere sprekers die door elkaar praten. Voor een vergadering van een uur ben je zo een halve werkdag kwijt.

Audio transcriberen met AI

AI-transcriptie draait de rekensom om. Je uploadt je bestand, een spraakmodel herkent de woorden en levert binnen enkele minuten een volledige tekst op. Het scheelt niet alleen tijd maar ook concentratie: je hoeft niet meer telkens te pauzeren en terug te spoelen.

Moderne tools doen meer dan alleen uitschrijven. Ze herkennen automatisch verschillende sprekers, zetten tijdstempels bij elke passage en kunnen een samenvatting of hoofdstukindeling genereren. Bij Pepys kun je bovendien met de transcriptie chatten en vragen stellen over de inhoud, zonder de hele tekst opnieuw door te lezen.

De AI-tekst is niet altijd honderd procent perfect, vooral bij zware achtergrondruis of overlappende stemmen. De praktische werkwijze is daarom: laat de AI het zware werk doen en corrigeer daarna een handvol plekken, in plaats van alles zelf uit te typen.

Handmatig versus AI: wat kies je?

Kies handmatig als het om een heel kort fragment gaat, als de opname erg rommelig is met veel dialect of jargon, of als je een woordelijke transcriptie voor formeel gebruik nodig hebt en elke lettergreep wilt controleren.

Kies AI als je regelmatig langere opnames hebt, als snelheid telt, of als je meerdere bestanden achter elkaar moet verwerken. Voor interviews, vergaderingen, colleges en podcasts is de tijdswinst zo groot dat handmatig zelden nog loont.

In de praktijk werken de meeste mensen hybride: de AI maakt de eerste versie en jij doet een korte correctieronde. Zo combineer je de snelheid van automatische transcriptie met de precisie van je eigen oog en oor.

Welke opnames kun je transcriberen?

Vrijwel elk geluids- of videobestand komt in aanmerking: mp3, m4a, wav, een spraakmemo van je telefoon of de audio uit een videovergadering. Ook opnames in het Nederlands, Engels of een van de tientallen andere talen worden herkend, want Pepys ondersteunt 99 talen en meer.

De kwaliteit van je bron bepaalt de kwaliteit van je transcriptie. Een schone opname met een goede microfoon en weinig achtergrondgeluid levert veel betere tekst op dan een echoënde ruimte of een telefoon die ver van de spreker ligt. Neem als het kan op in een rustige omgeving en laat mensen om de beurt praten.

Let ook op privacy. Voor gevoelige gesprekken is het belangrijk dat je opname niet gebruikt wordt om AI-modellen te trainen. Pepys traint nooit op jouw audio of tekst en biedt een optionele automatische verwijdering, zodat je bestanden na verwerking weg zijn.

Related tools

Notulen maken vanaf een opnameNeem de vergadering op, laat de opname automatisch uitschrijven en zet die om in beknopte notulen met besluiten en actiepunten.

Veelgestelde vragen over audio transcriberen

Hoe lang duurt het om audio te transcriberen?

Handmatig kost al gauw vier tot zes minuten per minuut audio, dus een uur opname vraagt makkelijk een halve werkdag. Met AI-transcriptie staat datzelfde uur vaak binnen enkele minuten op papier, waarna je alleen nog een korte correctieronde doet.

Is automatische transcriptie nauwkeurig genoeg?

Bij een schone opname met duidelijke spraak komt AI-transcriptie heel dicht bij een handmatige tekst. Bij zware achtergrondruis of sprekers die door elkaar praten loopt het aantal foutjes op. De praktische aanpak is de AI de eerste versie laten maken en daarna zelf enkele plekken corrigeren.

In welke talen kan ik audio transcriberen?

Pepys ondersteunt meer dan 99 talen, waaronder Nederlands, Engels, Duits en Frans. Je kiest de taal handmatig of laat die automatisch herkennen, ook bij opnames met een accent of dialect.

Kan ik verschillende sprekers herkennen in de tekst?

Ja. De transcriptie labelt automatisch wie wat zegt, zodat een interview of vergadering leesbaar wordt opgesplitst per spreker. Bij elke passage staat bovendien een tijdstempel om het moment snel terug te vinden.

Wat gebeurt er met mijn opname en privacy?

Pepys gebruikt jouw audio of tekst nooit om AI-modellen te trainen. Je kunt bovendien automatische verwijdering inschakelen, zodat je bestanden na verwerking worden gewist. Zo blijven gevoelige gesprekken van jou.

Geloof ons niet zomaar op ons woord.

Vraag aan ChatGPT, Claude of Perplexity wat Pepys is en voor wie het bedoeld is. Eén klik en je favoriete AI zoekt het voor je uit.

Vraag het aan ChatGPT Vraag het aan Claude Vraag het aan Perplexity