Nimm die sauberste Master-Datei, die du hast
Transkribiere von der hochwertigsten Datei, an die du kommst – idealerweise vom fertig geschnittenen Master (WAV oder ein MP3 mit hoher Bitrate), nicht von der komprimierten Version, die dein Hoster fürs Streaming neu encodiert. Je klarer das Audio, desto weniger korrigierst du nach, gerade bei Gästenamen und Fachbegriffen. Liegt deine Folge nur als veröffentlichter Link vor, kannst du auch den einfügen – aber ein sauberer Export liest sich immer besser.
Wenn du mehrspurig aufnimmst (jeder Sprecher auf eigener Spur), behalte diese Spuren – sie machen die Sprecherzuordnung deutlich zuverlässiger als eine einzelne abgemischte Datei, weil das Tool keine zwei sich überlappenden Stimmen entwirren muss. Bei einer Solo-Show spielt das keine Rolle; bei einer Folge mit zwei Hosts plus Gast ist es der Unterschied zwischen sauberen Labels und einer Korrekturrunde von Hand.
Transkribiere nach dem Schnitt, nicht davor. Wenn du Abschweifungen rausschneidest, Ton reparierst oder ein Segment im Schnitt entfernst, sorgt das Transkribieren des fertigen Schnitts dafür, dass Transkript, Kapitel und Show Notes zu dem passen, was die Hörer wirklich hören – keine Geister-Zeitstempel, die auf entfernte Inhalte zeigen.
Mach aus dem Transkript Show Notes und Kapitel
Ein Transkript mit Zeitstempeln ist das Rohmaterial für alles, was du rund um die Folge veröffentlichst. Lies es einmal durch und markiere die natürlichen Abschnitte – das Intro, jedes große Thema, die beste Geschichte des Gasts, das Fazit. Diese Markierungen werden zu deinen Kapitelmarken (mit den Zeitstempeln gleich dran) und zum Gerüst deiner Show Notes. Du redigierst eine Struktur, die schon da ist, statt sie auf einem leeren Blatt zu erfinden.
Die eingebauten KI-Zusammenfassungen verkürzen den ersten Entwurf: Du bekommst eine knackige Folgen-Zusammenfassung und eine Kapitelliste direkt aus dem Transkript und feilst den Wortlaut dann in deiner eigenen Stimme nach. Ziel ist nicht, die Worte der KI wortwörtlich zu veröffentlichen – sondern den langsamsten Teil zu überspringen (überhaupt herauszufinden, worum es in der Folge ging) und deine Zeit in den Feinschliff zu stecken.
Pick dir gleich drei oder vier zitierfähige Zeilen heraus. Knackige, in sich geschlossene Sätze sind die besten Folgenbeschreibungen, Newsletter-Teaser und Zitatkarten – und du hast sie schon mit Zeitstempel, kannst dir also das exakte Audio für ein Audiogramm greifen.
Veröffentliche das Transkript für SEO und Barrierefreiheit
Audio ist für Suchmaschinen unsichtbar, ein Transkript nicht. Wenn du den vollständigen Text auf die Folgenseite stellst, wird aus einem 45-minütigen Gespräch ein Berg indexierbarer Wörter – Menschen, die nach den Themen, Namen und Formulierungen suchen, über die du gesprochen hast, landen so tatsächlich bei deiner Show. Für viele unabhängige Podcasts sind Transkriptseiten die mit Abstand größte Quelle für organische Entdeckung.
Transkripte sind auch eine Grundlage für Barrierefreiheit. Hörer, die taub oder schwerhörig sind, Menschen in Umgebungen ohne Ton und alle, die lieber überfliegen als hören, bekommen Zugang, sobald der Text auf der Seite steht. Es ist dasselbe Artefakt mit doppeltem Nutzen – Reichweite und Inklusion aus einem Transkript.
Formatiere es für Menschen, nicht nur für Crawler: Behalte die Sprecherlabels, gliedere es in dieselben Abschnitte wie deine Kapitel und verlinke Zeitstempel zurück zum Player, wenn deine Seite das unterstützt. Eine Wand aus ununterbrochenem Text rankt technisch zwar, aber niemand liest sie; ein strukturiertes Transkript wird genutzt.
Mach Untertitel und Audiogramme aus derselben Datei
Wenn du Videoclips oder Audiogramme für Social Media schneidest, brauchst du Untertitel – und dein Transkript enthält sie bereits. Exportiere das Transkript als SRT oder VTT, und du hast Untertiteldateien mit korrekten Zeitstempeln, bereit, sie auf einen Clip zu legen. Untertitelte Clips schlagen stumme, untertitellose deutlich in Feeds, in denen die meisten Leute ohne Ton schauen.
Für ein Audiogramm findest du den herausragenden 30- bis 60-Sekunden-Moment über deinen Zitatindex, greifst dir diesen Zeitstempelbereich und kombinierst die Wellenform mit den passenden Untertitelzeilen. Weil alles auf ein Transkript zurückgeht, sagen deine Clip-Untertitel und dein veröffentlichtes Transkript genau dasselbe – kein Abtippen, kein Auseinanderdriften.
Übersetze das Transkript, um nicht-deutschsprachige Hörer zu erreichen: Ein übersetztes Transkript plus übersetzte Untertitel öffnet die Folge für Zielgruppen, die sonst abspringen würden. Eine aufwandsarme Art, die Reichweite einer einzelnen Folge über Sprachen hinweg zu erweitern.