9,438,517minut przetranskrybowanych

Rozpoznawanie mówców

Sprawdź, kto co powiedział – wgraj plik lub wklej link i otrzymaj transkrypcję podzieloną na mówców, z granicami wypowiedzi i czasem mówienia każdego głosu.

albo wklej link

Przyjmuje MP3, M4A, WAV, MP4 i inne pliki audio lub wideo – albo link · zwraca transkrypcję kto-co-powiedział z etykietami mówców, znacznikami czasu wypowiedzi i czasem mówienia.

Etykiety mówców pochodzą z rozdzielania głosów, a nie z tożsamości – Pepys oznacza odrębne głosy jako Mówca 1, Mówca 2 i tak dalej. Nie rozpoznaje nikogo po nazwisku ani odcisku głosu; prawdziwe nazwiska przypisujesz samodzielnie, zmieniając etykiety.

60 min za darmo · bez karty · nigdy nie trenujemy na Twoim audio

Zaufało nam ponad 100k użytkowników

Czym jest rozpoznawanie mówców?

Pepys rozpoznaje mówców w Twoim nagraniu: dzieli audio według głosów, oznacza każdą wypowiedź (Mówca 1, Mówca 2…) i podaje czas mówienia każdej osoby. Wgraj plik lub wklej link, a dostaniesz transkrypcję kto-co-powiedział ze znacznikami czasu w minutach, w ponad 99 językach. Pierwsze 60 minut za darmo, bez karty.

Jak działa rozpoznawanie mówców

Wgraj audio lub wklej link

Przeciągnij nagranie z kilkoma mówcami albo wklej link – dowolny format, dowolny język.

Odbierz podzieloną transkrypcję

Pepys dzieli audio według głosów i oznacza każdą wypowiedź, ze znacznikami czasu pokazującymi, gdzie każdy mówca zaczyna i kończy.

Zmień nazwy, sprawdź i wyeksportuj

Zamień ogólne etykiety na prawdziwe nazwiska, porównaj wypowiedzi z nagraniem i wyeksportuj do TXT, Markdown, DOCX, PDF, SRT, VTT lub strukturalnego JSON.

Rozpoznawanie mówców odpowiada na pytanie, które płaska transkrypcja zostawia bez odpowiedzi: kto mówi i kiedy? Pepys dzieli nagranie na wypowiedzi poszczególnych mówców – Mówca 1, Mówca 2 i tak dalej – dzięki czemu wywiad, debata panelowa, grupa fokusowa czy podcast z dwoma prowadzącymi czyta się jak uporządkowana wymiana zdań, a nie jak jednolitą ścianę tekstu. Każda wypowiedź ma znacznik początku i końca, a do tego dostajesz łączny czas mówienia każdego głosu – pod kolejne pytania: kto dominował, kto ledwie się odezwał i gdzie następowały przejścia.

Stworzone dla każdego, kto musi wiedzieć, kto co powiedział – badaczy kodujących wywiady jakościowe, dziennikarzy przypisujących cytaty, programistów wpinających wypowiedzi mówców w narzędzie do notatek ze spotkania lub do analityki. Etykiety zmienisz w miejscu (Mówca 2 staje się "dr Okafor"), a każdą wypowiedź wyeksportujesz jako strukturalny JSON – każdy segment z mówcą, znacznikami początku i końca oraz czasem mówienia każdej osoby – lub jako czytelną transkrypcję z etykietami mówców. Nigdy nie trenujemy na Twoim audio, a kredyty nigdy nie wygasają.

Czyste akapity. Koniec z eee i yyy.

Po lewej widzisz to, co zwraca Pepys – logiczne akapity bez słów wypełniaczy, z interpunkcją i gotowe do czytania. Po prawej surowy zrzut po jednej linii na fragment, jaki zostawia większość narzędzi do transkrypcji.

reel-voiceover.mp4

no więc yyy generalnie wszyscy ci mówią żeby no wiesz zaczynać od najlepszego zdania nie ale eee szczerze mówiąc jak oddasz całą odpowiedź już w pierwszej sekundzie to no właśnie nie ma praktycznie żadnego powodu żeby ktokolwiek oglądał dalej więc ten hook to tak jakby nie jest najmądrzejsza rzecz jaką mówisz tylko taka pętla którą otwierasz a oni muszą ją zamknąć i yyy to jest właśnie ta część która naprawdę zatrzymuje ludzi

Surowe

PrzedPo

Wypowiedzi kto-co-powiedział ze znacznikami początku/końca i czasem mówienia każdego mówcy
Zmiana ogólnych etykiet na prawdziwe nazwiska w miejscu – bez ponownego uruchamiania
Eksport do strukturalnego JSON – segmenty, etykiety mówców, znaczniki czasu i czas mówienia do Twojego procesu
Ponad 99 języków, wykrywanych automatycznie · nigdy nie trenujemy na Twoim audio · kredyty nigdy nie wygasają

Działa z platformami, na których żyjesz.

Wklej link z YouTube, TikToka, Instagrama, Facebooka, Spotify czy Apple Podcasts – albo wrzuć dowolny plik audio lub wideo. Transkrybujemy go raz, a potem eksportujesz go tak, jak potrzebuje tego Twój workflow.

YouTube
TikTok
Instagram
Facebook
Spotify
Apple Podcasts
albo dowolny plik

Eksportuj do dowolnego formatu

TXT
Markdown
DOCX
PDF
SRT
VTT
JSON

Znaczniki czasu, etykiety mówców i synchronizacja napisów przenoszą się do każdego eksportu.

Rozpoznawanie mówców – odpowiedzi na pytania

Czym jest rozpoznawanie mówców?

Rozpoznawanie mówców to dzielenie nagrania według tego, kto mówi – rozbicie audio na wypowiedzi i oznaczenie każdej z nich (Mówca 1, Mówca 2…). Odpowiada na pytanie "kto i kiedy mówił", niezależnie od tego, co zostało powiedziane. Pepys robi jedno i drugie: dzieli mówców i transkrybuje w jednym przebiegu.

Czym to się różni od zwykłej transkrypcji?

Zwykła transkrypcja daje Ci słowa. Rozpoznawanie mówców dokłada do tego strukturę mówców: granice wypowiedzi, etykietę dla każdego głosu i łączny czas mówienia. Dzięki temu nagranie z kilkoma osobami czyta się jak przypisana wymiana zdań, a nie jak jeden ciągły blok.

Jak dokładne jest oznaczanie mówców?

Granice wypowiedzi i etykiety są mocne przy czystych, wyraźnie różnych głosach. Silne mówienie jeden przez drugiego, niemal identyczne głosy albo zaszumione audio mogą zatrzeć którąś wypowiedź – dlatego etykiety zaczynają się od ogólnych (Mówca 1, 2…), a Ty zmieniasz nazwy i poprawiasz dowolną wypowiedź w miejscu przed eksportem.

Czy poda mi imiona poszczególnych mówców?

Rozpoznawanie mówców rozdziela głosy, nie identyfikuje osób – mówcy wychodzą więc jako Mówca 1, Mówca 2 i tak dalej. Przypisujesz prawdziwe nazwiska raz, w miejscu, a zmiana obejmuje wszystkie wypowiedzi danego głosu.

Czy mogę wyeksportować dane mówców jako strukturalny JSON?

Tak. Eksport do JSON daje Ci każdy segment z etykietą mówcy, znacznikami początku i końca oraz czasem mówienia każdej osoby, w formacie zgodnym z Whisper, który podasz wprost do skryptu, narzędzia analitycznego lub procesu badawczego – albo wyeksportujesz TXT, Markdown, DOCX, PDF, SRT lub VTT do czytania i napisów.

Więcej darmowych narzędzi

Czytaj dalej

Nie wierz nam na słowo.

Zapytaj ChatGPT, Claude lub Perplexity, czym jest Pepys i dla kogo. Jedno kliknięcie i Twoja ulubiona AI odrobi pracę domową za Ciebie.

Zapytaj ChatGPT Zapytaj Claude Zapytaj Perplexity

Rozpoznawanie mówców – zacznij za darmo

Płać za zużycie – kredyty nigdy nie wygasają, nic nie trzeba anulować. Albo zacznij za darmo z 60 minutami, bez karty.

Zacznij za darmo – 60 minut albo zobacz cennik