Pepys
12,438,517minutos transcritos

Transcreva e identifique quem falou o quê

Descubra quem disse o quê – envie um arquivo ou cole um link e receba a transcrição separada por participante, com a marca de cada fala e o tempo de fala de cada voz.

ou cole um link
InstagramTikTokYouTubeFacebookSpotifyApple Podcasts

Aceita MP3, M4A, WAV, MP4 e outros arquivos de áudio ou vídeo – ou um link · entrega uma transcrição de quem disse o quê, com rótulos por voz, horários de cada fala e tempo de fala.

Os rótulos vêm da separação das vozes, não da identidade – o Pepys marca cada voz distinta como Pessoa 1, Pessoa 2 e assim por diante. Ele não reconhece ninguém pelo nome nem pela impressão vocal; é você quem renomeia os rótulos com os nomes reais.

60 min grátis · sem cartão · nunca treinamos com o seu áudio

PodcasterJournalistContent creatorResearcherStudent
Usado por mais de 100k pessoasNota 4.9 de 5 por mais de 100k usuários

O que é a identificação de quem falou em uma gravação?

O Pepys identifica quem falou em cada trecho da sua gravação: separa o áudio por voz, rotula cada fala (Pessoa 1, Pessoa 2…) e mostra o tempo de fala de cada participante. Envie um arquivo ou cole um link e receba uma transcrição de quem disse o quê, com horários em minutos e em mais de 99 idiomas detectados automaticamente. Seus primeiros 60 minutos são grátis, sem cartão.

Como o identificação de quem falou na transcrição funciona

01

Envie o áudio ou cole um link

Solte uma gravação com várias pessoas ou cole um link – qualquer formato, qualquer idioma.

02

Receba a fala separada por voz

O Pepys separa o áudio por voz e rotula cada fala, com horários que marcam onde cada participante começa e termina.

03

Renomeie, confira e exporte

Troque os rótulos genéricos por nomes reais, confira as falas com o áudio e exporte em TXT, Markdown, DOCX, PDF, SRT, VTT ou JSON estruturado.

Identificar quem falou responde a uma pergunta que uma transcrição corrida não responde: quem está falando, e quando? O Pepys divide a gravação em falas por participante – Pessoa 1, Pessoa 2 e assim por diante – para que uma entrevista, uma mesa-redonda, um grupo focal ou um podcast com dois apresentadores fique como um diálogo limpo, e não um bloco único de texto. Cada fala traz o horário de início e de fim, e você ainda recebe o tempo de fala por voz para as perguntas que vêm depois: quem dominou, quem quase não falou, onde houve as trocas de turno.

É feito para quem precisa saber quem disse o quê – pesquisadores que codificam entrevistas qualitativas, jornalistas que atribuem citações, devs que enviam as falas para uma ferramenta de ata ou de análise. Os rótulos são seus para renomear na hora (Pessoa 2 vira "Dra. Okafor"), e cada fala é exportada como JSON estruturado – cada trecho com sua voz, horários de início e fim e o tempo de fala por participante – ou como uma transcrição limpa com cada voz identificada. Nunca treinamos com o seu áudio, e os créditos nunca expiram.

Parágrafos limpos. Chega de "é", "tipo" e "né".

À esquerda está o que o Pepys devolve – parágrafos lógicos, com as muletas removidas, pontuados e fáceis de ler. À direita está o despejo bruto, uma linha por trecho, que a maioria dos transcritores deixa para você.

reel-voiceover.mp4

então tipo todo mundo fica te falando pra você começar com a sua melhor frase mas assim sinceramente se você entrega a resposta inteira no primeiro segundo sabe não tem basicamente motivo nenhum pra pessoa continuar assistindo então o gancho não é tipo a coisa mais inteligente que você fala é tipo um loop que você abre e que a pessoa precisa fechar e assim é essa parte que de fato segura a galera ali

Bruto
AntesDepois
  • Falas de quem disse o quê com horário de início/fim e tempo de fala por participante

  • Renomeie os rótulos genéricos com nomes reais na hora – sem precisar refazer nada

  • Exportação em JSON estruturado – trechos, rótulos de voz, horários e tempo de fala para o seu fluxo de trabalho

  • Mais de 99 idiomas, detectados automaticamente · nunca treinamos com o seu áudio · os créditos nunca expiram

Funciona com as plataformas que você usa todo dia.

Cole um link do YouTube, TikTok, Instagram, Facebook, Spotify ou Apple Podcasts – ou solte qualquer arquivo de áudio ou vídeo. Transcrevemos uma vez e você exporta do jeito que o seu fluxo de trabalho pedir.

  • YouTubeYouTube
  • TikTokTikTok
  • InstagramInstagram
  • FacebookFacebook
  • SpotifySpotify
  • Apple PodcastsApple Podcasts
  • ou qualquer arquivo

Exporte para qualquer formato

  • TXT
  • Markdown
  • DOCX
  • PDF
  • SRT
  • VTT
  • JSON

Marcações de tempo, identificação de quem fala e a sincronia das legendas vêm junto em cada exportação.

Identificação de quem falou na transcrição – perguntas, respondidas

O que é a identificação de quem falou em uma gravação?

É o processo de dividir uma gravação por quem está falando – separando o áudio em falas e rotulando cada uma (Pessoa 1, Pessoa 2…). Responde "quem falou e quando", separado de "o que foi dito". O Pepys faz as duas coisas: identifica as vozes e transcreve em uma só etapa.

Qual é a diferença para uma transcrição comum?

Uma transcrição comum entrega as palavras. A identificação de quem falou acrescenta a estrutura por participante: os limites de cada fala, um rótulo por voz e o tempo de fala total. Assim, uma gravação com várias pessoas fica como um diálogo atribuído, e não um bloco contínuo.

Os rótulos das vozes são precisos?

Os limites das falas e os rótulos ficam bem definidos em vozes nítidas e distintas. Falas sobrepostas, vozes muito parecidas ou áudio ruidoso podem confundir uma fala ou outra – por isso os rótulos começam genéricos (Pessoa 1, 2…) e você renomeia e corrige qualquer fala na hora antes de exportar.

A ferramenta diz o nome de cada participante?

A identificação separa as vozes, mas não reconhece identidades – então os participantes saem como Pessoa 1, Pessoa 2 e assim por diante. Você atribui os nomes reais uma vez, na hora, e a troca vale para todas as falas daquela voz.

Posso exportar os dados das vozes em JSON estruturado?

Sim. A exportação em JSON traz cada trecho com seu rótulo de voz, horários de início e fim e o tempo de fala por participante, em um formato compatível com Whisper que você pode usar direto em um script, em uma ferramenta de análise ou em um fluxo de pesquisa – ou exporte em TXT, Markdown, DOCX, PDF, SRT ou VTT para leitura humana e legendas.

Mais ferramentas grátis

Continue lendo

Identificação de quem falou na transcrição – grátis para começar

Pague conforme usa – os créditos nunca expiram, nada para cancelar. Ou comece de graça com 60 minutos, sem cartão.