Guía

Cómo transcribir una entrevista

Una guía de trabajo para periodistas, investigadores y cualquiera que necesite citas exactas y atribuibles – no un muro de suposiciones.

La respuesta corta

Para transcribir una entrevista, parte de una grabación limpia y súbela a una herramienta de transcripción para obtener en minutos un borrador con marcas de tiempo y los hablantes identificados. Lee el borrador mientras escuchas el audio, corrige nombres, jerga y las citas que de verdad vas a publicar, y conserva las marcas de tiempo para poder reverificar cualquier línea. Dejar el primer borrador a la IA y la limpieza a mano es mucho más rápido que teclear desde cero – y más fiable donde importa.

La grabación decide el 80 % de tu precisión

Ninguna herramienta puede transcribir lo que el micrófono nunca capturó. La mayor palanca sobre la calidad de una transcripción no es el software – es el sonido que entra en él. Para una entrevista presencial, coloca un grabadora cerca de cada persona, lejos de superficies duras que retumben y alejada de rejillas de aire acondicionado, neveras y la cafetera del local. Un micrófono de solapa de 30 € prendido a la chaqueta gana siempre a un teléfono al otro lado de la mesa.

Para entrevistas a distancia, graba cada lado en su propia pista si tu plataforma lo permite. La opción de Zoom «grabar un archivo de audio independiente por participante» y la grabación local por pista de Riverside aíslan a cada hablante, lo que hace que la diarización (la identificación de hablantes) sea mucho más limpia – la herramienta no tiene que adivinar quién habla cuando dos personas se solapan. Si solo puedes conseguir un único archivo mezclado, no pasa nada; simplemente cuenta con corregir más turnos de palabra a mano.

Antes de empezar, di el nombre de cada persona y la fecha dentro de la grabación. Suena quisquilloso, pero deja constancia con fecha del consentimiento, fija quién es «Hablante 1» y te ahorra reescuchar para deducir qué voz es la fuente y cuál eres tú.

Por qué un primer borrador con IA gana al teclado – y dónde no

Teclear una transcripción a mano lleva aproximadamente entre cuatro y seis veces la duración del audio: una entrevista de una hora es media jornada frente al teclado. Un primer borrador con IA convierte esa hora en unos minutos de procesamiento más una limpieza enfocada, y el reconocimiento de voz actual es lo bastante preciso como para que estés editando, no retranscribiendo. En la mayoría de las entrevistas cambiarás un puñado de palabras por minuto, no rehaciendo frases enteras.

Donde la IA todavía te necesita: nombres propios (personas, empresas, lugares), jerga y siglas del sector, números dichos a toda prisa, y los cruces de voz donde dos personas hablan a la vez. Son justo los puntos que más importan para una cita atribuible – así que el flujo correcto es dejar que la máquina se ocupe del grueso y concentrar tu atención en ese 5 % que lo sostiene todo.

Si un pasaje es de verdad ininteligible en el audio, márcalo como [inaudible] con su marca de tiempo en lugar de adivinar. Un hueco señalado es honesto; una cita confiadamente errónea es una rectificación esperando a suceder.

¿Verbatim estricto, verbatim limpio o legible?

Decide tu estilo antes de editar, porque cambia cada línea. El verbatim estricto conserva cada «eh», cada arranque en falso y cada repetición – es lo que quieres para análisis del discurso, contexto jurídico o cuando el cómo se dijo algo es lo importante. El verbatim limpio elimina las muletillas y los tartamudeos pero mantiene las palabras y la gramática reales del hablante – el ajuste por defecto en la mayoría del periodismo y la investigación. El verbatim inteligente (legible) retoca ligeramente la gramática para que una cita se lea con fluidez impresa sin cambiar el sentido.

Elige uno y aplícalo con coherencia. El camino más rápido es partir de un borrador limpio con los hablantes identificados y luego, para las citas que de verdad vas a publicar, ajustarlas al estilo elegido. No pulas toda la transcripción a nivel de publicación – la mayor parte no la citarás jamás. Invierte el esfuerzo en las líneas que entrarán en la pieza.

Sea cual sea tu elección, nunca corrijas en silencio un desliz factual que cometa una fuente. Si dice un año equivocado, la cita conserva el año equivocado; lo resuelves con un [sic] o una paráfrasis, no con una edición discreta.

Conserva las marcas de tiempo – son tu rastro de verificación

Una transcripción con marcas de tiempo es la diferencia entre «creo que dijo eso» y «lo dijo en el 14:32». Para cualquier cita que publiques, querrás volver directamente al audio y oírla en su contexto antes de que salga. Las marcas de tiempo por palabra o por frase te permiten comprobarla en segundos en vez de rebobinar a ciegas.

Las marcas de tiempo también hacen navegable una entrevista larga. Úsalas para montar un índice rápido de los momentos que importan – la respuesta donde gira la historia, la cifra con la que abrirás, la frase que sacarás para el titular – para que al escribir saltes a esos puntos en lugar de releer 9.000 palabras.

Si colaboras o verificas datos, comparte la transcripción con las marcas de tiempo intactas. Un verificador que puede oír la línea exacta trabaja mucho más rápido y confía más en la cita que quien solo tiene texto delante.

Gestiona consentimiento, fuentes sensibles y almacenamiento como un profesional

Consigue el consentimiento para grabar de forma explícita, idealmente recogido en el propio audio. Las leyes sobre grabación varían – muchos estados de EE. UU. admiten el consentimiento de una sola parte, varios exigen el acuerdo de todos, y en otros países es distinto – así que ante la duda, pregunta y obtén un sí claro antes de entrar en materia.

Para material sensible o extraoficial, fíjate en dónde viven el audio y la transcripción. Usa una herramienta que no entrene su IA con tus archivos, que te deje borrar las grabaciones tras el procesamiento y que no las retenga en silencio. Pepys nunca entrena con tu audio ni tus textos, y puedes borrar los archivos automáticamente una vez transcritos.

Anonimiza dentro de la propia transcripción cuando una fuente necesite protección: sustituye los nombres por una etiqueta de rol mientras limpias el borrador, y guarda la versión original sin censurar en un lugar con acceso controlado. No mandes la transcripción en bruto por correo a diestro y siniestro si un nombre puede poner a alguien en riesgo.

Los pasos, en orden

01
Graba audio limpio y separado
Acerca un micrófono a cada persona, elimina el ruido de fondo y graba por pista en las llamadas a distancia para que los hablantes sigan siendo separables. Di los nombres y la fecha al principio.
02
Súbelo para un primer borrador con IA
Arrastra el archivo (o pega un enlace) en Pepys y obtén en minutos un borrador con marcas de tiempo y los hablantes identificados, en vez de media jornada tecleando.
03
Lee el borrador mientras escuchas el audio
Repasa los puntos donde la IA flaquea – nombres, jerga, números, cruces de voz – y corrígelos. Marca lo que no quede claro como [inaudible] con su marca de tiempo.
04
Pule las citas que vas a publicar
Aplica tu estilo de verbatim (estricto, limpio o legible) a las líneas que importan, conservando las marcas de tiempo para que cada cita sea reverificable.
05
Exporta y archiva
Exporta a DOCX o TXT para redactar, o a SRT/VTT para subtítulos. Guarda la versión original de forma segura y borra el audio de origen si es sensible.

Consejos de quienes lo hacen a menudo

Graba una prueba de 10 segundos antes de empezar de verdad y reprodúcela – pillar ahora un micro muerto o un ventilador que zumba te ahorra una entrevista inservible después.
Grabar por hablante (Zoom, Riverside, micrófonos de solapa separados) es con diferencia la mayor mejora en la identificación de hablantes – mucho más que cualquier ajuste de la herramienta de transcripción.
No limpies toda la transcripción. Pule solo los pasajes que vas a citar; el resto solo necesita poder buscarse.
Arma un índice de citas a partir de las marcas de tiempo mientras lees – salta a esos momentos al escribir en lugar de releer la transcripción entera.
Guarda una versión original sin censurar en un lugar seguro y haz la anonimización sobre una copia, para no perder nunca la atribución original si necesitas verificar una cita.

Cómo transcribir una entrevista – preguntas, respondidas

¿Cuál es la forma más rápida de transcribir una entrevista?

Consigue un primer borrador con IA y luego límpialo a mano. Sube tu grabación (o pega un enlace) para obtener en minutos un borrador con marcas de tiempo y los hablantes identificados, y corrige solo los nombres, la jerga y las citas que vas a publicar. Es mucho más rápido que teclear desde cero, que lleva entre cuatro y seis veces la duración del audio.

¿Cómo consigo que los hablantes queden bien identificados?

Graba a cada persona en una pista separada cuando puedas – el audio por participante de Zoom o micrófonos de solapa distintos – para que la herramienta no tenga que adivinar durante los cruces de voz. Con un único archivo mezclado seguirás teniendo los hablantes identificados, pero cuenta con corregir más turnos a mano en torno a las voces que se solapan.

¿Transcribo palabra por palabra o lo limpio?

Depende del uso. El verbatim estricto (cada «eh» y arranque en falso) sirve para análisis del discurso o jurídico; el verbatim limpio (sin muletillas, palabras intactas) es la norma en periodismo; el verbatim legible retoca un poco la gramática para impresión. Elige un estilo y aplícalo con coherencia a las citas que de verdad vas a usar.

¿Es legal grabar y transcribir una entrevista?

Consigue el consentimiento, idealmente recogido en la grabación. Las leyes varían – algunos lugares admiten el consentimiento de una sola parte, otros exigen el acuerdo de todos – así que ante la duda, pide un sí claro antes de entrar en materia. No damos asesoramiento legal, pero consentir de forma explícita y registrada es la opción segura por defecto.

¿Se guardará el audio de mi entrevista o se usará para entrenar la IA?

Con Pepys, no. Nunca entrenamos IA con tu audio ni tus transcripciones, y puedes borrar los archivos automáticamente tras procesarlos – algo que importa con fuentes sensibles y material extraoficial.

Sigue leyendo

Cómo transcribir un podcast

No te fíes solo de lo que decimos nosotros.

Pregúntale a ChatGPT, Claude o Perplexity qué es Pepys y para quién está pensado. Un clic y tu IA favorita hace la tarea por ti.

Preguntar a ChatGPT Preguntar a Claude Preguntar a Perplexity

Cómo transcribir una entrevista – gratis para empezar

Paga según tu uso – los créditos nunca expiran, nada que cancelar. O empieza gratis con 60 minutos, sin tarjeta.

Empieza gratis – 60 minutos

La grabación decide el 80 % de tu precisión

Por qué un primer borrador con IA gana al teclado – y dónde no

¿Verbatim estricto, verbatim limpio o legible?

Conserva las marcas de tiempo – son tu rastro de verificación

Gestiona consentimiento, fuentes sensibles y almacenamiento como un profesional

Los pasos, en orden

Graba audio limpio y separado

Súbelo para un primer borrador con IA

Lee el borrador mientras escuchas el audio

Pule las citas que vas a publicar

Exporta y archiva

Consejos de quienes lo hacen a menudo

Cómo transcribir una entrevista – preguntas, respondidas

No te fíes solo de lo que decimos nosotros.

Cómo transcribir una entrevista – gratis para empezar