La grabación decide el 80 % de tu precisión
Ninguna herramienta puede transcribir lo que el micrófono nunca capturó. La mayor palanca sobre la calidad de una transcripción no es el software – es el sonido que entra en él. Para una entrevista presencial, coloca un grabadora cerca de cada persona, lejos de superficies duras que retumben y alejada de rejillas de aire acondicionado, neveras y la cafetera del local. Un micrófono de solapa de 30 € prendido a la chaqueta gana siempre a un teléfono al otro lado de la mesa.
Para entrevistas a distancia, graba cada lado en su propia pista si tu plataforma lo permite. La opción de Zoom «grabar un archivo de audio independiente por participante» y la grabación local por pista de Riverside aíslan a cada hablante, lo que hace que la diarización (la identificación de hablantes) sea mucho más limpia – la herramienta no tiene que adivinar quién habla cuando dos personas se solapan. Si solo puedes conseguir un único archivo mezclado, no pasa nada; simplemente cuenta con corregir más turnos de palabra a mano.
Antes de empezar, di el nombre de cada persona y la fecha dentro de la grabación. Suena quisquilloso, pero deja constancia con fecha del consentimiento, fija quién es «Hablante 1» y te ahorra reescuchar para deducir qué voz es la fuente y cuál eres tú.
Por qué un primer borrador con IA gana al teclado – y dónde no
Teclear una transcripción a mano lleva aproximadamente entre cuatro y seis veces la duración del audio: una entrevista de una hora es media jornada frente al teclado. Un primer borrador con IA convierte esa hora en unos minutos de procesamiento más una limpieza enfocada, y el reconocimiento de voz actual es lo bastante preciso como para que estés editando, no retranscribiendo. En la mayoría de las entrevistas cambiarás un puñado de palabras por minuto, no rehaciendo frases enteras.
Donde la IA todavía te necesita: nombres propios (personas, empresas, lugares), jerga y siglas del sector, números dichos a toda prisa, y los cruces de voz donde dos personas hablan a la vez. Son justo los puntos que más importan para una cita atribuible – así que el flujo correcto es dejar que la máquina se ocupe del grueso y concentrar tu atención en ese 5 % que lo sostiene todo.
Si un pasaje es de verdad ininteligible en el audio, márcalo como [inaudible] con su marca de tiempo en lugar de adivinar. Un hueco señalado es honesto; una cita confiadamente errónea es una rectificación esperando a suceder.
¿Verbatim estricto, verbatim limpio o legible?
Decide tu estilo antes de editar, porque cambia cada línea. El verbatim estricto conserva cada «eh», cada arranque en falso y cada repetición – es lo que quieres para análisis del discurso, contexto jurídico o cuando el cómo se dijo algo es lo importante. El verbatim limpio elimina las muletillas y los tartamudeos pero mantiene las palabras y la gramática reales del hablante – el ajuste por defecto en la mayoría del periodismo y la investigación. El verbatim inteligente (legible) retoca ligeramente la gramática para que una cita se lea con fluidez impresa sin cambiar el sentido.
Elige uno y aplícalo con coherencia. El camino más rápido es partir de un borrador limpio con los hablantes identificados y luego, para las citas que de verdad vas a publicar, ajustarlas al estilo elegido. No pulas toda la transcripción a nivel de publicación – la mayor parte no la citarás jamás. Invierte el esfuerzo en las líneas que entrarán en la pieza.
Sea cual sea tu elección, nunca corrijas en silencio un desliz factual que cometa una fuente. Si dice un año equivocado, la cita conserva el año equivocado; lo resuelves con un [sic] o una paráfrasis, no con una edición discreta.
Conserva las marcas de tiempo – son tu rastro de verificación
Una transcripción con marcas de tiempo es la diferencia entre «creo que dijo eso» y «lo dijo en el 14:32». Para cualquier cita que publiques, querrás volver directamente al audio y oírla en su contexto antes de que salga. Las marcas de tiempo por palabra o por frase te permiten comprobarla en segundos en vez de rebobinar a ciegas.
Las marcas de tiempo también hacen navegable una entrevista larga. Úsalas para montar un índice rápido de los momentos que importan – la respuesta donde gira la historia, la cifra con la que abrirás, la frase que sacarás para el titular – para que al escribir saltes a esos puntos en lugar de releer 9.000 palabras.
Si colaboras o verificas datos, comparte la transcripción con las marcas de tiempo intactas. Un verificador que puede oír la línea exacta trabaja mucho más rápido y confía más en la cita que quien solo tiene texto delante.
Gestiona consentimiento, fuentes sensibles y almacenamiento como un profesional
Consigue el consentimiento para grabar de forma explícita, idealmente recogido en el propio audio. Las leyes sobre grabación varían – muchos estados de EE. UU. admiten el consentimiento de una sola parte, varios exigen el acuerdo de todos, y en otros países es distinto – así que ante la duda, pregunta y obtén un sí claro antes de entrar en materia.
Para material sensible o extraoficial, fíjate en dónde viven el audio y la transcripción. Usa una herramienta que no entrene su IA con tus archivos, que te deje borrar las grabaciones tras el procesamiento y que no las retenga en silencio. Pepys nunca entrena con tu audio ni tus textos, y puedes borrar los archivos automáticamente una vez transcritos.
Anonimiza dentro de la propia transcripción cuando una fuente necesite protección: sustituye los nombres por una etiqueta de rol mientras limpias el borrador, y guarda la versión original sin censurar en un lugar con acceso controlado. No mandes la transcripción en bruto por correo a diestro y siniestro si un nombre puede poner a alguien en riesgo.