Rekaman menentukan 80% akurasi Anda
Tidak ada alat yang bisa mentranskripsi suara yang tak pernah ditangkap mikrofon. Faktor terbesar untuk kualitas transkrip bukanlah perangkat lunaknya, melainkan audio yang masuk ke dalamnya. Untuk wawancara tatap muka, taruh perekam dekat dengan tiap pembicara, jauh dari permukaan keras yang menggema, dan jauh dari ventilasi AC, kulkas, serta mesin espresso kafe. Mikrofon klip seharga ratusan ribu yang dijepit di kerah selalu mengalahkan ponsel yang ditaruh di seberang meja.
Untuk wawancara jarak jauh, rekam tiap pihak di kanalnya sendiri jika platform Anda mengizinkan. Fitur Zoom "record a separate audio file for each participant" dan rekaman per-track lokal Riverside sama-sama memberi Anda suara pembicara yang terpisah, sehingga diarisasi (pelabelan pembicara) jadi jauh lebih bersih – alatnya tidak perlu menebak siapa yang bicara saat dua orang saling menimpa. Kalau Anda hanya bisa mendapat satu berkas campuran, itu tidak masalah; cukup siapkan diri untuk memperbaiki lebih banyak pergantian pembicara secara manual.
Sebelum mulai, sebutkan nama tiap orang dan tanggalnya ke dalam rekaman. Terdengar rewel, tapi ini memberi stempel waktu pada persetujuan, mengunci siapa 'Pembicara 1', dan menghemat waktu Anda mendengarkan ulang untuk membedakan mana suara narasumber dan mana suara Anda sendiri.
Kenapa pass pertama AI mengalahkan mengetik – dan di mana ia tidak
Mengetik transkrip dengan tangan butuh waktu kira-kira empat sampai enam kali durasi audionya: wawancara satu jam berarti setengah hari di depan keyboard. Pass pertama AI mengubah satu jam itu menjadi pemrosesan beberapa menit ditambah penyisiran yang terfokus, dan speech-to-text modern sudah cukup akurat sehingga Anda menyunting, bukan menranskripsi ulang. Untuk kebanyakan wawancara, Anda hanya mengubah segelintir kata per menit, bukan membangun ulang kalimat.
Di mana AI masih butuh Anda: kata benda khusus (nama orang, perusahaan, nama tempat), istilah teknis dan akronim, angka yang diucapkan cepat, serta tabrakan suara saat dua orang bicara bersamaan. Justru di titik-titik inilah yang paling penting untuk kutipan yang bisa dipertanggungjawabkan – jadi alur kerja yang tepat adalah membiarkan mesin menangani bagian besarnya dan memusatkan perhatian Anda pada 5% yang menanggung beban.
Kalau sebuah bagian memang benar-benar tidak jelas di audio, tandai [inaudible] beserta stempel waktunya alih-alih menebak. Celah yang ditandai itu jujur; kutipan yang salah tapi diucapkan penuh percaya diri adalah ralat yang tinggal menunggu waktu.
Verbatim ketat, verbatim bersih, atau enak dibaca?
Tentukan gaya Anda sebelum menyunting, karena ini memengaruhi tiap baris. Verbatim ketat mempertahankan setiap 'em', kalimat yang batal, dan pengulangan – inilah yang Anda butuhkan untuk analisis wacana, konteks hukum, atau saat cara sesuatu diucapkan adalah intinya. Verbatim bersih membuang kata sisipan dan gagap tapi mempertahankan kata dan tata bahasa asli pembicara – pilihan default untuk sebagian besar jurnalisme dan penelitian. Verbatim cerdas (enak dibaca) sedikit merapikan tata bahasa supaya kutipan mengalir mulus saat dicetak tanpa mengubah makna.
Pilih satu dan terapkan secara konsisten. Jalur tercepat adalah mulai dari draf yang bersih dan berlabel pembicara, lalu, khusus untuk kutipan yang benar-benar akan Anda terbitkan, kencangkan ke gaya yang Anda pilih. Jangan memoles seluruh transkrip hingga kualitas siap terbit – sebagian besar isinya tidak akan pernah Anda kutip. Curahkan tenaga pada baris-baris yang masuk ke tulisan.
Apa pun yang Anda pilih, jangan diam-diam membetulkan kekeliruan fakta yang dibuat narasumber. Kalau ia salah menyebut tahun, kutipannya tetap memuat tahun yang salah; Anda menanganinya dengan [sic] atau parafrasa, bukan suntingan senyap.
Simpan stempel waktu – itu jejak audit Anda
Transkrip berstempel waktu adalah pembeda antara 'sepertinya dia bilang begitu' dan 'dia mengatakannya pada 14:32'. Untuk tiap kutipan yang Anda terbitkan, Anda ingin bisa langsung melompat kembali ke audio dan mendengarnya dalam konteks sebelum dipublikasikan. Stempel waktu pada level kata atau kalimat memungkinkan Anda mengecek dalam hitungan detik, bukan menggeser-geser rekaman.
Stempel waktu juga membuat wawancara panjang mudah dinavigasi. Pakai untuk menyusun indeks cepat momen-momen penting – jawaban di mana ceritanya berbelok, angka yang akan Anda jadikan pembuka, baris yang akan Anda tarik untuk judul – sehingga saat menulis Anda melompat ke titik-titik itu, bukan membaca ulang 9.000 kata.
Kalau Anda berkolaborasi atau melakukan fact-check, bagikan transkrip dengan stempel waktu tetap utuh. Pemeriksa fakta yang bisa mendengar baris persisnya bekerja jauh lebih cepat dan lebih memercayai kutipannya dibanding yang hanya menatap teks.
Tangani persetujuan, narasumber sensitif, dan penyimpanan secara profesional
Dapatkan persetujuan untuk merekam secara on the record, idealnya terekam di audio itu sendiri. Aturan perekaman berbeda-beda – banyak negara bagian AS menganut persetujuan satu pihak, beberapa mengharuskan semua pihak setuju, dan negara lain punya aturan berbeda – jadi kalau ragu, tanyakan dan dapatkan 'ya' yang jelas sebelum bagian inti dimulai.
Untuk materi sensitif atau off the record, perhatikan di mana audio dan transkrip disimpan. Gunakan alat yang tidak melatih AI dengan berkas Anda, memungkinkan Anda menghapus rekaman setelah diproses, dan tidak diam-diam menyimpannya. Pepys tidak pernah melatih model dengan audio atau teks Anda, dan Anda bisa menghapus berkas secara otomatis setelah ditranskripsi.
Anonimkan langsung di transkripnya saat narasumber perlu dilindungi: ganti nama dengan label peran saat Anda merapikan draf, dan simpan master yang belum disensor di tempat yang aksesnya terkontrol. Jangan mengirim-kirim transkrip mentah lewat email kalau sebuah nama bisa membahayakan seseorang.