ガイド

インタビューの文字起こし方法

記者、研究者、そして正確で出典をたどれる引用が必要なすべての人のための実践ガイド – 当て推量の山ではなく。

手短に言うと

インタビューを文字起こしするには、まずきれいな録音から始め、それを文字起こしツールにアップロードして、数分で話者ラベルとタイムスタンプ付きの下書きを得ます。下書きを音声と照らし合わせながら読み、名前、専門用語、そして実際に公開する引用を修正し、どの行も後から確認できるようタイムスタンプは残しておきます。最初の一巡をAIに任せ、仕上げを手作業で行うやり方は、ゼロから入力するよりはるかに速く – 肝心なところではより正確です。

精度の8割は録音で決まる

マイクが拾わなかった音は、どんなツールでも文字起こしできません。文字起こしの品質を最も大きく左右するのはソフトではなく、入ってくる音声そのものです。対面のインタビューなら、レコーダーを各話者の近くに置き、反響する硬い面から離し、空調の吹き出し口や冷蔵庫、カフェのエスプレッソマシンからも遠ざけます。襟元に留めた3,000円のラベリアマイクは、テーブルの向こうに置いたスマホに毎回勝ちます。

リモートのインタビューでは、プラットフォームが許すなら各話者をそれぞれ別チャンネルで録音します。Zoomの「参加者ごとに別々の音声ファイルを録音する」設定やRiversideのローカルでのトラック別録音は、どちらも話者を分離して記録してくれるので、ダイアライゼーション(話者ラベル付け)が格段にきれいになります – 2人の声が重なっても、ツールが誰の発言かを当てずっぽうで判断せずに済むからです。混ざった1ファイルしか得られなくても問題ありません。ただ、話者の切り替わりを手作業で直す回数が増えると見込んでおきましょう。

始める前に、各人の名前と日付を録音に吹き込んでおきます。大げさに聞こえますが、これで同意の時刻が記録され、「話者1」が誰なのかが固定され、どちらの声が情報源でどちらが自分なのかを確かめるために聴き直す手間が省けます。

AIの一巡目が入力に勝つ理由 – そして勝てない場面

手作業で文字起こしすると、おおよそ音声の長さの4〜6倍かかります。1時間のインタビューなら半日キーボードに向かう計算です。AIの一巡目はその1時間を数分の処理と的を絞った仕上げに変え、いまの音声認識は再文字起こしではなく編集で済むほど正確です。たいていのインタビューでは、文を組み直すのではなく1分あたり数語を直す程度になります。

それでもAIに人手が要る場面があります。固有名詞(人名、社名、地名)、業界の専門用語や略語、早口で言われた数字、そして2人が同時に話すクロストークです。これらはまさに、出典をたどれる引用にとって最も重要な箇所 – だから正しい進め方は、大半は機械に任せ、土台となる5%に自分の注意を注ぐことです。

音声の中でどうしても聞き取れない箇所があれば、推測で埋めるのではなく、タイムスタンプを添えて[聞き取り不能]と記します。印を付けた空白は誠実ですが、自信たっぷりの誤った引用は訂正を待っているようなものです。

完全逐語、クリーン逐語、それとも読みやすさ重視?

編集する前にスタイルを決めましょう。これがすべての行を左右するからです。完全逐語(ストリクト)はすべての「えーと」、言い直し、繰り返しを残します – 談話分析や法的な文脈、あるいは「どう言ったか」が肝心なときに使うものです。クリーン逐語はつなぎ言葉やどもりを落としつつ、話者が実際に使った言葉と文法は残します – 多くのジャーナリズムや研究での標準です。インテリジェント(読みやすい)逐語は、意味を変えずに文法を軽く整え、印刷物で引用がなめらかに読めるようにします。

一つを選んで一貫して適用します。最速の道は、きれいで話者ラベル付きの下書きから始め、実際に公開する引用についてだけ、選んだスタイルに整えることです。文字起こし全体を公開水準まで磨こうとしないこと – そのほとんどは引用されません。記事に入る行に労力を注ぎましょう。

どれを選んでも、情報源が口にした事実の誤りをこっそり直してはいけません。間違った年を言ったなら、引用はその間違った年のまま残し、[ママ]や言い換えで対応します。黙って手を入れてはいけません。

タイムスタンプを残す – それがあなたの監査証跡

タイムスタンプ付きの文字起こしは、「彼女はそう言ったと思う」と「彼女は14:32にそう言った」の違いです。公開するどの引用についても、出す前に音声へ一気に戻り、文脈の中で聞き直したいはずです。単語単位や文単位のタイムスタンプがあれば、巻き戻して探す代わりに数秒で確認できます。

タイムスタンプは長いインタビューを辿りやすくもします。重要な瞬間 – 話が転換する答え、冒頭に持ってくる数字、見出しに抜き出す一言 – の簡単な索引を作っておけば、執筆時に9,000語を読み返すのではなく、その地点へ飛べます。

共同作業やファクトチェックをするなら、タイムスタンプを保ったまま文字起こしを共有します。その行を正確に聞けるファクトチェッカーは、テキストだけを見つめる人よりはるかに速く動き、引用をより信頼します。

同意、デリケートな情報源、保管をプロのように扱う

録音の同意は記録に残る形で得ましょう。理想は音声そのものに収めることです。録音に関する法律はさまざまで – 米国の多くの州は一方当事者の同意で足り、いくつかの州は全員の合意を求め、他国はまた異なります – 迷ったら、本題に入る前に尋ね、はっきりした「はい」をもらいましょう。

デリケートな、あるいはオフレコの素材については、音声と文字起こしがどこに置かれるかに気を配ります。あなたのファイルでAIを学習させず、処理後に録音を削除でき、こっそり保持しないツールを使いましょう。Pepysはあなたの音声やテキストで学習することは決してなく、文字起こしが終わったファイルは自動削除できます。

情報源を守る必要があるときは、文字起こしそのものの中で匿名化します。下書きを整えるときに名前を役割のラベルに置き換え、伏せていないマスターはアクセス制御された場所に保管します。名前によって誰かが危険にさらされかねないなら、生の文字起こしをメールであちこちに回さないこと。

手順（順番どおり）

01
きれいで分離した音声を録る
各話者の近くにマイクを置き、背景ノイズを抑え、リモート通話ではチャンネルごとに録音して話者を分離できるようにします。冒頭で名前と日付を吹き込みます。
02
アップロードしてAIの一巡目を得る
ファイルをPepysにドロップする(またはリンクを貼る)と、半日の入力ではなく数分で話者ラベルとタイムスタンプ付きの下書きが手に入ります。
03
下書きを音声と照らし合わせて読む
AIが苦手な箇所 – 名前、専門用語、数字、クロストーク – にざっと目を通して直します。聞き取れないものはタイムスタンプを添えて[聞き取り不能]と記します。
04
公開する引用を整える
肝心な行に逐語スタイル(完全、クリーン、読みやすさ重視)を適用し、どの引用も後から確認できるようタイムスタンプを残します。
05
書き出して保管する
執筆用にはDOCXやTXT、字幕用にはSRT/VTTへ書き出します。マスターは安全に保管し、デリケートなら元の音声は削除します。

使い込んでいる人たちのコツ

本番の前に10秒のテスト録音をして再生しましょう – マイクの不調や送風機のうなりを今つかまえておけば、使い物にならないインタビューを後で抱えずに済みます。
話者別の録音(Zoom、Riverside、別々のラベリアマイク)は、話者ラベル付けへの最大の改善です – 文字起こしツールのどんな設定よりも効きます。
文字起こし全体を整えないこと。引用する箇所だけを磨き、残りは検索できれば十分です。
読みながらタイムスタンプから引用の索引を作りましょう – 執筆中は全文を読み返さず、その瞬間へ飛びます。
伏せていないマスターを安全な場所に残し、匿名化はコピーで行いましょう。そうすれば、引用を確認する必要が出たときに元の出典情報を失いません。

インタビュー文字起こし – よくある質問

インタビューを文字起こしする最速の方法は?

AIの一巡目を得てから手作業で整えることです。録音をアップロードする(またはリンクを貼る)と数分で話者ラベルとタイムスタンプ付きの下書きが得られ、あとは名前、専門用語、公開する引用だけを直します。ゼロから入力するよりはるかに速く、入力は音声の長さの4〜6倍かかります。

正確な話者ラベルを得るには?

できる場所では各話者を別チャンネルで録音します – Zoomの参加者ごとの音声や別々のラベリアマイクなど – こうすればクロストーク中にツールが当て推量せずに済みます。混ざった1ファイルでも話者ラベルは付きますが、発言の重なりまわりで手作業の修正が増えると見込んでください。

一字一句そのまま書くべき?それとも整えるべき?

用途次第です。完全逐語(すべての「えーと」や言い直しを残す)は談話や法的な分析に向き、クリーン逐語(つなぎ言葉を除き、言葉はそのまま)はジャーナリズムの標準、読みやすい逐語は印刷物向けに文法を軽く整えます。一つのスタイルを選び、実際に使う引用に一貫して適用しましょう。

インタビューを録音して文字起こしするのは合法?

同意を得ましょう。理想は録音に収めることです。法律はさまざまで – 一方当事者の同意で足りる地域もあれば、全員の合意を求める地域もあります – 不安なときは、本題に入る前にはっきりした「はい」を求めましょう。法的助言はできませんが、記録に残る形で同意を得るのが安全な既定です。

私のインタビュー音声は保持されたり、AIの学習に使われたりする?

Pepysではされません。私たちはあなたの音声や文字起こしでAIを学習させることは決してなく、処理後にファイルを自動削除できます – これはデリケートな情報源やオフレコの素材にとって重要です。

ポッドキャスト文字起こし

私たちの言葉だけを鵜呑みにしないでください。

Pepysがどんなサービスで、誰のためのものか、ChatGPTやClaude、Perplexityに聞いてみてください。ワンクリックで、お気に入りのAIが代わりに調べてくれます。

ChatGPTに聞く Claudeに聞く Perplexityに聞く

インタビュー文字起こし – 無料で始められます

使った分だけのお支払い。クレジットは無期限で、解約も不要です。または60分の無料分から、カード登録なしで始められます。

無料で始める – 60分

精度の8割は録音で決まる

AIの一巡目が入力に勝つ理由 – そして勝てない場面

完全逐語、クリーン逐語、それとも読みやすさ重視?

タイムスタンプを残す – それがあなたの監査証跡

同意、デリケートな情報源、保管をプロのように扱う

手順（順番どおり）

きれいで分離した音声を録る

アップロードしてAIの一巡目を得る

下書きを音声と照らし合わせて読む

公開する引用を整える

書き出して保管する

使い込んでいる人たちのコツ

インタビュー 文字起こし – よくある質問

私たちの言葉だけを鵜呑みにしないでください。

インタビュー 文字起こし – 無料で始められます

インタビュー文字起こし – よくある質問

インタビュー文字起こし – 無料で始められます