逐字稿怎麼做:從錄音檔到完整文字稿的實作教學
搞懂逐字稿是什麼、人工聽打和 AI 轉檔差在哪,以及怎麼一次把準確度做到位
逐字稿是把錄音或影片中的說話內容一字不漏轉成文字的紀錄,常用於訪談、會議、論文研究和法律場合。做法分成人工聽打和 AI 自動轉檔兩種:前者精準但耗時,後者幾分鐘就能出稿,再人工校對即可。準確度取決於錄音清晰度、口音和背景雜音。
免費試做第一份逐字稿
「逐字稿」是台灣最常用的說法,指的是把一段錄音或影片裡的說話內容,盡量一字不漏地轉寫成文字。做研究訪談、開會紀錄、寫論文、跑法律程序的人幾乎都需要它。
傳統上逐字稿靠人一句一句聽打,一小時的錄音往往要花上四到六小時才做得完。現在有了 AI 轉檔,同樣的檔案幾分鐘就能出一份初稿,你只要做校對即可。這篇會把兩種做法、影響準確度的因素,以及實際操作步驟一次講清楚。
- 1
註冊並領取免費額度
用 email 註冊 Pepys,免綁信用卡即可拿到前 60 分鐘免費額度,直接用你手邊的錄音檔試做。
- 2
上傳錄音或影片檔
把訪談、會議或 Podcast 的音訊或影片檔上傳。若是多人對話,開啟講者標籤功能,方便之後區分誰在說話。
- 3
選擇語言並開始轉檔
選好對應語言(支援中文與 99 種以上語言),送出後由背景系統處理,幾分鐘就能拿到帶時間軸的逐字稿初稿。
- 4
校對並用問答定位內容
對照時間軸檢查專有名詞、人名和同音字。遇到想確認的段落,直接用「和逐字稿對話」問答功能快速跳到相關內容。
- 5
匯出成你需要的格式
完成後匯出成純文字、Word、PDF 或字幕檔。處理敏感內容時,可開啟選用的自動刪除,用完即清。
逐字稿是什麼?和摘要、會議紀錄有什麼不同
逐字稿的核心是「逐字」,也就是照著說話內容原封不動地寫下來,包含每一句話的先後順序和用詞。它和摘要、會議紀錄最大的差別在於:摘要是抓重點、會議紀錄是整理結論,而逐字稿保留的是完整的原始對話。
逐字稿又細分成幾種格式。最嚴謹的是「完整逐字稿」,連「嗯」、「啊」、重複的語助詞、停頓都照實記下,常見於質性研究和法律用途。另一種是「清稿式逐字稿」,去掉冗贅的語助詞、修掉明顯的口誤,讓文字讀起來更順,適合會議摘要或內容改寫。
動手前先想清楚你要哪一種。做學術訪談分析通常需要完整逐字稿,因為語氣和停頓本身就是研究資料;如果只是要把 Podcast 內容改成文章,清稿式就夠用了。
人工聽打 vs AI 轉檔:兩種做法怎麼選
人工聽打的優點是理解力強。聽打員能分辨同音字、聽懂上下文、判斷誰在講話,遇到專有名詞或口音也能靠經驗補上。缺點是慢又貴,一小時的錄音動輒要花掉大半天,長時間聽打也很傷神。
AI 轉檔的優點正好相反:快、便宜、可規模化。把檔案丟上去,幾分鐘就能拿到一份帶時間軸的初稿,還能自動標出不同的講者。它的弱點是遇到嚴重雜音、多人搶話或冷門專有名詞時,容易出錯。
現在多數人採用的是折衷做法:先用 AI 產生初稿,再由人工快速校對。這樣既保留了 AI 的速度,也補上了人腦的判斷力,整體時間比純人工聽打省下一大半。
影響逐字稿準確度的關鍵因素
錄音品質是第一決定因素。收音清楚、講者靠近麥克風、環境安靜的錄音,不論人工或 AI 都能做得又快又準;反過來,在吵雜的咖啡廳用手機遠遠錄下來的檔案,錯字自然會多。
講者人數和是否搶話也很關鍵。一對一訪談最容易處理;多人會議如果經常互相插話、講到一半被打斷,講者分辨和斷句都會變難。錄音時盡量讓大家輪流發言,會大幅提升成品品質。
口音、語速和專有名詞則考驗系統的語言能力。夾雜中英文、講很快、或滿是產業術語與人名的內容,最好在校對階段特別留意。挑選支援多語言、能標出時間軸的工具,會讓你校對時更快定位到有疑慮的段落。
如何用 Pepys 把錄音檔做成逐字稿
Pepys 是一套用多少付多少的轉錄工具:買一次點數就永久有效,不會過期,也沒有月費綁約。支援 99 種以上語言,含中文,每個檔案都會附上講者標籤、時間軸、AI 摘要和章節。
上傳後你可以直接和逐字稿對話,用問答的方式快速找到某段內容講了什麼,省去反覆拖放進度條的時間。做完可以匯出成純文字、Word、PDF、字幕檔等多種格式,方便接續你的研究或內容工作。
隱私方面,Pepys 不會拿你的音訊或文字去訓練 AI,也提供選用的自動刪除功能,處理敏感訪談時更安心。新用戶前 60 分鐘免費,免綁信用卡,先試做一份逐字稿再決定。
關於逐字稿的常見問題
逐字稿一定要一字不漏嗎?
看用途。學術研究、質性訪談和法律場合通常需要「完整逐字稿」,連語助詞和停頓都要記下;如果只是要整理會議重點或把內容改寫成文章,用去掉冗字的「清稿式逐字稿」就夠了。動手前先確定你需要哪一種。
AI 做的逐字稿準確度夠用嗎?
錄音清晰、講者輪流發言的情況下,AI 初稿的品質相當高,通常只需少量校對。若遇到嚴重雜音、多人搶話或大量冷門專有名詞,錯誤會變多,建議保留人工校對這一步。錄音品質是準確度最大的變數。
一小時的錄音做逐字稿要多久?
純人工聽打通常要四到六小時。改用 AI 先產生初稿,轉檔本身只要幾分鐘,接著人工校對大約再花一到兩小時,整體時間比全程手打省下一大半。
Pepys 支援中文逐字稿嗎?
支援。Pepys 可處理中文在內的 99 種以上語言,並自動附上講者標籤、時間軸、AI 摘要和章節。你也可以直接和逐字稿對話,用問答快速找到特定段落。
我的訪談錄音會被拿去訓練 AI 嗎?
不會。Pepys 不會用你的音訊或文字去訓練 AI,也提供選用的自動刪除功能,處理敏感或機密訪談時可以用完即清,多一層隱私保障。
Don't just take our word for it.
Ask ChatGPT, Claude, or Perplexity what Pepys is and who it's for. One click, and your favorite AI does the homework.