Pepys

影片字幕:從影片自動生成 SRT 字幕檔的完整做法

上傳一支影片,就能拿到帶時間軸的字幕檔,方便無障礙觀看、社群轉發與二次利用。

要替影片加上字幕,最快的方式是把影片檔上傳到語音辨識工具,讓它自動把對白轉成帶時間碼的逐字稿,再匯出成 SRT 或 VTT 字幕檔。用 Pepys 只要上傳影片,系統會自動辨識語音、標記時間軸與講者,你稍微校對後即可下載字幕,直接套用到 YouTube、剪輯軟體或社群平台。

免費生成影片字幕

or paste a link
InstagramTikTokYouTubeFacebookSpotifyApple Podcasts

現在超過八成的人在手機上是「靜音」滑影片的,沒有字幕,你的內容大概三秒就被滑掉。字幕不只是給聽障朋友的無障礙功能,更是讓觀眾在通勤、在辦公室、在半夜不吵到人的情況下,還願意把影片看完的關鍵。

問題是,手動一句一句聽打、再對時間軸,一支十分鐘的影片可能要磨上一兩個鐘頭。這篇會帶你用語音辨識,把「聽打字幕」變成「校對字幕」,並說明 SRT 字幕檔到底是什麼、怎麼把同一份字幕變成部落格文章、社群短片與搜尋引擎看得懂的內容。

  1. 1

    上傳你的影片

    登入 Pepys 後直接把影片檔拖進去,或貼上影片連結。常見的 MP4、MOV 等格式都支援,系統會自動抽出音軌,你不用先另外轉成音檔。

  2. 2

    選擇語言並開始辨識

    確認影片的主要語言(支援 99 種以上語言與中英夾雜的情況),送出後由背景自動處理,你可以關掉分頁去忙別的,不必守在畫面前。

  3. 3

    檢視帶時間碼的逐字稿

    處理完成後,你會看到一份逐句對齊時間軸的逐字稿,並附上講者標記,多人對談時能清楚分辨誰說了哪句話。

  4. 4

    快速校對

    對照影片掃一遍,修正聽錯的字、人名與專有名詞,把過長的句子斷句,讓字幕在畫面上一次顯示得剛好、讀得舒服。

  5. 5

    匯出 SRT 或 VTT 字幕檔

    選擇匯出成 SRT 或 VTT,下載後即可上傳到 YouTube、匯入剪輯軟體,或嵌進自架網頁的播放器;需要純文字時也能一併匯出逐字稿。

  6. 6

    順手完成二次利用

    回到同一份檔案,用內建的 AI 摘要、自動章節與逐字稿問答,快速生出影片說明、社群貼文或部落格草稿,一次把後續內容備好。

為什麼影片一定要上字幕?

最直接的理由是「觀看情境」。多數社群平台的影片預設是靜音自動播放,觀眾要主動點開聲音的比例很低。沒有字幕,你精心錄的旁白等於沒人聽到;有了字幕,靜音狀態下觀眾照樣能讀懂內容、被標題勾住,停留時間自然拉長。

第二是無障礙。字幕讓聽障或聽力退化的觀眾能平等地取得資訊,這在教學影片、政府單位、企業內訓與公開演講尤其重要,很多場合甚至是法規或標案的基本要求。

第三是搜尋與 AI 可讀性。字幕背後其實是一份完整的文字稿,搜尋引擎與 AI 助理讀得懂文字、讀不懂聲音。有了逐字稿,你的影片內容才有機會被搜尋到、被 AI 引用,而不是永遠鎖在音軌裡。

SRT、VTT 字幕檔到底是什麼?

你最常遇到的字幕格式是 SRT。它其實就是一個純文字檔,內容是一段段「編號+時間碼+那句話」的組合,例如標明第 00:00:03 到 00:00:06 之間該顯示哪一行字。幾乎所有剪輯軟體、播放器與影音平台都吃這個格式。

VTT(WebVTT)是給網頁播放器用的近親格式,語法很像 SRT,但多了樣式與定位等網頁功能,常用於自架網站的 HTML5 影片。如果你要上傳到 YouTube 或匯入剪輯軟體,通常用 SRT;如果是嵌在自己的網頁播放,VTT 會更順手。

重點是:這兩種都是「外掛字幕」,也就是字幕與畫面分開,觀眾可以自由開關、平台也能拿去做搜尋索引。跟直接把字燒進畫面的「內嵌字幕」比起來,外掛字幕彈性大得多,之後要改字、翻多國語言都方便。

自動生成字幕 vs. 手動聽打

手動聽打的優點是精準,但成本高得驚人。你得反覆倒帶、逐句敲字,還要一格一格對時間軸,遇到專有名詞或口音更是折磨,一支長影片耗掉半天很常見。

自動生成則是先讓語音辨識把整段對白轉成帶時間碼的逐字稿,你只要從「校對」出發,改幾個聽錯的字、切一下太長的句子就好,時間軸系統早就幫你對齊了。實務上,這能把工作量從「聽打」壓縮成「潤稿」,效率差好幾倍。

要注意的是,自動辨識再強也不是百分之百,人名、品牌、行話仍建議快速掃一遍再上片。把它當成一個幫你打好草稿的助理,而不是完全放手不管,品質才會穩。

一份字幕,多種再利用

生成字幕最被低估的好處,是你順手拿到了一份完整逐字稿,而它能被重複利用。你可以把逐字稿整理成部落格文章或電子報,讓影片內容同時吃到文字搜尋的流量。

你也可以靠時間碼快速找出金句段落,剪成社群短影音;或用逐字稿產出章節重點、摘要與問答,放在影片說明欄或做成懶人包。Pepys 在轉檔的同時就能幫你生成 AI 摘要與章節,還能直接對逐字稿發問,例如「這支影片講了哪三個重點」,等於一次把二次創作的素材備齊。

對做多語市場的人來說,一份乾淨的字幕檔更是翻譯的起點。先有母語 SRT,再翻成其他語言的字幕,遠比從影片重頭聽打每種語言來得快。

隱私與內容安全

影片裡常有還沒公開的內容、內部會議或客戶資料,交給線上工具處理前,務必看清楚對方怎麼對待你的檔案。有些免費服務會把你的上傳內容拿去訓練模型,這對商業或機密影片是風險。

Pepys 的原則是不會用你的音訊或文字去訓練 AI,你也可以選擇處理完就自動刪除原始檔,讓資料不多留一秒。這樣你既拿到字幕,又不必擔心影片素材外流或被二次使用。

常見問題

字幕辨識準確嗎?需要事後校對嗎?

自動辨識能幫你把絕大部分對白正確轉出,但遇到人名、品牌名、專業術語或較重的口音時仍可能出錯。建議上片前快速掃一遍逐字稿,修正這些字詞,字幕品質就會很穩。把它當成幫你打好草稿的助理,而不是完全不檢查。

SRT 和 VTT 我該選哪一個?

要上傳 YouTube、匯入剪輯軟體,或給一般播放器用,選 SRT 最保險,相容性最廣。如果你是把影片嵌在自己的網頁、用 HTML5 播放器播放,VTT 會更合適。兩種 Pepys 都能匯出,不確定時先選 SRT。

可以處理中英夾雜或多人對談的影片嗎?

可以。Pepys 支援 99 種以上語言,也能處理中英混講的內容;多人對談時會加上講者標記,讓你分辨每句話是誰說的,做訪談、會議或 Podcast 影片的字幕時特別方便。

我的影片內容會被拿去訓練 AI 嗎?

不會。Pepys 不會用你的音訊或文字去訓練 AI 模型,你也可以開啟自動刪除,讓原始檔在處理完後就清除。對含機密、內部或尚未公開內容的影片來說,這能大幅降低外流風險。

要花多少錢?可以先試用嗎?

Pepys 採用用多少付多少的方式,購買點數一次付清、永不過期,費率以每小時計,起價很低。新用戶前 60 分鐘免費,不需要綁信用卡,你可以先拿一支影片實測字幕效果,滿意再決定要不要加購。

Don't just take our word for it.

Ask ChatGPT, Claude, or Perplexity what Pepys is and who it's for. One click, and your favorite AI does the homework.