本工具為 Whisper 批次語音轉錄腳本,支援資料夾一次轉檔、模型選擇、裝置選擇與繁體轉換。 需先安裝 OpenAI Whisper 與相關依賴。
- 支援單檔音訊/影片轉錄。
- 輸出
.srt
,.txt
,.md
,.json
,segments_only.json
,.vtt
六種格式。 - 自動打包成
.zip
。
- 增加可用
--input-folder
處理整個資料夾。 - 顯示
tqdm
批次進度條。 - 支援
--model
,--device
,--language
參數。 - 超過 60 分鐘音訊自動提示建議使用
large-v2
模型。
- 整合
opencc-python-reimplemented
,輸出自動轉為繁體中文。 - 保持各格式內容段落與斷句結構一致。
- ZIP 檔案重覆自動加上
(2)
,(3)
等後綴命名。 - 批次處理時若有既有 ZIP,會先列出並詢問是否繼續。
- 增強對不存在檔案/資料夾的提示。
- 改進路徑格式錯誤提示,如不支援的路徑型式。
- 完善整體異常情況錯誤訊息。
- 支援 argparse 參數批次處理,可直接用 --input-file、--input-folder、--no-prompt 等。
- 方便自動化腳本、排程,搭配 pipeline 使用。
- 批次處理支援自動檢查音訊長度,60分鐘以上給出提示。
- 互動模式下,所有匯出檔案自動加上模型名稱(如 檔案(large-v2).zip)。
- 若目標檔已存在,會自動遞增編號避免覆蓋。
- 進度條與覆蓋提示更加友善。
- 支援雙模式:命令列參數(自動批次)+ 互動式問答(無參數自動進入)。
- 所有輸出檔案(含 zip, srt, txt, md, json, vtt…)自動加上所用模型名稱,如 檔案(large-v2).zip。
- 若目標 zip 檔已存在,自動詢問是否繼續,選擇續存時自動遞增名稱(如 xxx(2).zip)。
- 批次處理支援 tqdm 進度條。
- 支援 --no-prompt 跳過覆蓋警告,適合自動化流程。
- 強制所有輸出簡體自動轉繁體。
- 完全相容舊版所有功能。
python -m venv whisper-env
source whisper-env/bin/activate # 或 Windows: whisper-env\Scripts\activate
pip install -r requirements.txt
- 建立虛擬環境並安裝依賴(如上)。
- 執行方式:
- 拖曳資料夾/檔案到
run_whisper_auto.bat
上 - 或於命令行執行:
cd src
run_whisper_auto.bat C:\path\to\media
- 功能說明:
- 自動啟動 virtualenv
- 自動識別參數型態(資料夾 vs 無參數)
- 執行完保留 console 視窗,便於查看日誌
- 給新手一句貼心提示 建議直接拖曳要轉檔的資料夾或音訊檔案到 bat 上,勿直接雙擊
參數 | 說明 | 範例 |
---|---|---|
--input-folder <path> |
指定資料夾進行批次處理 | --input-folder ./media |
--input-file <path> |
處理單一音訊或影片檔案 | --input-file ./video.mp4 |
--model <base/medium/large‑v2> |
選擇 Whisper 模型大小 | --model large‑v2 |
--device <auto/cpu/cuda> |
選擇運算裝置(auto 自動判斷) | --device cuda |
--language <Chinese/English> |
設定語言 | --language English |
--no-prompt |
跳過覆蓋詢問,適合自動化/定時任務 | --no-prompt |
-h , --help |
查看完整參數說明 | -h |
- 本工具僅為自動化批次包裝,不包含 whisper 本體
- 若需完整原始碼,請至 OpenAI/whisper 官方 repo
本專案採用 MIT License 開源授權。
歡迎 Issue/PR!請參閱 CONTRIBUTING.md 了解開發規範與流程。