Skip to content

本工具為 Whisper 批次語音轉錄腳本,支援資料夾一次轉檔、模型選擇、裝置選擇與繁體轉換。 需先安裝 OpenAI Whisper 與相關依賴。

Notifications You must be signed in to change notification settings

zeroboss2006/Whisper-Batch-Transcriber

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

24 Commits
 
 
 
 
 
 
 
 

Repository files navigation

Whisper Batch Transcriber

License Built with Python

目錄

簡介

本工具為 Whisper 批次語音轉錄腳本,支援資料夾一次轉檔、模型選擇、裝置選擇與繁體轉換。 需先安裝 OpenAI Whisper 與相關依賴。

改版歷程

v1.0.0 — 初始版本

  • 支援單檔音訊/影片轉錄。
  • 輸出 .srt, .txt, .md, .json, segments_only.json, .vtt 六種格式。
  • 自動打包成 .zip

v1.1.0 — 批次處理與進階選項

  • 增加可用 --input-folder 處理整個資料夾。
  • 顯示 tqdm 批次進度條。
  • 支援 --model, --device, --language 參數。
  • 超過 60 分鐘音訊自動提示建議使用 large-v2 模型。

v1.2.0 — 自動繁體轉換

  • 整合 opencc-python-reimplemented,輸出自動轉為繁體中文。
  • 保持各格式內容段落與斷句結構一致。

v1.3.0 — ZIP 自動命名與覆蓋提醒

  • ZIP 檔案重覆自動加上 (2), (3) 等後綴命名。
  • 批次處理時若有既有 ZIP,會先列出並詢問是否繼續。

v1.4.0 — 路徑檢查與錯誤處理強化

  • 增強對不存在檔案/資料夾的提示。
  • 改進路徑格式錯誤提示,如不支援的路徑型式。
  • 完善整體異常情況錯誤訊息。

v1.5.0 — 參數式批次強化

  • 支援 argparse 參數批次處理,可直接用 --input-file、--input-folder、--no-prompt 等。
  • 方便自動化腳本、排程,搭配 pipeline 使用。
  • 批次處理支援自動檢查音訊長度,60分鐘以上給出提示。

v1.6.0 — 互動與命名最佳化

  • 互動模式下,所有匯出檔案自動加上模型名稱(如 檔案(large-v2).zip)。
  • 若目標檔已存在,會自動遞增編號避免覆蓋。
  • 進度條與覆蓋提示更加友善。

v1.7.0 — 互動/參數雙模式與模型名自動標註

  • 支援雙模式:命令列參數(自動批次)+ 互動式問答(無參數自動進入)。
  • 所有輸出檔案(含 zip, srt, txt, md, json, vtt…)自動加上所用模型名稱,如 檔案(large-v2).zip。
  • 若目標 zip 檔已存在,自動詢問是否繼續,選擇續存時自動遞增名稱(如 xxx(2).zip)。
  • 批次處理支援 tqdm 進度條。
  • 支援 --no-prompt 跳過覆蓋警告,適合自動化流程。
  • 強制所有輸出簡體自動轉繁體。
  • 完全相容舊版所有功能。

安裝

python -m venv whisper-env
source whisper-env/bin/activate  # 或 Windows: whisper-env\Scripts\activate
pip install -r requirements.txt

使用範例

  1. 建立虛擬環境並安裝依賴(如上)。
  2. 執行方式:
  • 拖曳資料夾/檔案到 run_whisper_auto.bat
  • 或於命令行執行:
cd src
run_whisper_auto.bat C:\path\to\media
  1. 功能說明:
  • 自動啟動 virtualenv
  • 自動識別參數型態(資料夾 vs 無參數)
  • 執行完保留 console 視窗,便於查看日誌
  1. 給新手一句貼心提示 建議直接拖曳要轉檔的資料夾或音訊檔案到 bat 上,勿直接雙擊

參數說明

參數 說明 範例
--input-folder <path> 指定資料夾進行批次處理 --input-folder ./media
--input-file <path> 處理單一音訊或影片檔案 --input-file ./video.mp4
--model <base/medium/large‑v2> 選擇 Whisper 模型大小 --model large‑v2
--device <auto/cpu/cuda> 選擇運算裝置(auto 自動判斷) --device cuda
--language <Chinese/English> 設定語言 --language English
--no-prompt 跳過覆蓋詢問,適合自動化/定時任務 --no-prompt
-h, --help 查看完整參數說明 -h

注意事項

授權

本專案採用 MIT License 開源授權。

貢獻

歡迎 Issue/PR!請參閱 CONTRIBUTING.md 了解開發規範與流程。

About

本工具為 Whisper 批次語音轉錄腳本,支援資料夾一次轉檔、模型選擇、裝置選擇與繁體轉換。 需先安裝 OpenAI Whisper 與相關依賴。

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published