この記事のMLSAニューラルボコーダーの学習コードです。
Python 3.10以上が必要です。 あらかじめ環境にあったPyTorch 2を導入してください。
pip install -r requirements.txt
config
ディレクトリにサンプルの設定ファイルがあります。
適宜data_path
やpreprocessed_path
、log_dir
などのパラメータを変更することで前処理・学習に使用できます。
data_path
: 学習に使用したいwavファイルが入ったディレクトリを指定してください。preprocessed_path
: 前処理データを格納するディレクトリを指定してください。log_dir
: 学習ログ(tensorboardのデータ)とチェックポイントを保存するディレクトリを指定してください。
python preprocessor.py <config file>
長い音声(歌声データなど)を使用する場合は-s
もしくは--split
オプションを使ってください。
python preprocessor.py <config file> -s
python train.py <config file>
サンプル音声がTensorboard上に出力されます。
MIT ライセンスです。