ROS2とPythonで作って学ぶAIロボット入門(出村・萩原・升谷・タン著,講談社)第3章のサンプルプログラムと補足情報などを掲載しています.
- オーディオ関連を扱うためのライブラリを以下のコマンドでインストールします.
sudo apt -y install portaudio19-dev
sudo apt -y install pulseaudio
- Pythonのモジュールとして呼びたすために,以下のコマンドを実行します.
pip3 install pyaudio
- 音声認識ライブラリを以下のコマンドでインストールします.
pip3 install SpeechRecognition
- 音声認識器のWhisperを扱うためのライブラリを以下のコマンドでインストールします.
pip3 install SpeechRecognition[whisper-local] soundfile
- 音声合成で用いるライブラリをインストールします。
pip3 install gTTS
sudo apt -y install mpg123
pip3 install mpg123
- サンプルプログラムを以下のコマンドでGitHubからクローンします.
cd ~/airobot_ws/src
git clone https://github.com/AI-Robot-Book/chapter3
- 以下のコマンドでパッケージをビルドします.
cd ~/airobot_ws
colcon build
source install/setup.bash
- speech_action: アクション通信による音声認識と音声合成のサンプルプログラム
- speech_service: サービス通信による音声認識と音声合成のサンプルプログラム
- speech_topic: トピック通信による音声認識と音声合成のサンプルプログラム
- 3章のサンプルプログラムをDockerコンテナで実行する場合,Ubuntuをホストにする場合のみ動作を確認しています.Windowsで開発されている方は,VMWareなどのバーチャルマシンにUbuntuをインストールしてサンプルプログラムを実行する事ができます.
- 実行するUbuntuの環境でマイクからの音声入力とスピーカーからの音の出力が出来ていることを事前に確認してください.
- バーチャルマシン上のUbuntuを使用する場合は、遅れが生じて音声が出力されない事があります.長めの発話文を入力するなどして対応して下さい.
- 可能であればベッドセットを使用してください.オウム返しの実行中にスピーカーの音がマイクに回って繰り返す場合があります.