Skip to content

yhagiwara/ai-robot-chapter3-humble

 
 

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 
 
 
 
 
 
 
 
 

Repository files navigation

第3章 音声認識・合成

概要

ROS2とPythonで作って学ぶAIロボット入門(出村・萩原・升谷・タン著,講談社)第3章のサンプルプログラムと補足情報などを掲載しています.

インストール

  • オーディオ関連を扱うためのライブラリを以下のコマンドでインストールします.
sudo apt -y install portaudio19-dev
sudo apt -y install pulseaudio
  • Pythonのモジュールとして呼びたすために,以下のコマンドを実行します.
pip3 install pyaudio
  • 音声認識ライブラリを以下のコマンドでインストールします.
pip3 install SpeechRecognition
  • 音声認識器のWhisperを扱うためのライブラリを以下のコマンドでインストールします.
pip3 install SpeechRecognition[whisper-local] soundfile
  • 音声合成で用いるライブラリをインストールします。
pip3 install gTTS
sudo apt -y install mpg123
pip3 install mpg123
  • サンプルプログラムを以下のコマンドでGitHubからクローンします.
cd ~/airobot_ws/src
git clone https://github.com/AI-Robot-Book/chapter3
  • 以下のコマンドでパッケージをビルドします.
cd ~/airobot_ws
colcon build
source install/setup.bash

ディレクトリ構成

  • speech_action: アクション通信による音声認識と音声合成のサンプルプログラム
  • speech_service: サービス通信による音声認識と音声合成のサンプルプログラム
  • speech_topic: トピック通信による音声認識と音声合成のサンプルプログラム

補足情報

  • 3章のサンプルプログラムをDockerコンテナで実行する場合,Ubuntuをホストにする場合のみ動作を確認しています.Windowsで開発されている方は,VMWareなどのバーチャルマシンにUbuntuをインストールしてサンプルプログラムを実行する事ができます.
  • 実行するUbuntuの環境でマイクからの音声入力とスピーカーからの音の出力が出来ていることを事前に確認してください.
  • バーチャルマシン上のUbuntuを使用する場合は、遅れが生じて音声が出力されない事があります.長めの発話文を入力するなどして対応して下さい.
  • 可能であればベッドセットを使用してください.オウム返しの実行中にスピーカーの音がマイクに回って繰り返す場合があります.

About

第3章 音声認識・合成

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages

  • Python 100.0%