第３章　音声認識・合成

概要

ROS2とPythonで作って学ぶAIロボット入門（出村・萩原・升谷・タン著，講談社）第３章のサンプルプログラムと補足情報などを掲載しています．

インストール

オーディオ関連を扱うためのライブラリを以下のコマンドでインストールします．

sudo apt -y install portaudio19-dev
sudo apt -y install pulseaudio

Pythonのモジュールとして呼びたすために，以下のコマンドを実行します．

pip3 install pyaudio

音声認識ライブラリを以下のコマンドでインストールします．

pip3 install SpeechRecognition

音声認識器のWhisperを扱うためのライブラリを以下のコマンドでインストールします.

pip3 install SpeechRecognition[whisper-local] soundfile

音声合成で用いるライブラリをインストールします。

pip3 install gTTS
sudo apt -y install mpg123
pip3 install mpg123

サンプルプログラムを以下のコマンドでGitHubからクローンします．

cd ~/airobot_ws/src
git clone https://github.com/AI-Robot-Book/chapter3

以下のコマンドでパッケージをビルドします．

cd ~/airobot_ws
colcon build
source install/setup.bash

ディレクトリ構成

speech_action: アクション通信による音声認識と音声合成のサンプルプログラム
speech_service: サービス通信による音声認識と音声合成のサンプルプログラム
speech_topic: トピック通信による音声認識と音声合成のサンプルプログラム

補足情報

３章のサンプルプログラムをDockerコンテナで実行する場合，Ubuntuをホストにする場合のみ動作を確認しています．Windowsで開発されている方は，VMWareなどのバーチャルマシンにUbuntuをインストールしてサンプルプログラムを実行する事ができます．
実行するUbuntuの環境でマイクからの音声入力とスピーカーからの音の出力が出来ていることを事前に確認してください．
バーチャルマシン上のUbuntuを使用する場合は、遅れが生じて音声が出力されない事があります．長めの発話文を入力するなどして対応して下さい．
可能であればベッドセットを使用してください．オウム返しの実行中にスピーカーの音がマイクに回って繰り返す場合があります．

Name		Name	Last commit message	Last commit date
Latest commit History 116 Commits
speech_action		speech_action
speech_service		speech_service
speech_topic		speech_topic
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

第３章　音声認識・合成

概要

インストール

ディレクトリ構成

補足情報

About

Uh oh!

Releases

Packages

Languages

yhagiwara/ai-robot-chapter3-humble

Folders and files

Latest commit

History

Repository files navigation

第３章 音声認識・合成

概要

インストール

ディレクトリ構成

補足情報

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

第３章　音声認識・合成

Packages