演示效果

更新日志：

2025年6月6日

增加了gc9a01显示屏的支持，支持中、英文、jpg图片显示
micropython固件更新为esp32s3-4M（增加了gc9a01模块）
增加inconsolata_16.py（英文字体模块）、proverbs_20.py（中文字体模块）、tft_config.py（gc9a01显示屏配置文件）
增加了显示效果的演示视频

ESP32-S3 智能语音助手

这是一个基于ESP32-S3Supermini开发板的智能语音助手项目，使用MicroPython实现与大语言模型进行语音对话的功能。该项目通过WebSocket连接到语音对话智能体API，实现实时语音输入和输出的交互体验。

功能特点

使用I2S接口连接麦克风和扬声器，实现高质量的音频采集和播放
支持VAD（语音活动检测）功能，智能识别用户说话和静音
通过WebSocket与云端大语言模型实时通信
支持中英文语音输入与输出
支持对话历史保存和上下文理解
支持中、英文、jpg图片显示

硬件要求

ESP32-S3开发板
I2S麦克风 (INMP441)
I2S扬声器 (max98357)
SPI显示屏 (gc9a01)
稳定的WiFi连接

引脚配置

麦克风I2S配置

SCK: GPIO11
WS: GPIO12
SD: GPIO13

扬声器I2S配置

SCK: GPIO7
WS: GPIO8
SD: GPIO9

gc9a01显示屏配置

BLK: GPIO1
CS: GPIO2
DC: GPIO3
RES: GPIO4
SDA: GPIO5
SCL: GPIO6

软件依赖

MicroPython固件 (适用于ESP32-S3-4M)，下载位置在本项目中
自定义aiohttp库 (已包含在项目中)

使用方法

将MicroPython固件烧录到ESP32-S3Supermini开发板

修改config.py文件中的WiFi凭据和API密钥

WIFI_SSID = "你的WiFi名称"
WIFI_PASSWORD = "你的WiFi密码"
API_KEY = "你的API密钥"，豆包边缘网关提供200万免费试用token
instructions = '''你的提示词'''

上传项目文件到ESP32-S3
重启开发板，程序将自动连接WiFi并启动语音助手
接线图：

6. 运行截图：

配置说明

在config.py文件中可以调整以下参数：

WiFi连接信息
音频配置 (采样率、通道数、位深度等)
I2S引脚配置
API密钥和配置
语音模型参数 (如音色ID)

项目结构

README.md：项目说明文档
boot.py：启动脚本
config.py：配置参数（如WiFi等）
doubao_chat.py：核心聊天功能模块
main_ai.py：主程序入口（连接WiFi，启动聊天）
mix_display.py：gc9a01显示相关代码
tft_config.py：TFT 屏配置
inconsolata_16.py、proverbs_20.py：中英文字体/数据相关
aiohttp/：第三方库目录（aiohttp相关，websocket模块）
micropython固件/：esp32s3Supermini固件
1.png、2.png、3.png、4.jpg、ezgif-257beaf8d11884.gif、db025aaab6f59258f7ebf01e7ddf62ab.mp4：图片和演示文件

开发者说明

项目使用了以下关键技术：

I2S音频处理
WebSocket异步通信
VAD语音活动检测
多线程音频录制和播放
websocket通讯协议：https://www.volcengine.com/docs/6893/1389041

注意事项

确保WiFi网络稳定，以获得最佳的语音交互体验
调整doubao_chat.py中的SILENCE_THRESHOLD参数可以优化VAD检测灵敏度
API密钥请保密，不要泄露到公开场合

致谢

-本项目基于社区其它开源代码改写，在此表示感谢！同时感谢开源社区的每一位贡献者，是你们的无私分享与持续努力，让技术世界变得更加开放与包容。无论是代码、文档，还是思想的碰撞，你们的付出为全球开发者搭建了自由创新的舞台。开源不仅是一种协作方式，更是一种精神，激励着我们共同推动技术进步，解决复杂问题。感谢你们让知识得以共享，让世界因合作而更加美好！

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

演示效果

更新日志：

2025年6月6日

ESP32-S3 智能语音助手

功能特点

硬件要求

引脚配置

麦克风I2S配置

扬声器I2S配置

gc9a01显示屏配置

软件依赖

使用方法

配置说明

项目结构

开发者说明

注意事项

致谢

About

Uh oh!

Releases

Packages

Uh oh!

Languages

Name		Name	Last commit message	Last commit date
Latest commit History 84 Commits
aiohttp		aiohttp
micropython固件		micropython固件
1.png		1.png
2.png		2.png
3.png		3.png
4.jpg		4.jpg
README.md		README.md
boot.py		boot.py
config.py		config.py
db025aaab6f59258f7ebf01e7ddf62ab.mp4		db025aaab6f59258f7ebf01e7ddf62ab.mp4
doubao_chat.py		doubao_chat.py
ezgif-257beaf8d11884.gif		ezgif-257beaf8d11884.gif
inconsolata_16.py		inconsolata_16.py
main_ai.py		main_ai.py
mix_display.py		mix_display.py
proverbs_20.py		proverbs_20.py
tft_config.py		tft_config.py

zhou19830318/doubao_ai_agent_esp32

Folders and files

Latest commit

History

Repository files navigation

演示效果

更新日志：

2025年6月6日

ESP32-S3 智能语音助手

功能特点

硬件要求

引脚配置

麦克风I2S配置

扬声器I2S配置

gc9a01显示屏配置

软件依赖

使用方法

配置说明

项目结构

开发者说明

注意事项

致谢

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Languages

Packages