Releases: xinnan-tech/xiaozhi-esp32-server
Releases · xinnan-tech/xiaozhi-esp32-server
v0.6.2
- 本地TTS(FishSpeech/GPT_SOVITS_V2/GPT_SOVITS_V3),支持在音色管理添加克隆音色文件,方便切换不同的声音
- 增加newsnow新闻来源配置
- 优化MCP接入点读取工具列表
v0.6.1
- 智控台增加MCP接入点功能,具体使用方法查看这里
- 使用函数调用(functioncall)意图识别时,支持iot和mcp多指令执行
v0.5.8
- 修复阿里回复视觉模型结果时输出乱码的bug
- 修复豆包流式ASR在部分账号中出现400错误
- 修正实时模式下打断过于灵敏的bug
- 服务端MCP重连
v0.5.7
- 添加智控台设备管理备注功能
- 修复windows数据库ai_agent_plugin_mapping编码问题
- 修复意图识别因缺少 home_assistant 配置导致功能全部失效的 bug
- 修复“设备使用iot协议,意图识别无法正确调用”的问题
v0.5.6
- 智控台每个智能体,可以单独配置哪些工具可以被调用
- 修复播放音频是念出markdown语法的bug
- 优化函数调用时输出长文本断句
- 修复其他BUG
v0.5.5
- 智控台唤醒词加速方案
- 修复客户端mcp工具名字规范问题
- 修复流式TTS聊天记录上报bug
- 增加免费流式tts:LinkeraiTTS(灵犀流式)
v0.5.4
- 优化火山引擎双流TTS(HuoshanDoubleStreamTTS)使用方式
- ASR接收模块改造成异步队列
- 区分豆包按次收费的ASR(DoubaoASR)和按时收费的双流ASR(DoubaoStreamASR)
两款ASR区别:按次收费便宜,按时收费响应快
v0.5.2
- ASR流式改造成功,从此0.5.2版本开始,xiaozhi-server,实现全流式(ASR流、LLM流、TTS双流)服务
- 完美兼容虾哥客户端MCP协议(1.6.6版本)
- 完成双麦实时打断功能(立创s3-实战派完美使用)
v0.5.1
- TTS架构大升级,二次开发者可以基于新版本代码开发双流式、单流式、非流式三种模式的语音接口
- 本次版本已对接火山引擎双流式TTS,速度惊艳,效果非常好
- 记忆模式如果是本地短期记忆,可以设置独立的LLM进行记忆总结,解决Dify、Coze、Ha等平台无法总结聊天记录的问题