Skip to content

Releases: xinnan-tech/xiaozhi-esp32-server

v0.6.2

01 Jul 08:39
d59a769
Compare
Choose a tag to compare
  • 本地TTS(FishSpeech/GPT_SOVITS_V2/GPT_SOVITS_V3),支持在音色管理添加克隆音色文件,方便切换不同的声音
  • 增加newsnow新闻来源配置
  • 优化MCP接入点读取工具列表

v0.6.1

27 Jun 15:56
d5e0e8a
Compare
Choose a tag to compare
  • 智控台增加MCP接入点功能,具体使用方法查看这里
  • 使用函数调用(functioncall)意图识别时,支持iot和mcp多指令执行

v0.5.8

20 Jun 10:05
bc2fc35
Compare
Choose a tag to compare
  • 修复阿里回复视觉模型结果时输出乱码的bug
  • 修复豆包流式ASR在部分账号中出现400错误
  • 修正实时模式下打断过于灵敏的bug
  • 服务端MCP重连

v0.5.7

16 Jun 16:15
3e491c7
Compare
Choose a tag to compare
  • 添加智控台设备管理备注功能
  • 修复windows数据库ai_agent_plugin_mapping编码问题
  • 修复意图识别因缺少 home_assistant 配置导致功能全部失效的 bug
  • 修复“设备使用iot协议,意图识别无法正确调用”的问题

v0.5.6

13 Jun 07:01
f558371
Compare
Choose a tag to compare
  • 智控台每个智能体,可以单独配置哪些工具可以被调用
  • 修复播放音频是念出markdown语法的bug
  • 优化函数调用时输出长文本断句
  • 修复其他BUG

v0.5.5

07 Jun 08:14
423626a
Compare
Choose a tag to compare
  • 智控台唤醒词加速方案
  • 修复客户端mcp工具名字规范问题
  • 修复流式TTS聊天记录上报bug
  • 增加免费流式tts:LinkeraiTTS(灵犀流式)

v0.5.4

04 Jun 13:59
f2fd3a0
Compare
Choose a tag to compare
  • 优化火山引擎双流TTS(HuoshanDoubleStreamTTS)使用方式
  • ASR接收模块改造成异步队列
  • 区分豆包按次收费的ASR(DoubaoASR)和按时收费的双流ASR(DoubaoStreamASR)

两款ASR区别:按次收费便宜,按时收费响应快

  • 增加千问视觉模型

v0.5.3

01 Jun 08:53
2d7d75c
Compare
Choose a tag to compare
  • 增加视觉大模型供应器和配置
  • 支持openai类型接口的视觉模型调用(默认是智谱免费版视觉模型)
  • 兼容虾哥1.6.6版本调用mcp拍照识图功能

视觉模型启用教程:https://github.com/xinnan-tech/xiaozhi-esp32-server/blob/main/docs/mcp-vision-integration.md

v0.5.2

30 May 09:46
3c85242
Compare
Choose a tag to compare
  • ASR流式改造成功,从此0.5.2版本开始,xiaozhi-server,实现全流式(ASR流、LLM流、TTS双流)服务
  • 完美兼容虾哥客户端MCP协议(1.6.6版本)
  • 完成双麦实时打断功能(立创s3-实战派完美使用)

v0.5.1

28 May 13:57
625d079
Compare
Choose a tag to compare
  • TTS架构大升级,二次开发者可以基于新版本代码开发双流式、单流式、非流式三种模式的语音接口
  • 本次版本已对接火山引擎双流式TTS,速度惊艳,效果非常好
  • 记忆模式如果是本地短期记忆,可以设置独立的LLM进行记忆总结,解决Dify、Coze、Ha等平台无法总结聊天记录的问题