Replies: 5 comments
-
短答案:
目前可选值有: 长答案:
|
Beta Was this translation helpful? Give feedback.
-
我指的就是api调用问题。在api.md中只有chattts比较详细。但是文本输入需要自己去添加停顿,文本长了,前后经常听起来像两个不同声色。其他模型,像cosyvoice,fishspeech这种,curl怎么调用?通过doc是可以测试和看到命令,但是直接用就是一个很难听的声音,假设在调用时给音色模仿参考,这个在web界面可以,在curl中怎么写?像api.md中Forge Api v2 |
Beta Was this translation helpful? Give feedback.
-
首先,固定音色需要指定 如果你确实需要使用api,那么
如果你想通过 curl 来调用 api 同时使用参考音频,你需要先准备好参考音频的 base64 格式作为 |
Beta Was this translation helpful? Give feedback.
-
生成spk.json后,api中如何使用。如果直接base64 .mp3 生成的编码音频文件,如何使用? 我就是要通过curl来调用api,假设我的MP3文件为test.mp3, linux 下生成base64 test.mp3>test.wav64,这个编码如何传递? api.md中的例子如下: Forge Api v2 curl http://localhost:7870/v2/tts curl -X POST "http://localhost:7870/v2/tts" -H "Authorization: Bearer anything_your_wanna" -H "Content-Type: application/json" --data-binary '{"text": "Today is a wonderful day to build something people love!", "spk": {"from_ref": {"wav_b64": "'"$(cat test.wav64)"'","text:"春天充满诗意与温暖"}}}' --output speech.mp3 这里也没有指定模型,假设我要使用的是cosyvoice,怎么写? |
Beta Was this translation helpful? Give feedback.
-
首先,你应该先检查代码版本 关于 api 参数,一个你可以运行 api server 然后查看 http://localhost:7870/docs 里面有自动生成的类型注释 你想在 {
"text": "你好,欢迎使用 Speech AI Forge 项目。",
"spk": {
"from_ref": {
"wav_b64": "SUQzB...<base64编码音频文件的字符串>",
"text": "<对应参考音频的文本>"
}
},
"tts": {
"mid": "cosy-voice"
}
} 具体如何调用,不建议用 curl ,curl在终端中使用可能有编码问题,特别是有中文的时候,并且你要传递 base64 也得预处理不方便 |
Beta Was this translation helpful? Give feedback.
-
确认清单
你的issues
cosyvoice 的api调用怎么写,或者说,除了chattts之外的其他模型的api调用命令格式怎么写
Beta Was this translation helpful? Give feedback.
All reactions