Batching API `v2/batch` #216

zhzLuke96 · 2025-03-26T08:08:38Z

需求：支持多说话人在同一个 batching 中

目前可以batch推理，但是都是基于 同context多输入=>单输出 的形式，无法支持 不同context多输入=>多输出
计划增加一个接口 v2/batch 用于 多输入=>多输出 推理
并且，ssml推理也应该采用 batch 形式推理加速

同时这个修改应该和 #209 相关，可以同时引入并一起测试

TODOs

refactor batching pipeline, support m2m batching
v2/batch api
ssml based on m2m batch

参数大概类似这样：

class Segment(BaseModel):
    text: str

    prompt: Optional[str] = None
    spk: Optional[SpeakerConfig] = None

    adjuct: Optional[AdjustConfig] = None
    enhance: Optional[EnhancerConfig] = None


class BatchParams(BaseModel):
    segments: list[Segment]

    encoder: Optional[EncoderConfig] = None
    infer: Optional[InferConfig] = None
    tn: Optional[TNConfig] = None
    tts: TTSConfig = Field(default_factory=TTSConfig)

The text was updated successfully, but these errors were encountered:

zhzLuke96 mentioned this issue Mar 26, 2025

Dynamic batch_size #209

Open

zhzLuke96 added Story Next iteration summary and TODO list performance Performance issues labels Mar 26, 2025

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Batching API `v2/batch` #216

Batching API `v2/batch` #216

zhzLuke96 commented Mar 26, 2025 •

edited

Loading

Batching API v2/batch #216

Batching API v2/batch #216

Comments

zhzLuke96 commented Mar 26, 2025 • edited Loading

TODOs

Batching API `v2/batch` #216

Batching API `v2/batch` #216

zhzLuke96 commented Mar 26, 2025 •

edited

Loading