v0.3.4:重构audio_event处理机制并大幅扩展标点符号支持
🎯 主要新功能和改进
🔧 audio_event 处理机制重构
- 消除关键词匹配错误: 不再依赖启发式关键词检测,直接使用 ElevenLabs API 返回的
type: "audio_event"
字段 - 独立处理流程: 在预处理阶段分离 audio_event 类型,生成独立的字幕条目
- 职责清晰化: 句子分割器专注处理
type: "word"
内容,不再混合处理音频事件
📝 标点符号支持大幅扩展
- CJK语言: 从7种扩展到18种标点符号支持
- 拉丁语言: 从6种扩展到15种标点符号支持
- 新增支持: 《》「」【】()…...- 等常见ASR标点符号
- 智能优先级: 高/中/低三级优先级机制,确保合理分割
➖ 连字符智能处理
- 复合词保护: 避免 "well-known" 等复合词被过度分割
- 语音停顿识别: 智能识别 "我想-嗯-可能" 等语音停顿场景
- 平衡分割: 低优先级设置,只在内容充足时分割