v0.3.4：重构audio_event处理机制并大幅扩展标点符号支持

github-actions released this 23 Jun 03:55

· 3 commits to main since this release

21c5e30

🎯 主要新功能和改进

🔧 audio_event 处理机制重构

消除关键词匹配错误: 不再依赖启发式关键词检测，直接使用 ElevenLabs API 返回的 type: "audio_event" 字段
独立处理流程: 在预处理阶段分离 audio_event 类型，生成独立的字幕条目
职责清晰化: 句子分割器专注处理 type: "word" 内容，不再混合处理音频事件

📝 标点符号支持大幅扩展

CJK语言: 从7种扩展到18种标点符号支持
拉丁语言: 从6种扩展到15种标点符号支持
新增支持: 《》「」【】（）…...- 等常见ASR标点符号
智能优先级: 高/中/低三级优先级机制，确保合理分割

➖ 连字符智能处理

复合词保护: 避免 "well-known" 等复合词被过度分割
语音停顿识别: 智能识别 "我想-嗯-可能" 等语音停顿场景
平衡分割: 低优先级设置，只在内容充足时分割

Assets 5