Skip to content

v0.3.4:重构audio_event处理机制并大幅扩展标点符号支持

Compare
Choose a tag to compare
@github-actions github-actions released this 23 Jun 03:55
· 3 commits to main since this release

🎯 主要新功能和改进

🔧 audio_event 处理机制重构

  • 消除关键词匹配错误: 不再依赖启发式关键词检测,直接使用 ElevenLabs API 返回的 type: "audio_event" 字段
  • 独立处理流程: 在预处理阶段分离 audio_event 类型,生成独立的字幕条目
  • 职责清晰化: 句子分割器专注处理 type: "word" 内容,不再混合处理音频事件

📝 标点符号支持大幅扩展

  • CJK语言: 从7种扩展到18种标点符号支持
  • 拉丁语言: 从6种扩展到15种标点符号支持
  • 新增支持: 《》「」【】()…...- 等常见ASR标点符号
  • 智能优先级: 高/中/低三级优先级机制,确保合理分割

➖ 连字符智能处理

  • 复合词保护: 避免 "well-known" 等复合词被过度分割
  • 语音停顿识别: 智能识别 "我想-嗯-可能" 等语音停顿场景
  • 平衡分割: 低优先级设置,只在内容充足时分割