0. 效果演示

演示音频分割功能可以访问 https://www.bilibili.com/video/BV1oxrcYuELK
演示视频分割功能可以访问 https://www.bilibili.com/video/BV1xYweeKEvZ
演示热词功能 https://www.bilibili.com/video/BV1uZuSzFEtM
如果是不懂代码的人想要使用本项目，可以使用我打包好的程序，我是在Windows 11系统上打包的，不确定Windows其它版本是否能用，如果是非Windows系统，请使用源码方式运行。
点击这里跳转到打包好的可执行程序

1. 说明

这是基于开源的 FunASR 实现的说话人分离的 GUI 项目，可以在支持图形界面中的任意 PC 端运行
要求 python version >= 3.8
支持运行在 Windows、MacOS、Linux 系统
本项目适合个人电脑使用，如果要在生产服务器中部署，并且需要并发处理，可到我博客中联系我
热词功能，在当前路径下的 hotwords.txt 中写入热词，每个热词一行

2. 开发日志

2023-11-14 对选择的多个音频分离不同的人声
2024-01-04 保存每个说话人对应的内容
2024-01-09 增加合并相同说话人功能
2024-01-22 增加视频切片功能
2024-02-25 新增允许控制每个音频片段切割的字符数
2025-07-19 新增支持热词功能

3. 安装

执行下面命令来安装依赖

pip install -U funasr modelscope ffmpeg-python pydub

此外还需要安装 torch，可以到 torch 官方中根据自己电脑情况安装不同版本的 torch
安装 ffmpeg，可以到 github 中搜索 ffmpeg，下载解压后，配置环境变量
如果不会安装 torch 和 ffmpeg，可以参考我之前发布到博客中的一篇文章。

4. 功能

支持对指定的单个或者多个音频中不同的说话人讲的话进行分离，分别归类到不同的目录中
保存每个说话人对应的包含时间戳的文本内容
支持视频切片，根据说话人声音进行视频切片
支持自定义热词

5. 模型下载

执行下面程序，会自动下载模型到当前用户 .cache/modelscope/hub/models/iic/ 目录中

python download_model.py

6. 联系

可以添加交流群 693367146，添加时记得备注来自哪个平台
个人技术分享博客：https://blog.lukeewin.top
如果是小白，不懂代码，可以点击这里

Name		Name	Last commit message	Last commit date
Latest commit History 27 Commits
img		img
top/lukeewin		top/lukeewin
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

0. 效果演示

1. 说明

2. 开发日志

3. 安装

4. 功能

5. 模型下载

6. 联系

About

Uh oh!

Releases

Packages

Languages

lukeewin/AudioSeparationGUI

Folders and files

Latest commit

History

Repository files navigation

0. 效果演示

1. 说明

2. 开发日志

3. 安装

4. 功能

5. 模型下载

6. 联系

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages