AI视频自动生成工具 - 基于共绩算力平台
只需提供一个视频 主题 或 关键词 ,就可以全自动生成视频文案、视频素材、视频字幕、视频背景音乐,然后合成一个高清的短视频。
MoneyPrinterTurbo 是一个基于AI的自动化视频生成工具,支持从文本描述自动生成完整的短视频内容。项目采用完整的MVC架构,提供Web界面和API接口,支持多种AI模型接入。
本项目已完美适配 共绩算力平台,为您提供云端GPU算力支持,让AI视频生成不再受限于本地硬件。
-
💡 智能弹性算力:按需付费,1.68元/时起步,告别硬件采购困扰
-
⚡ 即开即用:预装深度学习框架,支持Jupyter、VSCode等专业开发工具
-
🚀 万块4090集群:随时待命,专注业务创新,让创意不受限
访问 共绩算力平台 即可体验云端AI视频生成服务,让您的创意瞬间变成现实。
- ✓ 完整的MVC架构:代码结构清晰,易于维护,支持API和Web界面
- ✓ 智能文案生成:支持AI自动生成视频文案,也可自定义文案
- ✓ 多尺寸支持:
- 竖屏 9:16(1080x1920)
- 横屏 16:9(1920x1080)
- ✓ 批量生成:一次生成多个视频,选择最满意的版本
- ✓ 灵活时长控制:可调节视频片段时长,优化素材切换频率
- ✓ 多语言支持:支持中文和英文视频文案
- ✓ 丰富语音合成:多种语音可选,支持实时试听
- ✓ 智能字幕:可调整字体、位置、颜色、大小,支持字幕描边
- ✓ 背景音乐:随机或指定音乐文件,可调节音量
- ✓ 高清素材:无版权高清视频素材,也支持本地素材
- ✓ 多模型接入:支持OpenAI、Moonshot、Azure、gpt4free、one-api、通义千问、Google Gemini、Ollama、DeepSeek、文心一言、Pollinations等
💡 推荐配置:中国用户建议使用DeepSeek或Moonshot作为大模型提供商(国内可直接访问,无需VPN,注册即送额度)
更真实的合成声音 |
||
---|---|---|
demo-portrait-1.mp4 |
default.mp4 |
demo-portrait-2.mp4 |
demo-landscape.mp4 |
demo-landscape-2.mp4 |
- CPU:4核以上
- 内存:4G以上
- 显卡:非必须(推荐用于加速处理)
- 操作系统:Windows 10 或 MacOS 11.0 以上
确保已安装Docker,如果未安装请参考:
- Docker Desktop
- Windows用户请参考:WSL安装指南
cd MoneyPrinterTurbo
docker-compose up
注意:最新版Docker会自动安装docker compose插件,启动命令为
docker compose up
git clone https://github.com/harry0703/MoneyPrinterTurbo.git
cd MoneyPrinterTurbo
conda create -n MoneyPrinterTurbo python=3.11
conda activate MoneyPrinterTurbo
pip install -r requirements.txt
Windows:
- 下载 ImageMagick Windows版本
- 务必选择静态库版本,如:
ImageMagick-7.1.1-32-Q16-x64-static.exe
- 安装时不要修改安装路径
- 修改
config.toml
中的imagemagick_path
为实际安装路径
MacOS:
brew install imagemagick
Ubuntu:
sudo apt-get install imagemagick
CentOS:
sudo yum install ImageMagick
启动Web界面:
- Windows:
webui.bat
- MacOS/Linux:
sh webui.sh
启动API服务:
python main.py
项目提供标准的API端点:
/run
:异步请求端点/runsync
:同步请求端点/health
:健康检查端点
{
"input": {
"topic": "视频主题或关键词",
"language": "zh",
"video_size": "9:16",
"duration": 30,
"voice": "zh-CN-XiaoxiaoNeural",
"subtitle": true
}
}
{
"id": "job-uuid-string",
"status": "COMPLETED",
"output": {
"video_url": "https://example.com/video.mp4",
"duration": 30,
"size": "1080x1920"
},
"executionTime": 4567
}
支持多种语音合成服务,详细声音列表请查看:声音列表
v1.1.2更新:新增9种Azure语音合成声音,需要配置API KEY,合成效果更加真实自然。
支持两种字幕生成方式:
方式 | 速度 | 性能要求 | 质量 | 推荐场景 |
---|---|---|---|---|
edge | 快 | 低 | 一般 | 日常使用 |
whisper | 慢 | 高 | 优秀 | 高质量需求 |
可通过修改config.toml
中的subtitle_provider
进行切换。
建议:优先使用edge模式,如质量不理想再切换到whisper模式
由于国内无法访问HuggingFace,可使用以下方式下载whisper-large-v3
模型:
下载地址:
- 百度网盘: https://pan.baidu.com/s/11h3Q6tsDtjQKTjUu3sc5cA?pwd=xjs9
- 夸克网盘:https://pan.quark.cn/s/3ee3d991d64b
安装步骤:
- 下载并解压模型文件
- 将整个目录放到
.\MoneyPrinterTurbo\models\
下 - 最终路径:
.\MoneyPrinterTurbo\models\whisper-large-v3
MoneyPrinterTurbo
├─models
│ └─whisper-large-v3
│ config.json
│ model.bin
│ preprocessor_config.json
│ tokenizer.json
│ vocabulary.json
- 背景音乐:位于
resource/songs
目录 - 字幕字体:位于
resource/fonts
目录,支持自定义字体
版权声明:当前项目包含的默认音乐来自YouTube视频,如有版权问题请删除。
解决方案:
- 从 https://www.gyan.dev/ffmpeg/builds/ 下载ffmpeg
- 解压后设置
config.toml
中的ffmpeg_path
:
[app]
ffmpeg_path = "C:\\Users\\username\\Downloads\\ffmpeg.exe"
解决方案:
修改ImageMagick配置文件policy.xml
中的pattern="@"
条目,将rights="none"
改为rights="read|write"
。
解决方案:
# 查看当前限制
ulimit -n
# 调高限制
ulimit -n 10240
错误信息:
LocalEntryNotfoundEror: Cannot find an appropriate cached snapshotfolder...
解决方案:参考字幕生成部分的模型下载说明。
- 克隆仓库
- 创建虚拟环境
- 安装依赖
- 配置环境变量
- 启动开发服务器
欢迎提交 issue 或 pull request。
本项目采用 LICENSE 许可证。