利用多种AI工具接合进行项目实操
涉及使用工具:
Midjourney(生成个性化人物元素);
GPT200.com (以最低的成本使用Midjourney及ChatGPT4)
ChatGPT(生成适配Midjourney的英文关键词(咒语));
D-ID(使静态图像生成逼真的动态讲解模式);
Pictory (文本导出视频综合使用:包括字幕、人声、背景、视频合成)
腾讯智影:(AI去水印及国产项目解决方案)https://zenvideo.qq.com/
Camtasia(剪辑视频及声音导出)、
剪映(提取字幕及合成)
Elevenlabs (个性化定制声音)。
(综合使用成本9.9+1美元 小于20元)
高级使用(需有较高的IT互联网综合应用能力)
MockingBird- 文字转语音神器!附最新安装使用教程!
1.安装Python 选择3.8 或更高版本 【官方链接】
2.安装 PyTorch, 直接官网下载 【官方链接】,如果GPU不支持CUDA,请默认选择,没有显卡就选择CPU。
3.安装 ffmpeg 【下载链接】,下载后把bin目录路径path到系统变量里,见视频教程。
4.下载 MockingBird 【开源项目】下载解压后,直接在目录输入CMD 进入终端
5.在本机或服务器终端下安装剩余的必备环境包:
作者 | 下载链接 | 效果预览 | 信息 |
---|---|---|---|
作者 | https://pan.baidu.com/s/1iONvRxmkI-t1nHqxKytY3g 百度盘链接 4j5d | 75k steps 用3个开源数据集混合训练 | |
作者 | https://pan.baidu.com/s/1fMh9IlgKJlL2PIiRTYDUvw 百度盘链接 提取码:om7f | 25k steps 用3个开源数据集混合训练, 切换到tag v0.0.1使用 | |
@FawenYo | https://drive.google.com/file/d/1H-YGOUHpmqKxJ9FRc6vAjPuqQki24UbC/view?usp=sharing 百度盘链接 提取码:1024 | input output | 200k steps 台湾口音需切换到tag v0.0.1使用 |
@miven | https://pan.baidu.com/s/1PI-hM3sn5wbeChRryX-RCQ 提取码:2021 | 150k steps 注意:根据issue修复 并切换到tag v0.0.1使用 |
7.下载模型后,确保 xxx.pt 格式的文件放在 synthesizer\saved_models文件夹下,saved_models 如不存在请新建
8.最后执行运行命令,就可以启动程序了!
启动Web程序(v2)
训练数据集下载【点击】
GUI启动命令:
启动工具箱:
程序界面功能说明:
声明:本站所有文章,如无特殊说明或标注,均为绝学社原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系绝学社网站管理员进行处理。