这是一个后端项目 基于https://github.com/RVC-Boss/GPT-SoVITS 实现了一个Flask框架的简单后端 可以实现快速切换人物 并且增加了智能切分的特性
对于一个已经能正常运行的GPT-soVITS项目
将项目文件拷入根目录(或使用git之类的,只需要保证inference_backend.py出现在根目录)
并且pip install -r requirements_added.txt
等待安装完成安装完成
然后就是可以正常的使用,导入模型后看下方如何使用环节
运行full_install.sh
在弄,等一等
!注意,这个不同于主项目,而是将模型以人物卡的形式导入
在trained文件夹,通过子文件夹的形式导入人物
文件夹名称就是人物名称
里面应该至少有3个文件
以
pth
/ckpt
/wav
后缀名结尾
并且wav的文件名就是它包含的文字内容
这样软件就会自动在这个文件夹中生成一个infer_config.json
{
"ref_wav_path": "./trained/paimeng/既然罗莎莉亚说足迹上有元素力,用元素视野应该能很清楚地看到吧。.wav",
"prompt_text": "既然罗莎莉亚说足迹上有元素力,用元素视野应该能很清楚地看到吧。",
"prompt_language": "中文",
"text_language": "中文",
"gpt_path": "./trained/paimeng/paimeng2-e50.ckpt",
"sovits_path": "./trained/paimeng/paimeng_e75_s81900.pth"
}
也可以手动编辑来指定路径
如果因为调整其中文件导致出现问题,请手动删去infer_config.json
,软件会重新生成
在trained
文件夹下有一个character_info.json
通过修改它可以改变默认角色
{
"deflaut_character":"hutao"
}
用.\runtime\python.exe .\inference_backend.py
调用或者直接双击bat即可
比如用阅读3.0 https://github.com/gedoor/legado
http://192.168.0.106:5000/tts,
{
"method": "POST",
"body": {
"cha_name": "hutao",
"text": "{{java.encodeURI(speakText)}}"
}
}
调整链接为你的挂载点
它默认运行在5000端口,挂载点是例如[http://192.168.0.106:5000/tts](http://192.168.0.106:5000/tts,)
{
"method": "POST",
"body": {
"cha_name": "hutao",
"text": "{{java.encodeURI(speakText)}}"
}
}
其中text
是必要项
cha_name
可选,请确保在trained
中存在对应模型,不指定则使用默认模型
返回音频文件