Code Monkey home page Code Monkey logo

Comments (10)

company8 avatar company8 commented on August 17, 2024 1

@kexul 这几个感觉都是几个小时的数据训练的 啊。
@selfboot 挺像 但是声音质量有点差是啥意思

就是我样本采集的时候,有轻微背景噪音,我也没去噪音。

有啥好办法去噪么?我现在是用audacity手动搞的,费劲

UVR5

from gpt-sovits.

kexul avatar kexul commented on August 17, 2024

B站有很多视频:https://www.bilibili.com/video/BV1aQ4y1w7bF https://www.bilibili.com/video/BV1Hw411J7aA

from gpt-sovits.

selfboot avatar selfboot commented on August 17, 2024

我自己训练了个,给不同人听,有的说很像,有的说不像。

录了 1 分钟多音频,但是声音质量有点差,有噪音在里面。用默认参数训练,我觉得还挺像

from gpt-sovits.

lucasjinreal avatar lucasjinreal commented on August 17, 2024

@kexul 这几个感觉都是几个小时的数据训练的 啊。

@selfboot 挺像 但是声音质量有点差是啥意思

from gpt-sovits.

kexul avatar kexul commented on August 17, 2024

@kexul 这几个感觉都是几个小时的数据训练的 啊。

@selfboot 挺像 但是声音质量有点差是啥意思

视频作者的数据有放在hugging face上的,大部分都是半个小时左右吧。我尝试用半个小时左右的音频训了一下,感觉还是挺像的,就是有的时候会吞字和重复,可能是素材本身普通话就说的不标准的问题,也有可能是训过头了(我用了40epoch)。

音质差就是出来的声音会有噪声,可能是素材有底噪,也有可能是底模的问题(好像模型的训练集数据采样率是32000hz)。我用我自己收集的直播数据,训练出来感觉音质就很差,然后用上面的视频里面的数据,训练出来的效果还可以,但是比原始素材里面的音质还是差点。

from gpt-sovits.

selfboot avatar selfboot commented on August 17, 2024

@kexul 这几个感觉都是几个小时的数据训练的 啊。

@selfboot 挺像 但是声音质量有点差是啥意思

就是我样本采集的时候,有轻微背景噪音,我也没去噪音。

from gpt-sovits.

kexul avatar kexul commented on August 17, 2024

@kexul 这几个感觉都是几个小时的数据训练的 啊。

@selfboot 挺像 但是声音质量有点差是啥意思

就是我样本采集的时候,有轻微背景噪音,我也没去噪音。

有啥好办法去噪么?我现在是用audacity手动搞的,费劲

from gpt-sovits.

lucasjinreal avatar lucasjinreal commented on August 17, 2024

@kexul 你是自己标注了6分钟数据训练的吗,有没有音频听一下看看

from gpt-sovits.

kexul avatar kexul commented on August 17, 2024

@kexul 你是自己标注了6分钟数据训练的吗,有没有音频听一下看看

我用webui里面的打标工具搞的,里面是调用了阿里的funasr来做asr,然后手动检查了一下文本。感觉需要修改的地方主要是断句,加了一些标点符号。

我这边差不多收集了30多分钟的音频。效果我不知道能不能分享,收集的一个知名解说的直播视频,感觉会有版权问题...

from gpt-sovits.

kexul avatar kexul commented on August 17, 2024

刚刚试了一下只用6分钟左右来微调,感觉效果还是不太行,比之前半小时的数据差距很明显。估计数据还是越多越好。

from gpt-sovits.

Related Issues (20)

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.