GPT-SoVITS beta1.30，一分钟复刻声音，支持中日英，国人自研低成本AI音色克隆软件

简述：

本软件为B站UP主@花儿不哭耗时两个月自主研发的开源低成本AI音色克隆软件（GitHub Star7.9k），他也是知名声音克隆软件Bert-vits2和RVC变声器的创始人，按照他视频里的说法，本软件一分钟就能复刻声音(并且效果比今年1月爆火的人工智能语音公司ElevenLabs的技术好很多)，还有5秒极限复刻模式，用于特殊情况。我花了三天时间实测了一下效果确实很好，只需要半个小时就能训练出你想要的声音，并且1分钟的音频训练出来的相似度已经很高了，底下评论区置顶也有成功案例，因此来向大家推荐

此外，由于软件几乎每天都更新，且处于beta阶段，目前并没有版本号，因此暂时用最后一次更新的日期代表版本号，等软件作者给出明确版本号我再更新版本号

配置要求（直接借用秋月大佬的话了）：

训练至少10系及以上，A卡(rx6000除外)和I卡别想训练，推理还行(cpu)

训练显存至少6G，推理至少2G

看显存：任务管理器/性能/GPU/专用GPU内存

16系显卡需要额外配置

硬要用cpu训练的劝你不要为难电脑，不如玩其他去

功能：

零样本文本到语音（TTS）：输入 5 秒的声音样本，即刻体验文本到语音转换。
少样本 TTS：仅需 1 分钟的训练数据即可微调模型，提升声音相似度和真实感。
跨语言支持：支持与训练数据集不同语言的推理，目前支持英语、日语和中文。
WebUI 工具：集成工具包括声音伴奏分离、自动训练集分割、中文自动语音识别(ASR)和文本标注，协助初学者创建训练数据集和 GPT/SoVITS 模型。

音频展示：

这部分请大家先去看官方的演示视频吧，体验一下这个视频最开始给我的震撼

官方演示视频地址：https://www.bilibili.com/video/BV12g4y1m7Uw

再附上我自己初步训练的日文测试音频以及B站UP和辛勤答疑员白菜工厂1145号员工训练的很不错的测试音频合集：https://wwb.ayxkfq.com/iJ7Ku1mved5c

整合包安装地址：

ANR界资源网盘：https://nr.ayxkf.com/pan/s/1OE5qL0KreO-ASHwm6Zl9gA?pwd=mqpi 提取码：mqpi

123云盘：https://www.123pan.com/s/5tIqVv-GVRcv.html

请大家不要将该软件用于违法用途，并且在开始之前，你必须同意并遵循使用规约，在任何音视频网站发布基于 GPT-SoVITS 项目或本整合包制作的作品时，必须在简述注明相关的说明。简述模板在下方。

本软件以MIT协议开源, 作者不对软件具备任何控制力, 使用软件者、传播软件导出的声音者自负全责.
如不认可该条款, 则不能使用或引用软件包内任何代码和文件. 详见根目录LICENSE.

免责声明：
1：如非特殊说明，本站提供的素材及源码教程不拥有任何权利，其版权归原着者拥有。
2：本站内容均由互联网收集整理、网友上传，并且以技术研究交流为目的，仅供大家参考、学习，不存在任何商业目的与商业用途。
3：本站部分收费内容因本站持有版权专利，也仅做为本站日常维护费用，若您需要商业运营或用于其他商业活动，请您购买正版授权并合法使用。
4：请勿将本站教程进行商业交易、转载等行为，只为研究、学习所提供，如使用后发生的一切问题与本站无关。
5：站内任何内容若有侵犯你的版权，请@客服QQ：994859115指出，本站将立即改正删除。
6：本站任何内容文字均为网络收集，不承担任何版权问题，也不提供任何技术支持！

简述：

功能：

音频展示：

相关文章