千家信息网

基于RTVC-7 Voice Cloning Model 的Tuned-GE2E-SayEN-EarSpeech 搭建怎样的

发表于:2025-12-03 作者:千家信息网编辑
千家信息网最后更新 2025年12月03日,基于RTVC-7 Voice Cloning Model 的Tuned-GE2E-SayEN-EarSpeech 搭建怎样的,相信很多没有经验的人对此束手无策,为此本文总结了问题出现的原因和解决方法,
千家信息网最后更新 2025年12月03日基于RTVC-7 Voice Cloning Model 的Tuned-GE2E-SayEN-EarSpeech 搭建怎样的

基于RTVC-7 Voice Cloning Model 的Tuned-GE2E-SayEN-EarSpeech 搭建怎样的,相信很多没有经验的人对此束手无策,为此本文总结了问题出现的原因和解决方法,通过这篇文章希望你能解决这个问题。

0. 说明

  • 和 https://blog.csdn.net/u013625492/article/details/114433738 中 GE2E 的版本几乎一致

  • 区别就是文本是 英文, 使用 VCTK 等英文数据集训练

1. Git Clone

  • https://github.com/ruclion/Tuned-GE2E-SayEN-EarSpeech

2. 训练数据

2.1. VCTK

之前训练 AutoVC 用过

  • 处理数据的逻辑从: /ceph/home/hujk17/Tuned-GE2E-SayEN-EarSpeech/FaPig_extract_GE2E_VCTK_nosli.py 开始

  • 保留了 train, val, unseen. 训练的时候只使用 train

3. speaker embedding

在 2.1. 中也一并提取了, 使用 GE2E

4. 预处理数据 -> mel

在 2.1. 中也一并提取了, 使用 实验室的 mel. 嘿嘿(●ˇ∀ˇ●), 终于方便啦

5. 改代码

  • symbols 不用动, 本身就保留了英文的标点

  • 需要改下 train.txt 的路径

  • 以 Kiss 为模型名字, 逻辑从 Kiss_train.py 开始

  • 直接用 本来的小 Batch 训练, batch_size = 12

6. GE2E 版逻辑

  • 256 的 Embedding 仍然后面接了一个 FC, 和中文的一致

  • 中文的叫 FaPig, 英文叫 Kiss, 逻辑从 Kiss_train.py 开始

  • from synthesizer.FaPig_train import train 和 from synthesizer.Kiss_train import train 其实完全一致, 只是为了统一格式, 拷贝了一份

看完上述内容,你们掌握基于RTVC-7 Voice Cloning Model 的Tuned-GE2E-SayEN-EarSpeech 搭建怎样的的方法了吗?如果还想学到更多技能或想了解更多相关内容,欢迎关注行业资讯频道,感谢各位的阅读!

训练 数据 逻辑 英文 一致 内容 方法 更多 问题 中文 束手无策 为此 不用 代码 原因 只是 名字 实验室 对此 就是 数据库的安全要保护哪些东西 数据库安全各自的含义是什么 生产安全数据库录入 数据库的安全性及管理 数据库安全策略包含哪些 海淀数据库安全审计系统 建立农村房屋安全信息数据库 易用的数据库客户端支持安全管理 连接数据库失败ssl安全错误 数据库的锁怎样保障安全 有关信息网络安全的作文 虚拟服务器如何防护 数据库链接名和密码默认是什么 医院军营网络安全宣传周心得体会 怎么创建数据库关联表 网络安全法制什么起施行 构建产品数据库 crass数据库工具 网络安全应急指导书 服务器子域里面创子域 高中网络技术应用课本下载 数据库中关系模型中常用术语 有关网络安全 公交卡充值卡软件开发 网络安全手抄报小手拉大手一等奖 能源管理系统服务器 冷链节点服务器 usdt 搜索六年级网络安全征文150字 广州工行软件开发中心薪水 互联网科技有限公司注册商标 永成网络技术有限公司苏州 数据库照片怎么保存 服务器一连接向日葵就卡 软件开发到底有没有前途 hp 1001打印服务器 南京创新计算机网络技术服务活动 剑3女性捏人数据库 龙岩兴创网络技术有限公司 绝地求生今天服务器 学手机软件开发的工资高吗
0