训练流程介绍

约 417 字大约 1 分钟

2026-03-26

刷到很多视频使用AI训练生成歌曲，有的是替换原歌曲的人声，有的是修改歌词后生成新的歌曲，感觉挺有意思，但一直没有时间尝试（虽然现在也没空吧），不过可以慢慢研究看看

AI训练生成歌曲的一般流程为

训练流程

准备原歌曲，即需要生成新歌曲的歌曲，一般包含有歌手的人声和其他乐器的声音

在这一步中，我们将会使用人声分离工具将原歌曲中的人声提取出来，从而得到 vocal 轨道
这里我们使用 UVR（Ultimate Vocal Remover） 来进行人声分离

这里贴一下Windows系统软件的下载链接：
Main Download Link Main Download Link mirror

使用提取出的 vocal 轨道训练声音模型（如 WaveNet），模型会学习到歌手的语音特征

https://github.com/svc-develop-team/so-vits-svc

使用训练好的声音模型对原歌曲进行推理，生成新的歌曲，替换原歌曲中的人声

如果需要修改歌词或添加新的内容，可以使用 TTS（文本到语音）或 SVS（语音到语音）工具重新填词

将新生成的歌曲与原歌曲中的其他乐器声音混音，得到最终的成品歌曲