训练流程介绍
约 417 字大约 1 分钟
2026-03-26
刷到很多视频使用AI训练生成歌曲,有的是替换原歌曲的人声,有的是修改歌词后生成新的歌曲,感觉挺有意思,但一直没有时间尝试(虽然现在也没空吧),不过可以慢慢研究看看
AI训练生成歌曲的一般流程为 
训练流程
1. 原歌曲准备
准备原歌曲,即需要生成新歌曲的歌曲,一般包含有歌手的人声和其他乐器的声音
2. 人声分离 => 提取 vocal
在这一步中,我们将会使用人声分离工具将原歌曲中的人声提取出来,从而得到 vocal 轨道
这里我们使用 UVR(Ultimate Vocal Remover) 来进行人声分离
这里贴一下Windows系统软件的下载链接:
Main Download LinkMain Download Link mirror
3. 训练声音模型
使用提取出的 vocal 轨道训练声音模型(如 WaveNet),模型会学习到歌手的语音特征
https://github.com/svc-develop-team/so-vits-svc
4. 推理 => 换声
使用训练好的声音模型对原歌曲进行推理,生成新的歌曲,替换原歌曲中的人声
5. (可选)重新填词 + TTS / SVS
如果需要修改歌词或添加新的内容,可以使用 TTS(文本到语音)或 SVS(语音到语音)工具重新填词
6. 混音输出成品
将新生成的歌曲与原歌曲中的其他乐器声音混音,得到最终的成品歌曲
