Amphion:一个开源的音频、音乐和语音生成项目。由大名鼎鼎的 OpenMMLab 联合香港中文大学(深圳)联合推出的。硅谷大佬也给这个项目带货,打了 A+++级: https://www.bilibili.com/video/BV18w411V7iq/
支持如下功能:
GitHub:github.com/open-mmlab/Amphion
以上功能均可在 HuggingFace 上使用。
1
raycool 2023-12-25 10:22:19 +08:00
不错,现在 TTS 的研究也越来越多了
对 openai 的 TTS 效果还是蛮感兴趣的,感觉是目前天花板。 |
2
wswlaz 2023-12-25 10:22:37 +08:00
TTS 不支持中文吗
|
5
yao978318542 2023-12-25 10:57:04 +08:00
好像不支持中文啊
|
7
gues OP @yao978318542 有兴趣的话,可以上手来加一下。我去反馈给开源团队
|
8
capgrey 2023-12-25 13:34:29 +08:00
GitHub 仓库演示的《稻香》,我哭死😭
|
9
qW7bo2FbzbC0 2023-12-25 13:47:25 +08:00
顺路问下,声音模型怎么训练?我看 github 上 svc 项目很多都声明不适用声音模型训练,而国内很多文章或者教程都是用 sovit 或者 svc 来出效果?
|
10
Pepega 2023-12-25 14:44:13 +08:00
很感兴趣,我目前看到的 tts 最赚钱的例子是直播打赏,请问训练出个性化声音的 tts 成本高吗,让用户自己训练自己的 tts 呢?
link:dHRzLm1vbnN0ZXI= |
11
dorm 2023-12-25 14:58:32 +08:00
适用了一下,声音非常沙哑,就像是嗓子有痰似的
|
12
AdminRoot123 2023-12-25 15:19:42 +08:00
用了一下中文效果贼差 文字读的都不正确很长的噪音
|
13
gues OP @AdminRoot123 模型应该还没有用中文数据训练过
|
15
dorm 2023-12-26 09:37:37 +08:00
@gues singing_voice_conversion 上传了一个《向天再借五百年》 target Singer 随便选一个都是很沙哑的
|
17
dorm 364 天前
|