V2EX = way to explore
V2EX 是一个关于分享和探索的地方
Sign Up Now
For Existing Member  Sign In
WarlockMan
V2EX  ›  问与答

这种 AI 配音是如何调的

  •  
  •   WarlockMan · Nov 5, 2023 · 2140 views
    This topic created in 909 days ago, the information mentioned may be changed or developed.

    我在学前端的时候刷到一个讲解什么是纯函数的视频, 声音是 AI 生成的,但他用的这个音色非常特殊, 不是各大语音合成厂商提供好的预制角色, 火山引擎和微软 Azure 里的预制音色都没找到他这种音色, 这种音色是他自己调的吗,是用 Azure 定制性训练出来的么

    源视频:什么是纯函数 https://www.bilibili.com/video/BV1QM41197sz/

    4 replies    2023-11-06 09:45:03 +08:00
    Solix
        1
    Solix  
       Nov 5, 2023 via iPhone
    腾讯云和阿里云的合成看看
    WarlockMan
        2
    WarlockMan  
    OP
       Nov 5, 2023
    @gaobh
    国内的几个大厂都看过了,预制角色里面没这种音色,像是自己用材料训练的定制音色。
    目前语音合成领域前沿大厂有微软,谷歌,字节跳动旗下的火山,
    目前就体验这几家能把声音做到自然,
    百度,阿里和腾讯的引擎有很重的机械音,能听出非常不自然,感觉在梯队上差了一级。

    现在的微软 Azure 语音合成在"自然"这个指标上应该是最高的,
    大概在七八年前好像,微软有个语音助手的项目叫 cortana ,
    从那个时候微软就在死磕拟真程度,
    那时候它的自然度就已经是这么高了。

    字节的火山引擎我猜测大概率是调用的微软接口,
    大厂就这么几家,也就是微软在一直烧钱死磕 AI 领域十多年,
    其他厂商想赶上短时间应该很难,
    所以我猜测大概率是用的微软 Azure 接口训练的定制音色,
    但我只是猜测,不敢肯定
    asrpub
        3
    asrpub  
       Nov 5, 2023 via Android
    就是普通的 TTS 吧,多找找其他的厂商,像魔音工坊也可以看看
    LLaMA2
        4
    LLaMA2  
       Nov 6, 2023   ❤️ 1
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   2474 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 34ms · UTC 08:01 · PVG 16:01 · LAX 01:01 · JFK 04:01
    ♥ Do have faith in what you're doing.