V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
爱意满满的作品展示区。
baiyue
V2EX  ›  分享创造

自研推荐:微软云语音合成、抖音火山语音合成、阿里云语音合成小工具

  •  1
     
  •   baiyue · 2022-07-04 20:37:59 +08:00 · 3144 次点击
    这是一个创建于 899 天前的主题,其中的信息可能已经有所发展或是发生改变。

    效果截图

    内容简介

    Paper2GUI: 一款面向普通人的 AI 桌面 APP 工具箱,免安装即开即用,已支持 20+AI 模型,内容涵盖语音合成、视频补帧、视频超分、目标检测、图片风格化、OCR 识别等领域。支持 Windows 、Mac 、Linux 系统。

    此次介绍的这三个语音合成工具,中文语音丰富、自带呼吸声,效果逼真,欢迎使用。

    下载地址

    如果对人工智能感兴趣,可以帮忙在 github 给个 star :)

    https://github.com/Baiyuetribe/paper2gui

    14 条回复    2022-08-26 20:40:57 +08:00
    a570295535
        1
    a570295535  
       2022-07-04 20:47:09 +08:00 via Android
    点进去东西挺多啊,厉害👍呀!
    yanwen
        2
    yanwen  
       2022-07-04 21:47:34 +08:00
    一种接口一个 app 有点多 。如果可以的话,整合成一个 app 就更好了 (参考 Bob )
    baiyue
        3
    baiyue  
    OP
       2022-07-04 22:58:31 +08:00
    @yanwen 已在规划中,近期会优先上线 web 在线体验版,后续整合最优的小工具为一个
    baox2
        4
    baox2  
       2022-07-04 23:21:51 +08:00
    RVM-GUI 智能图片抠图工具
    速度很快,但抠像出来的图怎么都统一变成了 512*512 像素了阿?@baiyue
    linKnowEasy
        5
    linKnowEasy  
       2022-07-05 09:26:53 +08:00
    感谢, star 了, 希望有整合版后 @ 我一下
    baiyue
        6
    baiyue  
    OP
       2022-07-05 13:06:28 +08:00
    @baox2 rvm 受限于模型转换问题,输出只能固定尺寸,推荐使用另外两个抠图工具,比如 modnet 或 mobilenet ,支持图片或视频抠图。
    dfgxcvbcv
        7
    dfgxcvbcv  
       2022-07-05 14:36:26 +08:00
    现在调现成的接口都能算自研了吗?
    shuang
        8
    shuang  
       2022-07-05 23:54:45 +08:00
    省流:下载 app 后需要自己提供 key 才能用
    o00O00o
        9
    o00O00o  
       2022-07-06 09:12:46 +08:00
    请教一下,桌面端是使用的什么技术栈呢?
    baiyue
        10
    baiyue  
    OP
       2022-07-06 09:40:47 +08:00
    @o00O00o 项目里有介绍,该项目主要是基于 webview2 开发的图形界面,使用 wails 组合 vue 前端和 go 后端。所以界面是 VUE 写的,逻辑部分由 go 语言完成,AI 推理这块使用 c++里的 ncnn 推理框架,搭配 vulkan 实现任意显卡支持,同时也为基于 wasm 的网页应用和移动端 app 提供可能。
    icebear0
        11
    icebear0  
       2022-07-06 09:54:48 +08:00
    看到 OP 的这个,我第一时间想到的就是 bob (一个翻译软件),前几天也发布了正式版本,也在 V 站上抽奖过。
    所以如果 OP 做一个 bob 的插件(可以做成语音插件)的话,我相信肯定会有很多人使用,并且也能达到宣传自己这个项目的作用。
    bob 这款软件之前在 GitHub 上获得了 6.3K 的星,而且对应的群中,也有几千人在使用
    sjzjams
        12
    sjzjams  
       2022-07-06 10:07:31 +08:00
    @dfgxcvbcv 整合成一个工具 这不是更方便使用了吗,算的
    newledge
        13
    newledge  
       2022-08-19 11:10:43 +08:00
    最近就想搞搞语音合成。
    baiyue
        14
    baiyue  
    OP
       2022-08-26 20:40:57 +08:00
    @yanwen @sjzjams 感谢关注,项目已正式上线整合版,比现有开源的更全面更专业,持久维护。参见 https://github.com/Baiyuetribe/paper2gui
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2147 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 27ms · UTC 00:01 · PVG 08:01 · LAX 16:01 · JFK 19:01
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.