V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
• 请不要在回答技术问题时复制粘贴 AI 生成的内容
SzgSw5zGyN1iy
V2EX  ›  程序员

可以在 Win11 下使用,有这种开源,本地部署安装的语音转文字实现吗?(不是输入法场景调用方式)

  •  
  •   SzgSw5zGyN1iy · 32 天前 · 1137 次点击
    这是一个创建于 32 天前的主题,其中的信息可能已经有所发展或是发生改变。

    场景:Win11
    内容本地部署,不跟网络有通信传输关于内容的东西
    可选择声音来源( 3.5mm 麦克风,USB 麦克风,蓝牙麦克风这些设备)
    后台常驻
    只要有声音来源(普通话)就转换成文字,上屏,而不管当前焦点是什么程序,什么窗口

    使用者就可以用 3.5mm 带 PTT 功能的麦克风,辅助打中文字,按下 PTT 键,说话,就把文字粘上去了

    有这样的本地部署程序吗?

    看过迅飞有这样类似功能的键盘、鼠标硬件产品,但是 OP 不想因为这个联他们家的服务器,和大多数人用 RIME 小狼毫一样的原因,所以就不考虑联网功能的其它品牌现成产品了。。。


    如果没有合适的,OP 真要这么实现,那么各位可以指教 OP ,有什么现成的套件带 SDK ,提供开发接口,可以很接近地去实现呢?

    10 条回复    2024-11-21 20:22:37 +08:00
    codehz
        1
    codehz  
       32 天前
    win10/11 不是自带一个语音转文字吗,那玩意是可以断网运行的啊,初次使用需要下载模型,下载完了就是纯本地的
    SzgSw5zGyN1iy
        2
    SzgSw5zGyN1iy  
    OP
       32 天前
    @codehz #1 这个以前有用过,WSR 在以后版本的 WIN11 还会变化( 22H3 已经提到后继版本会移除这个功能),这些先不管,场景是要按物理按键,不用鼠标对准悬浮工具条点击开始,点击结束
    想要有一个后台长久拾音转换实现
    SzgSw5zGyN1iy
        3
    SzgSw5zGyN1iy  
    OP
       32 天前
    上面打错字了,是 23H2 版本
    katwalk
        4
    katwalk  
       32 天前
    有现成的,但是是按住键盘按键
    hj18
        5
    hj18  
       31 天前
    whisper 可以吗?我用过,本地部署。
    SzgSw5zGyN1iy
        6
    SzgSw5zGyN1iy  
    OP
       31 天前
    @katwalk 请问,可还记得大概名字?
    @hj18 ,先 mark ,安排上试试看,谢谢!
    debuggerx
        7
    debuggerx  
       31 天前
    阿里的 FunASR 可以本地部署,cpu 版本实测效果还不错,就是相比成熟的 ASR 云服务可定制性差一点。
    https://github.com/modelscope/FunASR/blob/main/README_zh.md
    Do1phln
        8
    Do1phln  
       31 天前
    PaddleSpeech 之前本地部署过一次,效果还可以,就是对算力可能有一定要求
    Hozoy
        9
    Hozoy  
       31 天前
    我倒是想更进一步,可以做到实时语音转文字并且根据上下文拟人双语翻译的
    hellomacos
        10
    hellomacos  
       31 天前
    推荐 kaldi ,这个实时的,还能根据语音识别为谁在说话。
    这个符合你的需求:
    https://github.com/kaldi-asr/kaldi
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   888 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 21ms · UTC 20:05 · PVG 04:05 · LAX 12:05 · JFK 15:05
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.