V2EX = way to explore
V2EX 是一个关于分享和探索的地方
Sign Up Now
For Existing Member  Sign In
爱意满满的作品展示区。
qfdk

五一假期写代码不想打字? Mac 语音输入工具 Voilà,送 20 个免费授权

  •  
  •   qfdk ·
    PRO
    ·
    qfdk · 23h 42m ago · 1186 views

    Demo

    为什么做这个

    去年迷上了 Claude Code ,但每次都要打字描述需求,有点累。市面上的语音输入工具试了一圈:要么贵、要么单语种、要么不支持润色,甚至粘贴到终端还会丢字。

    6 个月前干脆自己做了一个,专注 macOS 语音输入。界面不花哨,但够实用,有需要可以试试。

    我的场景比较特殊:人在海外开发,中英法混用,一句话里频繁切换语言。这正好是大多数商业方案的痛点。

    目前已经完全融入日常工作流,每天触发上百次,用得很顺手。

    几个比较用心的点

    • 多引擎可选:Soniox / ElevenLabs / 火山引擎 / Groq Whisper / Apple Speech ,按需切换
    • 实时字幕浮窗:说话时能看到识别中的文字流,不用等结果出来才知道说错了
    • AI 自动润色:去口水词、补标点、修口误,置信度高时自动跳过润色省 200ms 延迟
    • 终端友好:Ghostty / iTerm2 / Kitty 通过 Accessibility API 直接走菜单粘贴,不会被 Cmd+V 事件丢字
    • 自定义词汇表:人名、专业术语强制替换,不会再把 "Soniox" 识别成 "骚扰客死"
    • 隐私:本地优先,云端 STT 直连官方 API ,不经过我自己的服务器

    引擎怎么选

    如果你跟我一样要写英文代码注释、和海外团队对接、刷英文文档、中英混着说话,首选 Soniox。这五个引擎我都跑了几个月,Soniox 是多语种混合识别最稳的一个:

    • Soniox:中英法日西自动切换,无需指定语种,首字延迟 ~1 秒,海外开发者 / 中英混说场景强推
    • 火山引擎:纯中文最准,但不支持混合识别,碰到英文单词会音译成汉字
    • Groq Whisper:英文最强,但是 HTTP 批量识别不是流式,延迟高
    • ElevenLabs:英文流式好,中文一般
    • Apple Speech:完全本地,隐私最好,但中英混说会跳错语种

    试用期 30 天可以把这几个引擎挨个跑一遍,选最顺手的。

    仅支持 Apple Silicon ( M1 及以上)+ macOS 14 Sonoma 及以上

    PS

    • 不订阅、不联网激活、License 文件离线验证
    • 当然了,还有隐藏授权,比如说你想专门体验的老哥也可以信箱私,主要交个朋友.
    • 20 个免费早鸟授权,先到先得,结账时输入折扣码 VOILAV2EX,价格直接归零
    • 官网: https://voilapro.app

    技术栈感兴趣的也欢迎聊:Swift + SwiftUI 、AVAudioEngine 抓音频、WebSocket 流式 STT 、Ed25519 离线 License 验签。

    42 replies    2026-05-04 01:59:34 +08:00
    okchum
        1
    okchum  
       9h 53m ago   ❤️ 1
    看来 51 放假大家都没兑换啊. 隔了 10 个小时还能兑换了一个. 谢谢楼主啊, 我试试看
    HvangStormstout
        2
    HvangStormstout  
       9h 41m ago   ❤️ 1
    有适配 windows 平台的计划吗?😘
    Dream11
        3
    Dream11  
       9h 14m ago
    @okchum 佬,有点没明白在哪里使用,请教一下谢谢
    Dream11
        4
    Dream11  
       9h 11m ago
    @okchum 是税务识别号码
    Dream11
        5
    Dream11  
       9h 1m ago
    佬,在哪里可以输入折扣吗呀
    qfdk
        6
    qfdk  
    OP
    PRO
       8h 53m ago
    @okchum 只是默默的加到了 50
    qfdk
        7
    qfdk  
    OP
    PRO
       8h 53m ago
    @Dream11 #5 购买的付款的时候可以输入哈
    qfdk
        8
    qfdk  
    OP
    PRO
       8h 52m ago
    @HvangStormstout 不好意思,可能让您失望了, 因为没有 windows 设备,而且是用的原生 swift 为了达到更好的流畅体验.搞了快 6 个月了, 大大小小的 bug, macos 平台稳定了.
    lihua
        9
    lihua  
       8h 51m ago
    有点没明白,在哪输入折扣码。
    Bssn
        10
    Bssn  
       8h 50m ago   ❤️ 1
    感谢 op
    qfdk
        11
    qfdk  
    OP
    PRO
       8h 49m ago
    @lihua 刚才最后的 被人使用了, 我重新扩一下人数. 私信我的话可以直接给你生成新类型的授权 :)
    lihua
        12
    lihua  
       8h 49m ago   ❤️ 1
    @lihua 找到了。多谢大佬。
    lihua
        13
    lihua  
       8h 49m ago
    @qfdk 找到了,多谢大佬。
    qfdk
        14
    qfdk  
    OP
    PRO
       8h 47m ago
    @Dream11 #5 刚才那会儿最后的被人兑换了, 我刚刚扩充了下, 要是不行的话我可以直接给您码子. 当然是特殊类型授权:)
    Dream11
        15
    Dream11  
       8h 43m ago   ❤️ 1
    感谢佬,是个好项目,很顶
    amnaruto
        16
    amnaruto  
       8h 38m ago   ❤️ 1
    感谢大佬分享,耍耍
    Dream11
        17
    Dream11  
       8h 19m ago   ❤️ 1
    我这边好像有一个 bug ,隔一段时间第一次唤醒的时候,它就一直在聆听,没有实时转换,最后也没有输出文本,但是我看见窗口的音频是有变化的
    qfdk
        18
    qfdk  
    OP
    PRO
       8h 17m ago
    @Dream11 #17 感谢, 我稍后邮件联系您看下细节. 顺便送上一个特殊授权
    teaguexiao
        19
    teaguexiao  
       8h 2m ago   ❤️ 1
    终端友好这个点确实是痛点,用 Cmd+V 贴终端经常丢字或触发自动补全完全跟想要的不一样。想请问一下多语种混识时延迟怎么样,特别是中英文切换的首字延迟?
    qfdk
        20
    qfdk  
    OP
    PRO
       7h 59m ago
    @teaguexiao 多语言混输延迟很很靠谱的 我推荐你使用 Soniox 模型。几乎没有延迟,你可以看 demo 的 gif. 场景是中文 + 法语+ 英语.
    qfdk
        21
    qfdk  
    OP
    PRO
       7h 41m ago
    @teaguexiao 看老哥也是开发者 做了语音输入,如果需要的话 我可以单独给你一个开发者授权,同行也欢迎一起来改进 :)
    我做语音输入本质都是自己一直在使用的 里面会碰到很多各种各样的痛点 比如说切换显示器的时候 麦克风会丢失 切换笔记本 切换耳机 切换蓝牙 各种各样的这样的小问题吧 碰了也是很多产品也一直在打磨.
    PaulSamuelson
        22
    PaulSamuelson  
       7h 18m ago   ❤️ 1
    感谢,大假期间还在逛 V 的朋友有好运。
    Livid
        23
    Livid  
    MOD
    PRO
       6h 48m ago   ❤️ 1
    这是我最近在 /go/create 看到的最让我激动的作品。

    反馈一个小问题:窗口不在焦点的时候,有些按钮就不会显示。不知道是不是特意这样设计的。

    比如不在焦点的时候,Next 就没有显示:

    Vnaner
        24
    Vnaner  
       6h 15m ago   ❤️ 1
    需要 windows +1
    47jm9ozp
        25
    47jm9ozp  
       5h 9m ago   ❤️ 1
    快捷键有些复杂,可以参考豆包输入法,双击 alt 或者长按 alt
    47jm9ozp
        26
    47jm9ozp  
       5h 5m ago
    以及,不知道为什么,在进入 checkout 页面时候,给我显示了保加利亚语……
    47jm9ozp
        27
    47jm9ozp  
       4h 54m ago   ❤️ 1
    以及,结束输入之后,状态栏里始终显示 voila 在使用麦克风
    bowencool
        28
    bowencool  
       4h 37m ago   ❤️ 1
    逛 V 站这么久了,第一次领到免费的兑换码,谢谢
    qfdk
        29
    qfdk  
    OP
    PRO
       4h 23m ago
    @Livid 感谢对产品的肯定.还有很多不稳定因素.

    bug 已经修复了,感谢.

    另外 crash 的问题,发现是 mac mini 那边儿没有检测到麦克风,理论上是修复了崩溃的问题.
    bowencool
        30
    bowencool  
       4h 22m ago   ❤️ 1
    能在这里加个指引吗?控制台跟个大迷宫一样,都不知道咋弄
    dnfQzjPBXtWmML
        31
    dnfQzjPBXtWmML  
       4h 20m ago   ❤️ 1
    c'est bien merci
    qfdk
        32
    qfdk  
    OP
    PRO
       4h 8m ago
    @47jm9ozp #27 首先感谢使用.
    快捷键主要使用的都是组合键,避免出现误触,我会下载豆包参考, 因为服务器缘故豆包对海外地区不是很友好.
    关于 Checkout 页面出现了保加利亚语,理论上是 checkout 服务器检测到了某些 浏览器头 导致,或者 ip 的问题,这个抱歉无法控制. 使用显示麦克风,是为了快速激活是为了快速进行语音输入,当你按下组合键的时候 理论上已经开始记录了.
    再次感谢使用反馈
    qfdk
        33
    qfdk  
    OP
    PRO
       4h 6m ago
    @dnfQzjPBXtWmML Avec plaisir ! N’hésite pas si tu as des bugs 😊
    qfdk
        34
    qfdk  
    OP
    PRO
       4h 2m ago
    @bowencool #30 感谢反馈,这些引导,说实话没有太好好做,抱歉带来的困扰.
    这个问题有 V 友反馈了,这是后面需要优化的地方,一开始是个个人用的产品.
    稍后我会发一个特别的授权发给特别的你!
    qfdk
        35
    qfdk  
    OP
    PRO
       3h 46m ago
    @Vnaner 感谢反馈,记录下了. 因为初衷是 自己用又跟手的输入,没有考虑跨平台.
    也是因为没有跨平台,安装包才 8M 左右,到时候出来 windows 版本少不了老哥帮着打磨
    K2
        36
    K2  
    PRO
       2h 17m ago
    @qfdk #20 现在去申请 Soniox API 是不是已经不提供免费额度了?
    tojonozomi
        37
    tojonozomi  
       2h 9m ago   ❤️ 1
    感谢 op ,最近键盘敲多了,手腕不是很舒服,也在找语音输入法,马上试试
    clockcloud
        38
    clockcloud  
       1h 55m ago   ❤️ 1
    感谢分享,试试
    notaCoder
        39
    notaCoder  
       1h 46m ago   ❤️ 1
    和 TypeWhisper 比,有什么独特的地方吗,以前用 Whisper Transcription ,但是后来有的模型要花钱就换着试了好几个,不想再换了
    qfdk
        40
    qfdk  
    OP
    PRO
       51 mins ago
    @notaCoder 我的这个默认可以使用苹果的,苹果的是免费的哟。
    notaCoder
        41
    notaCoder  
       32 mins ago
    @qfdk TypeWhisper 默认也可以使用苹果的
    qfdk
        42
    qfdk  
    OP
    PRO
       4 mins ago
    @notaCoder #41 不好意思我看错了, 以为你说的是 whisper,主要是像我这边做的都是 Soniox, elevenLabs,有 websocket 的加成优化,欧洲很舒服.终端一直在用,配合上靠谱的 API 准确率还是蛮高的,加上我这边有智能分词底层使用 jieba 分词,去掉奇怪的词语.

    TypeWhisper 强在本地模型多 + 插件/CLI/批量转写更全,更像工具箱,马克下,看看有没有好的细节借鉴下 :)
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   977 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 65ms · UTC 18:04 · PVG 02:04 · LAX 11:04 · JFK 14:04
    ♥ Do have faith in what you're doing.