
去年迷上了 Claude Code ,但每次都要打字描述需求,有点累。市面上的语音输入工具试了一圈:要么贵、要么单语种、要么不支持润色,甚至粘贴到终端还会丢字。
6 个月前干脆自己做了一个,专注 macOS 语音输入。界面不花哨,但够实用,有需要可以试试。
我的场景比较特殊:人在海外开发,中英法混用,一句话里频繁切换语言。这正好是大多数商业方案的痛点。
目前已经完全融入日常工作流,每天触发上百次,用得很顺手。
如果你跟我一样要写英文代码注释、和海外团队对接、刷英文文档、中英混着说话,首选 Soniox。这五个引擎我都跑了几个月,Soniox 是多语种混合识别最稳的一个:
试用期 30 天可以把这几个引擎挨个跑一遍,选最顺手的。
仅支持 Apple Silicon ( M1 及以上)+ macOS 14 Sonoma 及以上
技术栈感兴趣的也欢迎聊:Swift + SwiftUI 、AVAudioEngine 抓音频、WebSocket 流式 STT 、Ed25519 离线 License 验签。
1
okchum 9h 53m ago 看来 51 放假大家都没兑换啊. 隔了 10 个小时还能兑换了一个. 谢谢楼主啊, 我试试看
|
2
HvangStormstout 9h 41m ago 有适配 windows 平台的计划吗?😘
|
5
Dream11 9h 1m ago
佬,在哪里可以输入折扣吗呀
|
8
qfdk OP PRO @HvangStormstout 不好意思,可能让您失望了, 因为没有 windows 设备,而且是用的原生 swift 为了达到更好的流畅体验.搞了快 6 个月了, 大大小小的 bug, macos 平台稳定了.
|
9
lihua 8h 51m ago
有点没明白,在哪输入折扣码。
|
10
Bssn 8h 50m ago 感谢 op
|
15
Dream11 8h 43m ago 感谢佬,是个好项目,很顶
|
16
amnaruto 8h 38m ago 感谢大佬分享,耍耍
|
17
Dream11 8h 19m ago 我这边好像有一个 bug ,隔一段时间第一次唤醒的时候,它就一直在聆听,没有实时转换,最后也没有输出文本,但是我看见窗口的音频是有变化的
|
19
teaguexiao 8h 2m ago 终端友好这个点确实是痛点,用 Cmd+V 贴终端经常丢字或触发自动补全完全跟想要的不一样。想请问一下多语种混识时延迟怎么样,特别是中英文切换的首字延迟?
|
20
qfdk OP PRO @teaguexiao 多语言混输延迟很很靠谱的 我推荐你使用 Soniox 模型。几乎没有延迟,你可以看 demo 的 gif. 场景是中文 + 法语+ 英语.
|
21
qfdk OP PRO @teaguexiao 看老哥也是开发者 做了语音输入,如果需要的话 我可以单独给你一个开发者授权,同行也欢迎一起来改进 :)
我做语音输入本质都是自己一直在使用的 里面会碰到很多各种各样的痛点 比如说切换显示器的时候 麦克风会丢失 切换笔记本 切换耳机 切换蓝牙 各种各样的这样的小问题吧 碰了也是很多产品也一直在打磨. |
22
PaulSamuelson 7h 18m ago 感谢,大假期间还在逛 V 的朋友有好运。
|
23
Livid MOD PRO |
24
Vnaner 6h 15m ago 需要 windows +1
|
25
47jm9ozp 5h 9m ago 快捷键有些复杂,可以参考豆包输入法,双击 alt 或者长按 alt
|
26
47jm9ozp 5h 5m ago
以及,不知道为什么,在进入 checkout 页面时候,给我显示了保加利亚语……
|
27
47jm9ozp 4h 54m ago 以及,结束输入之后,状态栏里始终显示 voila 在使用麦克风
|
28
bowencool 4h 37m ago 逛 V 站这么久了,第一次领到免费的兑换码,谢谢
|
29
qfdk OP PRO |
30
bowencool 4h 22m ago |
31
dnfQzjPBXtWmML 4h 20m ago c'est bien merci
|
32
qfdk OP PRO @47jm9ozp #27 首先感谢使用.
快捷键主要使用的都是组合键,避免出现误触,我会下载豆包参考, 因为服务器缘故豆包对海外地区不是很友好. 关于 Checkout 页面出现了保加利亚语,理论上是 checkout 服务器检测到了某些 浏览器头 导致,或者 ip 的问题,这个抱歉无法控制. 使用显示麦克风,是为了快速激活是为了快速进行语音输入,当你按下组合键的时候 理论上已经开始记录了. 再次感谢使用反馈 |
33
qfdk OP PRO @dnfQzjPBXtWmML Avec plaisir ! N’hésite pas si tu as des bugs 😊
|
34
qfdk OP PRO @bowencool #30 感谢反馈,这些引导,说实话没有太好好做,抱歉带来的困扰.
这个问题有 V 友反馈了,这是后面需要优化的地方,一开始是个个人用的产品. 稍后我会发一个特别的授权发给特别的你! |
35
qfdk OP PRO @Vnaner 感谢反馈,记录下了. 因为初衷是 自己用又跟手的输入,没有考虑跨平台.
也是因为没有跨平台,安装包才 8M 左右,到时候出来 windows 版本少不了老哥帮着打磨 |
37
tojonozomi 2h 9m ago 感谢 op ,最近键盘敲多了,手腕不是很舒服,也在找语音输入法,马上试试
|
38
clockcloud 1h 55m ago 感谢分享,试试
|
39
notaCoder 1h 46m ago 和 TypeWhisper 比,有什么独特的地方吗,以前用 Whisper Transcription ,但是后来有的模型要花钱就换着试了好几个,不想再换了
|
42
qfdk OP PRO @notaCoder #41 不好意思我看错了, 以为你说的是 whisper,主要是像我这边做的都是 Soniox, elevenLabs,有 websocket 的加成优化,欧洲很舒服.终端一直在用,配合上靠谱的 API 准确率还是蛮高的,加上我这边有智能分词底层使用 jieba 分词,去掉奇怪的词语.
TypeWhisper 强在本地模型多 + 插件/CLI/批量转写更全,更像工具箱,马克下,看看有没有好的细节借鉴下 :) |