吸上 Vibe Coding 这段时间,我发现和 Claude Code 聊天最大的痛点不是 token 不够,而是要输入的字太多。长 prompt 、长解释,手敲真累。
我把市面上语音输入法都试了个遍:要么贵、要么卡、要么贵还卡。干脆自己写了一个“按住说话、松开出字”的小工具。
越用越顺手:除了和 Claude Code 对需求、调 bug 、写 commit ,各种 prompt……
现在也不用吐槽微信电脑版为啥没有语音识别了
我现在已经很少用键盘长篇打字了。
既然自己爽了,就免费分享给大家。
四选一,都有用不完的免费额度,还可随时切换
Groq ( Whisper )、Mistral ( Voxtral )、AssemblyAI 、豆包语音
官网与下载:https://lazytyper.com/zh
Bug 、建议、Windows 版、支持其他模型,等等,有什么问题都可以留言,我会跟进完善。
✨ 永久免费!
目前只支持 Mac 版
⊞ Windows 版正在适配中
安装包才10M+
还新增了很多贴心小功能!
![]() |
1
Tink PRO 666 以后真的可以不摸键盘了
|
![]() |
2
dream7758522 23 天前 via Android ![]() 老罗说:666
|
![]() |
3
conge PRO 嘿,得试试这个。
|
4
katwalk 23 天前
还愣着干什么?快出 Windows 版啊
|
![]() |
5
yeelone 23 天前
666~~~
|
6
niubilewodev 23 天前 ![]() 其实 Mac 可以设置按两下地球键就开启语音输入。
只是中英文混编的时候效果比较差。 |
![]() |
7
fmvp520 23 天前
期待 Windows 版!
|
![]() |
8
oldcai OP PRO @niubilewodev 这个是的,新一点的笔记本上还有一个专门的按键。
但是识别率感人,基本没法中英文混输。 |
9
sampeng 23 天前 via iPhone
你在工位上:你是大纱碧吗?为什么这里有 bug ?我说了无数次这个业务逻辑你为什么还没听懂?能做做不做滚…
然后你就被开了… |
![]() |
10
wanniwa 23 天前
|
![]() |
12
goushengnankong 23 天前
为什么在 Mac 系统上会一直显示一个录音机被使用的图标?这个图标是否代表这个软件一直在使用我的麦克风进行录音?
|
![]() |
13
daybreakfangyang 23 天前
@dream7758522 老罗想法超前了,技术没跟上
|
![]() |
14
easychen 23 天前
市面上,搜狗输入法自带的新版不行了,长语音老出问题,但讯飞的还行啊,有 Mac 版而且也是免费的。
现在 Trae 直接内置语音输入了,也能用,就是不支持长语音,一输入就自动中断了。讯飞的可以语音和文字输入并行,一般一些复杂的代码和公式我会一边语音一边手工输入。 |
![]() |
16
oldcai OP PRO @goushengnankong 好问题,简单说是 feature 不是 bug 。
因为获取麦克风权限这个过程它会有延迟,按了快捷键以后,它不是马上就可以直接开始录音,体验上面就有一个割裂感。 为了优化这个体验,会延迟释放掉这个权限 后面可以考虑用一个设置选项来禁用这个功能 |
![]() |
17
oldcai OP PRO @wanniwa 我尽快更新一个版本,让中文用户默认选择豆包语音吧。
不过测了一圈下来,如果是中英文混合输入的话,还是 Groq 的 whisper 比较强大。 |
![]() |
18
clarkyu 22 天前
体验了一下,按住 option+tab 直接弹出设置框... 然后语音之后没任何反应
不知道是不是我个人设置跟软件有冲突 |
![]() |
19
steveway 22 天前
trae:英雄所见略同(狗头
|
![]() |
20
oldcai OP PRO |
![]() |
23
sillydaddy 22 天前
太爽了,以后再也不用打大段的文字了!!绝对是使用 AI 的必备。 试了下 macOS 自带的语音输入,混杂的英文单词识别不太理想,但中文识别已经非常准确了。
|
![]() |
24
oldcai OP PRO |
25
qhd 22 天前
用了 AI ,太想要语音输入法了
|
26
Censhuang 22 天前 via iPhone
好奇,你都支持豆包 ai 了。豆包 ai 就支持全局语音输入吧,有快捷键。并且豆包 ai 也支持会议记录。
我不是推广豆包,豆包的缺点是这是告诉你这是一个浏览器。 |
![]() |
29
oldcai OP PRO 就没有哪个老哥跑通的吗?应该也有不少吧。 能不能也发一下,多少给点鼓励。
@Censhuang 是的,有两点原因。 一个是我这个总共也就 10 兆大小的安装包;豆包那个几百兆,还带一个浏览器,我虽然体型臃肿,但是讨厌应用臃肿。 然后我这个反应快速,基本上是随手一按就能说话。它那个启动速度要慢很多,而且你一边说,要一边等它出字。实际使用下来,LazyTyper 让我使用的感觉更爽。 |
![]() |
30
LAMBO 22 天前
都设置好了,没跑通。按快捷键只弹窗,没有任何反应。还有,如何退出软件?
|
![]() |
31
oldcai OP PRO @LAMBO 托盘里面右键退出。看看退出重开试试。
抱歉各位,遇到问题的同学请把机型和系统版本什么的发邮件给我 [email protected] 。 如果方便,请将日志 ~/Library/Application\ Support/com.lazytyper.desktop/logs/ 也打包发我一下。 我定位一下问题。晚点出个新版本,能不能帮我测试一下 难怪大佬们说 tauri+svelte 会有一堆 work on my machine 的问题😂抱歉让大家陪我踩坑。 |
32
zlo309618100 22 天前
一直用的豆包语音,mac 上挺好用的。
|
33
huweic 22 天前
太棒了,我之前也一直在用豆包语音,但是太重了奈何没有替代品,很需要这种轻量级专注输入的工具~
|
34
wwyf 22 天前
挺好的,填上语音编程的空白了
|
![]() |
35
iorilu 22 天前
如果能配上本地语音更好
|
36
c4fun 22 天前
挺好的,不过已经有 Wispr flow 在用了,而且 Wispr flow 可以中英文混合输入
|
37
geying 22 天前
支持一下
|
![]() |
38
musi 22 天前
有没有测试过哪家识别率最高,另外还有 gemini 也支持语音
|
![]() |
39
unclejimao 22 天前
@dream7758522 大模型把老罗抄的裤衩子都不剩了
|
![]() |
40
korvin 22 天前
今天怎么回事,没有特意搜索,就刷信息流,x 上刷到两个借助大模型语音转文字的应用,这里又刷到一个。
|
![]() |
41
oldcai OP PRO |
![]() |
42
iorilu 21 天前
@oldcai 我意思是目前这些应用基本都是调用类似 whisper 的 api
其实 github 有一些库可以把 whisper 变成兼容 openai 的本地 api 你只要提供一个自定义 api 的方式就行, 就和很多 ai 应用一样, 自定义 base_url, model 之类参数就行 |
![]() |
44
Znemo 21 天前 ![]() Privacy & Analytics 每次启动软件都会被自动勾选。
|
![]() |
46
korvin 21 天前
|
![]() |
47
conge PRO 已经安装使用了,效果非常好。
|
![]() |
48
oldcai OP PRO |
![]() |
50
kingrever 20 天前
在 macbook 上安装了,但不知道怎么启用,上面任务栏也没有显示啊
|
![]() |
53
charlesss 20 天前
体验了下,会一直获取麦克风,这样会导致在听歌的时候声音变得很大。
|
![]() |
57
xpzouying 19 天前
确实非常好用,使用语音输入法给楼主点赞。
|
![]() |
58
Dalexfefun 18 天前
好用好用,给 cai 神点赞
|
![]() |
59
liulicaixiao 18 天前
我刚看到一个类似的工具 https://wisprflow.ai/
|
![]() |
60
oldcai OP PRO @liulicaixiao 你再看看,它免费吗😂
|
![]() |
61
liulicaixiao 17 天前
@oldcai #60 我是今天逛之前买的一个产品大礼包发现的这个新东西,然后就突然想起来论坛里有人也做了类似的软件了。
![]() |
![]() |
62
oldcai OP PRO @liulicaixiao
哦哦,了解了。我记得那个大礼包是大概可以免费用一年。 你可以先用用他的,再过来对比一下。 给我一些使用的反馈,比如哪里觉得爽,但是 LazyTyper 没有的,帮助 LazyTyper 提升一下。 其实 LazyTyper 比它支持的 AI 更多(它只支持 Whisper ) 中英文混排识别率:它的识别率其实没有 LazyTyper 新加的 ElevenLabs 好 中文的识别率:也没有 LazyTyper 支持的豆包好 |
![]() |
63
qfdk PRO 火山引擎凭证验证失败:Invalid VolcanoEngine API credentials: 所有重试都失败了。最后的错误: 无法连接到服务器,请检查网络连接
卒 |
65
LinJunzhu 17 天前
之前一直没办法使用的 BUG 终于修复了,达到可用状态。
提个建议: 如果能一边说一边出文字,就最好了。 参考手机端的微信输入法#语音输入/系统的语音输入 |
![]() |
67
qfdk PRO ![]() ElevenLabs 还是好用 !
|
68
rafa 17 天前
顶一个,已经开始爽用了
|
69
s4nd 17 天前
来个 windows 版吧
|
![]() |
71
apollo007 17 天前
很不错,不过就是感觉有点慢,不是很快就出来的感觉。我希望的是呢。等我把话说完,他立刻就能出结果。
|
73
followad 17 天前 via iPhone
会玩 会玩
|
74
november 17 天前
安静,你吵到我用 TNT 了。
|
75
ccc00 17 天前
请问豆包可以无限量使用吗?
|
77
leetcode2020 16 天前
@oldcai 想请教一下,这个项目是基于 Tauri 开发的吗?另外,在 macOS 上有试过使用 Apple 自带的 Speech Framework 吗?想了解一下实际效果如何。
|
![]() |
78
oldcai OP PRO |
![]() |
79
xiaket 15 天前
没有泼冷水或者冒犯的意思. 很多时候人说话, 尤其是比较长的内容, 会有不少的语气助词或各种停顿. 所以我自己本地做这个功能( https://github.com/xiaket/etc/tree/master/murmur)的时候, 先是丢给 whisper 识别, 后面再把识别出来的文本拿去给 OpenAI 润色一遍. 这样效果会好一点.
|
![]() |
80
oldcai OP PRO @xiaket 没有没有,超级欢迎提意见。提到这么深入的问题,说明你肯定是同道中人。
其实我也考虑过这个问题,之前甚至调研过其他的产品,有的也有润色成书面语等功能。 但是实际测试下来,它的确有时候会让你有惊喜(比如口述 emoji 表情),但是更多时候它会添乱。 而且最重要的问题是,它会让我对语音转的文字没有信心。会增加不必要的校对的心力。 我觉得作为一个主要目的是输入的产品,还是要忠于输入。 而且其实不管是 Whisper 还是 ElevenLabs 这两款都会有将你轻微的停顿去除的功能,有大概 5%左右的纠错的能力; 至于豆包语音这种,它会把你的思考的那些声音,发出的“嗯”,“呃”的声音也加进去,我也针对实现了一个功能,去机械化地去除这样的一些停顿。暂时做到了用于 Vibe Coding 的时候我比较满意的程度。 你的建议我先拿小本本记下。我想的也不一定对,先看一下大家的意见,后面我会考虑。 如果你有好的案例,欢迎给我分享一下,我会再考虑考虑。 |
![]() |
81
cat 15 天前
官网顶部的菜单链接 没有跟随当前语言
在中文页面下点菜单会跳到英文页面 而且链接标题与位置也不一致 |
![]() |
82
pigll 15 天前
这也太秀了吧
|
![]() |
83
oldcai OP PRO @cat 感谢提出,链接已经修正。并加入 discord 群组等链接。
内容也有点 outdated 了,因为之前本来只打算支持 whisper 。后面我更新下。 😏 不过翻译没有对应是有意为之的,因为不一定是一一对应的关系。 比如统计到我自己使用的时候中文有 7 ~ 8 倍,但是英文才 3 ~ 4 倍。 |
![]() |
84
HXM 15 天前
期待 Windows 版本!
|
![]() |
85
billzhuang 14 天前
Can you hear me?This is very fast. I like it.Awesome. Please continue.
|
![]() |
86
billzhuang 14 天前
豆包不能听英文吗?
|
![]() |
87
oldcai OP PRO @billzhuang 你要是说纯英文,豆包也可以。但是你要是中英文混合的话,它可能就经常在英语的部分会空耳。
|
88
pigfloyd 14 天前
太好了,终于可以用嘴辱骂 ai 了
|
89
PaperZai 9 天前
很好,macos 自带的识别率不行,国内的准确率豆包的确是 t0 级别的
|
90
PaperZai 9 天前
可以隐藏一下 macos 菜单栏图标的选项吗,黄色的看着有点醒目和不协调。
|
![]() |
92
ddddd0 1 天前
我用的是 wisper flow ,ios + mac ,发现它存在一些 wispher 的固有问题,比如偶尔有严重幻觉;音量小的时候、或者有点口音的时候精度还是不够高,错误率比较高;另外这个软件服务端不稳定
刚配置完 LazyTyper ,正在尝试 lazytyper + elevenlabs stt ,只是目前没有 ios 端,只在 mac 端用 |