V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
这是一个专门讨论 idea 的地方。

每个人的时间,资源是有限的,有的时候你或许能够想到很多 idea,但是由于现实的限制,却并不是所有的 idea 都能够成为现实。

那这个时候,不妨可以把那些 idea 分享出来,启发别人。
Joestar
V2EX  ›  奇思妙想

有可爱的程序员有空吗,想要造个 PC 端语音识别识别的小工具,但是无奈自己还没有学会编程。

  •  
  •   Joestar · 2016-01-11 11:18:56 +08:00 · 4051 次点击
    这是一个创建于 3242 天前的主题,其中的信息可能已经有所发展或是发生改变。
    感觉很冒昧...希望能私聊....
    58 条回复    2016-01-12 21:06:21 +08:00
    Sequencer
        1
    Sequencer  
       2016-01-11 11:49:25 +08:00 via iPhone
    做個 Google 的首頁就能做搜索了。
    突然想到的梗。
    yurivvvvv
        2
    yurivvvvv  
       2016-01-11 12:04:25 +08:00
    度娘开放语音识别 api + nw.js
    10 分钟打造跨平台多功能高兼容性桌面端语音识别小工具,外加炫彩换肤,外加会员充币语音合成功能

    逃(
    zingl
        3
    zingl  
       2016-01-11 12:19:24 +08:00
    要学编程干嘛,你的 IDEA 就是你最大的资本和财富,写几张 PPT 的 BP ,分分钟拿风投,只要拿到钱,程序员什么的,一划拉一筐
    Bryan0Z
        4
    Bryan0Z  
       2016-01-11 12:23:21 +08:00 via Android
    @Sequencer
    @yurivvvvv
    @zingl 你们啊…
    ethego
        5
    ethego  
       2016-01-11 12:24:57 +08:00
    同学,这是个极其极其复杂的功能,像百度谷歌苹果微软这样的公司召集了大量的天才在语音识别上投入了大量的心血,你要是想从头做一个的话不现实。那就用用百度或者其它大公司公开的接口吧,或者去买商用的比如科大讯飞的语音识别引擎。希望能帮到你。
    yurivvvvv
        6
    yurivvvvv  
       2016-01-11 12:32:30 +08:00
    @Bryan0Z 😂 我说真的。。
    Joestar
        7
    Joestar  
    OP
       2016-01-11 12:35:40 +08:00
    尼玛啊,吓死宝宝了。我只是想在玩游戏的时候偷懒不打字而已,何必这么认真。。从旁人来看,需要的是在敲回车之后录音,再之后就是正常的语音识别了。不知道在程序员眼中这个的困难程度,所以想私聊了解更细致点_(:з」∠)_另外,坦克世界有同好吗,二雷爱心捐赠团有团员吗。
    @Bryan0Z
    @ethego
    @zingl
    @yurivvvvv
    @Sequencer
    rubytek
        8
    rubytek  
       2016-01-11 12:39:46 +08:00
    @Joestar 那为啥不开语音玩游戏。。。
    w2exzz
        9
    w2exzz  
       2016-01-11 12:43:43 +08:00
    你准备出多少钱?
    Joestar
        10
    Joestar  
    OP
       2016-01-11 12:47:07 +08:00
    @rubytek 游戏里有 15 个人啊,最多只能 3 人组队语音聊天。坦克世界输入法又很鶸╭(╯^╰)╮。其次,突然想到很多游戏内置语音,像 lol ,听到小 p 孩很影响体验。就在找这方面的工具咯。
    sgissb1
        11
    sgissb1  
       2016-01-11 12:48:49 +08:00
    有需要网的语音识别,和不需要网的语音识别。

    要网的楼上都已经说过了。不要网的就难了
    Joestar
        12
    Joestar  
    OP
       2016-01-11 12:51:28 +08:00
    @w2exzz 2333 ,你打算收多少钱。虽然我只是随口问问,不要在意。因为我本来也就只把它当成是小工具一类,没想过用它牟利。如果你用它牟利了,请务必发一份红包.....
    Joestar
        13
    Joestar  
    OP
       2016-01-11 12:52:35 +08:00
    @sgissb1 为的是自己偷懒玩网络游戏,嘘!
    hardware
        14
    hardware  
       2016-01-11 12:54:29 +08:00
    lz 是男是女?
    Joestar
        15
    Joestar  
    OP
       2016-01-11 12:56:19 +08:00
    @hardware 男的...不要这么功利啊
    Perry
        16
    Perry  
       2016-01-11 12:59:43 +08:00
    可以用其他语音聊天,比如 skype 之类的
    qian19876025
        17
    qian19876025  
       2016-01-11 13:04:08 +08:00
    你到底是包装 windowsAPI 还是 自己写?
    和 windows 自带的有什么区别
    Joestar
        18
    Joestar  
    OP
       2016-01-11 13:06:24 +08:00
    感觉之前想私聊反而让人误会了...另外,我也不是想要语音聊天。我只是想在游戏或者输入文字的时候偷懒而已...
    Joestar
        19
    Joestar  
    OP
       2016-01-11 13:08:01 +08:00
    @qian19876025 抱歉,能具体点吗。 windows10 已经有了这个功能吗?那能说说怎么开启吗,打扰了。
    tabris17
        20
    tabris17  
       2016-01-11 13:19:01 +08:00
    gamexg
        21
    gamexg  
       2016-01-11 13:19:04 +08:00 via Android
    用过语音识别后感觉还不如打字方便。
    建议楼主去讯飞网站试试。
    Joestar
        22
    Joestar  
    OP
       2016-01-11 13:30:40 +08:00
    哦,刚刚去试了试 win7 的语音识别。可能是因为我说话不标准吧,识别率不是很高,但是这不是最重要的。他和我想象的不是一码事。愚蠢的 win7 ,当你在输入栏准备输入时,说话后,他提示你是否插入说话语段....另外,他在游戏里面显示不出来啊。我的设想是,在敲击回车后,开始录音和识别,之后,识别的文字反馈直接在游戏的文字输入端出现。最多只是我看一下,检查下。相差太大。。
    Xs0ul
        23
    Xs0ul  
       2016-01-11 13:39:02 +08:00 via Android
    开个 YY 之类的不行?
    visonme
        24
    visonme  
       2016-01-11 14:56:04 +08:00
    微软的语音识别 API ,分分钟钟搞定的事情
    楼主说到这个让我想起一档街头测试节目,大概内容:“一个老外在日本街头,跟女性索吻”,记得那个男主用的那个(口述英语转译为日语)翻译工具很不错,可以考虑朝这个方向,比单纯的 PC 端好玩很多
    Bryan0Z
        25
    Bryan0Z  
       2016-01-11 15:15:04 +08:00 via Android
    @Joestar 噗… 好多输入法不都有语音功能
    Joestar
        26
    Joestar  
    OP
       2016-01-11 15:28:58 +08:00
    @visonme 问题是臣妾不会编程啊- -另外,翻译可能讯飞已经有了?我只是想找个偷懒的工具_(:з」∠)_
    Joestar
        27
    Joestar  
    OP
       2016-01-11 16:10:26 +08:00
    @Bryan0Z 讯飞很奇异的貌似不支持我的游戏。 PC 端的语音输入都很奇怪啊。另外,在游戏中按麦克风输入或者说按快捷键我认为是逗比或者说没有必要的。因为游戏里面,敲了回车就意味着准备输入文字,可以开始录音了。 So....
    muziyue
        28
    muziyue  
       2016-01-12 00:34:55 +08:00
    @Joestar 你可以考虑把两个键绑在一起
    sgissb1
        29
    sgissb1  
       2016-01-12 10:06:24 +08:00
    @Joestar 基本算了吧,都懒的打字。。。。那你是玩不了游戏了。

    另外再懒,可以 TS 或者 YY 啊
    sgissb1
        30
    sgissb1  
       2016-01-12 10:06:57 +08:00
    @Joestar 然后体验一把对骂猪队友的快感~~~~
    Joestar
        31
    Joestar  
    OP
       2016-01-12 10:20:12 +08:00
    @sgissb1 不是啊,我单纯觉得假如能够说话为什么还要去打字呢。游戏里面输入法也不是很正常。我觉得你可能没玩太多游戏,不是所有游戏都适合用 YY 的_(:з」∠)_YY 需要一个频道号,一个队伍换一个实在太麻烦了,除非是和朋友稳定组队。
    FreeTxT
        32
    FreeTxT  
       2016-01-12 11:29:57 +08:00 via iPhone
    Dragon Naturally Speaking Voice 不能识别中文; IBM 有一个能识别中文的,但识别率低,普通话要一致标准
    sgissb1
        33
    sgissb1  
       2016-01-12 12:10:01 +08:00
    @Joestar dota2 的话,按住预设的键,就可以在游戏里面喷队友了
    Joestar
        34
    Joestar  
    OP
       2016-01-12 12:47:31 +08:00
    @sgissb1 我知道 steam 里面游戏都有自带语音,可惜没入 G 胖的坑.....lol 里面不也有语音吗,但是点进去听到一群小 p 孩多影响体验。。
    Joestar
        35
    Joestar  
    OP
       2016-01-12 12:48:40 +08:00
    @w2exzz 写个这样的桌面端小程序大概要多久,多少 R ?
    Tink
        36
    Tink  
       2016-01-12 13:08:44 +08:00
    这个功能很简单??
    Joestar
        37
    Joestar  
    OP
       2016-01-12 13:16:20 +08:00
    @Tink 从非程序员的角度看哈,不要打我....1 敲击 enter 键,开始录音; 2 录音转化为文字; 3 文字显示在游戏输入框中。我想不到更多_(:з」∠)_哪里有更细致的问题....
    Joestar
        38
    Joestar  
    OP
       2016-01-12 13:17:58 +08:00
    自己找人造吧,有没有人能够预估下大致时间?要多少 R ?
    Shazoo
        39
    Shazoo  
       2016-01-12 13:24:36 +08:00
    @Joestar 给你描述下哈。

    1 、你雇一个打字比较快的小 p 孩。
    2 、买一个外接 usb 键盘,接到机器里面,让小 p 孩用。
    3 、你培训小 p 孩,要求他在你按下 enter 后,把你说的话完整的输入进去,并且发送。

    假设小 p 孩的时薪是 10 元每小时。

    普通程序员,使用科大讯飞之类的库,完成上述作业的工资,你可以雇佣小 p 孩 1000 小时。(你需要额外支付商业库的开销。费用自己查了……)
    天才程序员,自己开发语音识别库,完成上述作业的工资,你可以雇佣小 p 孩 10^6 小时。


    加油啊~~~~
    sgissb1
        40
    sgissb1  
       2016-01-12 13:31:29 +08:00
    @Shazoo 666666 和 2333333 ,太有才了!
    sgissb1
        41
    sgissb1  
       2016-01-12 13:32:07 +08:00
    @Joestar 无所谓了,骂骂人么。
    Tink
        42
    Tink  
       2016-01-12 13:45:51 +08:00 via iPhone
    @Joestar 2.录音转化为文字这一步, Microsoft 和 Google 这样的公司都是全团队在做,国内的讯飞全公司都在研究这个。
    Joestar
        43
    Joestar  
    OP
       2016-01-12 14:36:51 +08:00
    @Shazoo 10k 啊,那算了呗=。=
    Joestar
        44
    Joestar  
    OP
       2016-01-12 14:37:28 +08:00
    @Joestar 我真没有想自己去建一个语音识别,看评论就知道我只是想偷懒。
    Joestar
        45
    Joestar  
    OP
       2016-01-12 14:47:16 +08:00
    @Shazoo 这个居然也要这么贵,码农种的是黄金啊_(:з」∠)_
    yeyeye
        46
    yeyeye  
       2016-01-12 15:26:09 +08:00
    @Joestar 楼主你好,语音识别不是简单的玩意,举个例子,你学英文的时候,单词你每个都认识,但是语法一变,亲妈都不认识了。加上同音字,多义字,在语音转换成字的那一瞬间,机器到底该怎么选择呢?这还是你普通话标准之后才考虑的事情,要是你普通话不够标准,那它连你发出的声音是什么玩意都分不出!

    你这挑战的是一个语言!你自己想想把,想想用拼音输入法自己选一个字可能都要半天(翻页),你所想要的软件如何给你正确的?

    建议你学编程,你能想到这个点子很不错,我觉得你学会编程绝对大有可为,你看码农种的黄金想必你也明白了,要不要也来种黄金啊!
    Joestar
        47
    Joestar  
    OP
       2016-01-12 15:36:43 +08:00
    @yeyeye 我不是说想要挑战语言啊,我只是想要偷懒啊!!语音识别不是说有现成的讯飞提供接口吗,我不是很了解 SDK 的作用机制...所以我觉得可以偷偷懒啊,讯飞输入法我手机上感觉蛮好,但是在电脑上,因为操作和游戏原因,用了搜狗输入法。所以才想能不能优化讯飞的语音输入。我没有想过自己做语音识别哈。
    yiciyuansky
        48
    yiciyuansky  
       2016-01-12 15:39:13 +08:00
    差个程序员系列之语音搜索
    yeyeye
        49
    yeyeye  
       2016-01-12 15:39:41 +08:00
    @Joestar 还是自己做吧 说不定就能走上人参巅峰 迎娶白富美 就像 20 年前 你觉得马云会这么屌么 说不定你就能成为奇迹

    或者写份 PPT ,就能拿到风投了
    yeyeye
        50
    yeyeye  
       2016-01-12 15:40:02 +08:00
    @Joestar 你的痛点其实就是大家的痛点 你不想打字 你以为我们就想打字么?
    XianZaiZhuCe
        51
    XianZaiZhuCe  
       2016-01-12 15:43:55 +08:00 via iPhone
    录音转化为文字。说的如此简单。
    Joestar
        52
    Joestar  
    OP
       2016-01-12 15:55:43 +08:00
    @yeyeye 没呢....问题是讯飞在 pc 端有语音识别和转化文字功能啊,我只是觉得它操作不好用。只是一个 tool 而已。
    Joestar
        53
    Joestar  
    OP
       2016-01-12 15:56:15 +08:00
    @yiciyuansky 对于自 high ,我从来不打扰。
    Joestar
        54
    Joestar  
    OP
       2016-01-12 15:56:48 +08:00
    @yeyeye 简陋页面都无所谓啊。只是需要在录音的时候有用。
    Joestar
        55
    Joestar  
    OP
       2016-01-12 15:57:56 +08:00
    @yeyeye 如果真要说语音输入,我认为游戏下手可能还更好些,细想的话。
    ck65
        56
    ck65  
       2016-01-12 15:59:00 +08:00
    悄悄告诉楼主,程序员有很多都会做隔空传物的机器,虽然他们不好找,但你找一辈子,肯定至少也会接近找到的
    hqs123
        57
    hqs123  
       2016-01-12 21:05:58 +08:00
    楼主喜欢折腾,我喜欢哈哈
    dphdjy
        58
    dphdjy  
       2016-01-12 21:06:21 +08:00 via Android
    在这个问题上~
    UI 和设计已经不算问题了~

    不过如果脱离电脑解析~~
    用手机讯飞,然后传回电脑~~
    再输入难度就降低了~~

    不过还有输入问题~
    如果没有开放 API ,这输入简直就是开挂 QAQ
    如果有 API 或者已知补丁,大概很容易找人实现~

    (此处不报价 QAQ)
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1483 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 30ms · UTC 17:20 · PVG 01:20 · LAX 09:20 · JFK 12:20
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.