V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
dreamcog
V2EX  ›  程序员

想开源一个语意识别源代码,不知道有没有人愿意一起开发贡献力量。

  •  
  •   dreamcog · 2014-08-11 12:05:39 +08:00 · 4839 次点击
    这是一个创建于 3742 天前的主题,其中的信息可能已经有所发展或是发生改变。
    地址:
    https://github.com/dreamcog/smart_car_voice

    目前代码我还没同步上去,
    测试:
    http://test.api.youxiamotors.com/kitt/ask.html?sentence=放一首最后的战役

    基本是这个想法,不知道有没有人愿意一起维护,开发什么的。
    打算完全开源
    第 1 条附言  ·  2014-08-11 14:16:53 +08:00
    QQ群:92623107
    25 条回复    2014-08-12 22:33:10 +08:00
    explon
        1
    explon  
       2014-08-11 12:22:43 +08:00
    什么语言写的?
    chlx
        2
    chlx  
       2014-08-11 12:27:07 +08:00
    方向相关,放出更多细节吧
    RW667
        3
    RW667  
       2014-08-11 12:43:48 +08:00
    先放上去吧
    hellov22ex
        4
    hellov22ex  
       2014-08-11 12:45:37 +08:00
    方向的话,看URL里面的名字,是汽车里面配备的?楼主,需要更详细的信息,比如1楼说的,然后你对这个有什么想法,你想要怎么干下去什么的,不是这么几句话就能解决的啦
    dreamcog
        5
    dreamcog  
    OP
       2014-08-11 13:18:34 +08:00
    @explon 目前是PYTHON写的~
    dong3580
        6
    dong3580  
       2014-08-11 13:22:55 +08:00
    up 楼上,楼主先说一下什么语言写的,
    banama
        7
    banama  
       2014-08-11 13:26:15 +08:00
    关注
    cxl008
        8
    cxl008  
       2014-08-11 13:30:55 +08:00
    不错,不过是不是要先定义好方向?
    pyKun
        9
    pyKun  
       2014-08-11 13:37:06 +08:00
    starred


    不过楼主把 message encode 下吧
    sailxjx
        10
    sailxjx  
       2014-08-11 13:37:14 +08:00   ❤️ 1
    最近也在做同样的事情,不过还是感觉像语义识别这种偏核心的功能还是由苹果,微软等大厂做比较合适,这种既需要算法又需要硬件成本的功能,不投入大量人力物力是没法做完美的。社区需要做的更多是包装,在用户体验那头做到极致。

    P.S. README上的错别字也可以改改了,面试 -> 面世
    ChiangDi
        11
    ChiangDi  
       2014-08-11 13:40:00 +08:00 via Android
    感觉难度很大😁
    dreamcog
        12
    dreamcog  
    OP
       2014-08-11 14:00:59 +08:00
    @sailxjx HEY,非常感谢!你们在做的方向是什么样的?有没有可能一起来维护一套?
    @pyKun 这部分我们的确是在程序里直接用的一个接口。所以需要装一个CHROME的JSON插件看起来比较好。
    dreamcog
        13
    dreamcog  
    OP
       2014-08-11 14:15:02 +08:00
    @sailxjx 能加个QQ吗?182215310
    windviki
        14
    windviki  
       2014-08-11 14:40:34 +08:00
    公司也是做语音识别的,有自己的NLU。不过我自己不做这块具体实现。关注楼主项目。
    dreamcog
        15
    dreamcog  
    OP
       2014-08-11 15:11:47 +08:00
    @windviki

    恩恩。感觉如果集合全国的很多厉害工程师一起来实现会很厉害。
    但是似乎不知道有没有工程师愿意。很多大的公司并不愿意开放自己的语意识别。
    lzgouo
        16
    lzgouo  
       2014-08-11 16:52:34 +08:00
    关注,不过不是这个方向。精支。
    RW667
        17
    RW667  
       2014-08-11 16:53:52 +08:00
    我觉得楼就应该先放上去,然后推动这个项目发展起来.
    很多人还是需要这样的服务的
    语意识别目前都还掌握在一些大厂手上.很
    semicircle21
        18
    semicircle21  
       2014-08-11 19:05:41 +08:00
    支持! 已Star.
    我正在业余时间学习NLP.
    tttwww18
        19
    tttwww18  
       2014-08-11 19:47:24 +08:00
    训练语料也会共享吗?
    tttwww18
        20
    tttwww18  
       2014-08-11 19:48:28 +08:00
    BTW,语意和语义有什么区别?
    dreamcog
        21
    dreamcog  
    OP
       2014-08-11 20:22:02 +08:00
    @semicircle21 感谢各位,
    @tttwww18 都会共享,我希望100%开源~我觉得只有完全开源才会强大起来。
    zix
        22
    zix  
       2014-08-11 21:53:14 +08:00
    关注,我也是在一个语音识别公司,不过我才入行,哈哈~
    harryert
        23
    harryert  
       2014-08-11 22:23:31 +08:00
    赞,支持。这个是做中文的吗?如果是,我加入,懂得不多,不过知道一些腾讯的玩法。。。。
    tommark
        24
    tommark  
       2014-08-12 10:15:05 +08:00
    真正的语义识别算法现在应该还不成熟吧,大公司现在的产品也大多处在实验阶段,真正能走人平常百姓家,能正常沟通应该还有一大段距离。
    不过很想了解一下你的这个实现,我也搞过NLP,不过只是做过中文分词。
    ryon
        25
    ryon  
       2014-08-12 22:33:10 +08:00 via iPhone
    如果开源,我们愿意支持集成到wecenter的搜索服务里面。分词,词性,语义,语境,其实很多需要考虑完善的,如果从某个行业出发,建立行业词库,起步会更加容易点
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1836 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 23ms · UTC 16:37 · PVG 00:37 · LAX 08:37 · JFK 11:37
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.