V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
frankyxu
V2EX  ›  分享发现

请问 OCR 识别 pdf 或者图片内容有什么好的解决方案没,最近在捣鼓保单识别这一块

  •  
  •   frankyxu · 2017-11-07 14:03:45 +08:00 · 2733 次点击
    这是一个创建于 2598 天前的主题,其中的信息可能已经有所发展或是发生改变。

    尝试了百度的 ocr,感觉效果不是太理想

    8 条回复    2017-11-07 19:32:52 +08:00
    easonmu
        2
    easonmu  
       2017-11-07 16:34:27 +08:00 via iPhone
    迅捷 pdf,网上很多破解
    lafirel
        3
    lafirel  
       2017-11-07 17:42:18 +08:00
    曾在 OCR 公司供职,OCR 方面,还是 Abbyy 一家独大
    frankyxu
        4
    frankyxu  
    OP
       2017-11-07 17:56:59 +08:00
    @LibidoDealer @easonmu @lafirel 感谢,请问有没有类似 api 的这种调用方式
    cy97cool
        5
    cy97cool  
       2017-11-07 17:59:58 +08:00 via Android
    abbyy 有提供 api 的 只是收费有点贵
    fzinfz
        6
    fzinfz  
       2017-11-07 18:51:08 +08:00   ❤️ 1
    lz 要不要研究下 tensorflow?
    比如: 
    Chinese OCR with TensorFlow
    https://github.com/deeperic/SpikeFlow
    devlnt
        7
    devlnt  
       2017-11-07 19:23:18 +08:00
    没有上下靠的很紧的文字的话,可以尝试下 tesseract
    LuckCode
        8
    LuckCode  
       2017-11-07 19:32:52 +08:00 via iPhone
    楼上+1
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   3812 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 23ms · UTC 10:23 · PVG 18:23 · LAX 02:23 · JFK 05:23
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.