V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
dsg001
V2EX  ›  程序员

大模型都普及了,哪家的 ocr 可以比较完美的识别图中格式?

  •  
  •   dsg001 · 190 天前 · 2414 次点击
    这是一个创建于 190 天前的主题,其中的信息可能已经有所发展或是发生改变。

    比如代码、表格、缩进

    8 条回复    2023-10-21 17:47:56 +08:00
    cccj1
        1
    cccj1  
       190 天前
    wps 的识别还可以,表格识别很准,其他的不清楚
    tool2d
        2
    tool2d  
       190 天前   ❤️ 1
    OCR 只能识别文字,识别不了表格。一般表格识别都是硬写代码,不是用 AI 的。

    AI 仅仅用于局部文本识别。
    BQsummer
        3
    BQsummer  
       189 天前
    多模态的大模型还没有普及吧
    RatioPattern
        4
    RatioPattern  
       189 天前
    google 的可以,其他都不行
    mMartin
        5
    mMartin  
       189 天前
    paddleocr 识别表格还可以,有特定的模式
    em70
        6
    em70  
       189 天前   ❤️ 1
    meta 在 8 月底开源了一个 OCR 项目 nougat,对数学公式支持非常好,专门识别论文的,输出格式是 Mathpix Markdown
    https://github.com/facebookresearch/nougat
    ovtfkw
        7
    ovtfkw  
       189 天前
    扫描全能王
    uxfion
        8
    uxfion  
       188 天前
    @em70 但是 nougat 根本就没支持中文,只有对拉丁系语言友好
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   3011 人在线   最高记录 6543   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 26ms · UTC 08:13 · PVG 16:13 · LAX 01:13 · JFK 04:13
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.