V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
爱意满满的作品展示区。
yeekal
V2EX  ›  分享创造

我用 PaddleOCR-VL + DeepSeek-OCR 搭了个真·免费 OCR 服务

  •  
  •   yeekal · 2 天前 · 653 次点击

    完全免费|无需注册|支持 PDF & 图片|结构化 Markdown 输出| 100+ 语言支持
    🌐 立即体验 → https://deepseekocr.io

    最近两个月,两个国产开源 OCR 模型横空出世,几乎霸榜全球 OCR 评测榜单——

    • DeepSeek-OCR:从 LLM 视角重构视觉编码,实现“上下文感知光学压缩”,在复杂文档理解上惊艳四座;
    • PaddleOCR-VL:仅 0.9B 参数的超轻量 VLM ,却在 OmniDocBench v1.5 总分第一,公式识别精度甚至超越 Mathpix

    作为科研党和程序员,经常使用 markdown 记录 LaTeX 公式笔记。对于论文或者博客里面的一大串公式,使用 mathpix 截图识别出 latex 可以节省很大的时间。mathpix 是一款很优秀的公式识别助手,就是免费版经常限流。

    于是,我做了 deepseekocr.io这个网站:一个完全免费、无需注册,不限次数的在线 OCR 工具,底层由DeepSeek OCRPaddleOCR-VL双引擎驱动。该工具网站专为科研党,学生,办公族,程序员打造。

    ✨ 核心能力:

    • 高精度识别:PaddleOCR-VL 在 OmniDocBench v1.0/v1.5 总分第一;其公式识别甚至超过 Mathpix(见 技术报告
    • 结构化 Markdown 输出:自动还原标题、表格、公式( LaTeX )、图片位置
    • 排版感知:文字与图像分块保留原布局( PaddleOCR-VL 的 NaViT 视觉编码器加持)
    • ✅ 支持 图片 & PDF,覆盖 100+ 语言
    • ✅ 免费无门槛(仅轻量 Turnstile 防刷)

    无论是拍一张黑板公式转成 LaTeX扫描手写笔记整理成 Markdown提取 PDF 论文中的多栏表格,还是识别餐馆菜单、购物小票、发票、护照、身份证、驾照等证件,它都能高精度还原内容与排版,让杂乱图像秒变结构化文本。

    对我而言,日常任务用 PaddleOCR-VL (仅 0.9B )已足够精准又高效; DeepSeek OCR 是在runpod gpu 服务器上个人部署的,速度有点慢,只是略作尝鲜。

    识别效果:

    手写公式笔记 手写公式笔记 小票 小票

    更多细节参考博客原文: https://yeekal.com/indie-dev/free-ai-ocr-tool/

    欢迎体验

    shenzhongkang
        1
    shenzhongkang  
       2 天前
    赞一个
    wenxueywx
        2
    wenxueywx  
       1 天前
    赞 有帮助。paddle ocr api 是用云服务还是自己部署的呢
    yeekal
        3
    yeekal  
    OP
       17 小时 52 分钟前
    @wenxueywx paddle ocr 是百度的云服务
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   1075 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 20ms · UTC 23:15 · PVG 07:15 · LAX 15:15 · JFK 18:15
    ♥ Do have faith in what you're doing.