我用 PaddleOCR-VL + DeepSeek-OCR 搭了个真·免费 OCR 服务

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

爱意满满的作品展示区。

这是一个创建于 105 天前的主题，其中的信息可能已经有所发展或是发生改变。

✅ 完全免费｜无需注册｜支持 PDF & 图片｜结构化 Markdown 输出｜ 100+ 语言支持
🌐 立即体验 → https://deepseekocr.io

最近两个月，两个国产开源 OCR 模型横空出世，几乎霸榜全球 OCR 评测榜单——

DeepSeek-OCR：从 LLM 视角重构视觉编码，实现“上下文感知光学压缩”，在复杂文档理解上惊艳四座；
PaddleOCR-VL：仅 0.9B 参数的超轻量 VLM ，却在 OmniDocBench v1.5 总分第一，公式识别精度甚至超越 Mathpix

作为科研党和程序员，经常使用 markdown 记录 LaTeX 公式笔记。对于论文或者博客里面的一大串公式，使用 mathpix 截图识别出 latex 可以节省很大的时间。mathpix 是一款很优秀的公式识别助手，就是免费版经常限流。

于是，我做了 deepseekocr.io这个网站：一个完全免费、无需注册，不限次数的在线 OCR 工具，底层由DeepSeek OCR 和 PaddleOCR-VL双引擎驱动。该工具网站专为科研党，学生，办公族，程序员打造。

✨ 核心能力：

✅ 高精度识别：PaddleOCR-VL 在 OmniDocBench v1.0/v1.5 总分第一；其公式识别甚至超过 Mathpix（见技术报告）
✅ 结构化 Markdown 输出：自动还原标题、表格、公式（ LaTeX ）、图片位置
✅ 排版感知：文字与图像分块保留原布局（ PaddleOCR-VL 的 NaViT 视觉编码器加持）
✅ 支持 图片 & PDF，覆盖 100+ 语言
✅ 免费无门槛（仅轻量 Turnstile 防刷）