OCR 哪家强

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

• 请不要在回答技术问题时复制粘贴 AI 生成的内容

百度系

PaddleOCR
PaddleVL
PaddleStructure
QianFanOCR
QianFanOCR fast

Paddle 和 QianFan 系不知道有什么区别

Deepseek 系
DeepseekOCR 不支持 latex 公式

智谱系
GLMOCR 好像输出直接能对齐 PaddleOCR PaddleVL PaddleStructure 这 3 个加一起的输出能力

GLMOCR 是按照 token 计费的，0.2 元/M token
PaddleOCR QianFanOCR QianFanOCR fast DeepseekOCR 也都是 token 计费，但是都比 GLMOCR 贵 PaddleVL PaddleStructure 是按照 0.09 元/页计费的

GLMOCR 性能好，也便宜

最后我给 extractfromimg 使用 GLMOCR 来做 OCR 识别

OCR

GLMOCR

paddleocr

6 条回复 • 2026-03-29 10:49:40 +08:00

luya

1 天前

纯代码不要钱百度的还是可以的，文字都能识别的挺好的，上公式啥的我没用过

crab

1 天前

试了几个还是百度的好。

pluto1

1 天前 via iPhone

可以试试 mistral 的 ocr 3 ，我试下来感觉不错，注册下用量不大好像是不要钱的（反正我没花过

snb9

1 天前

腾讯的怎么样

momo1999

1 天前

https://github.com/datalab-to/chandra 这个怎么样

sq892246139

5 小时 40 分钟前

@snb9 没用过啊，没看到腾讯开源的是啥模型，我都是在 https://huggingface.co/看看每家发布的模型，并且使用自己熟悉的公司的