百度系
PaddleOCR
PaddleVL
PaddleStructure
QianFanOCR
QianFanOCR fast
Paddle 和 QianFan 系不知道有什么区别
Deepseek 系
DeepseekOCR 不支持 latex 公式
智谱系
GLMOCR 好像输出直接能对齐 PaddleOCR PaddleVL PaddleStructure 这 3 个加一起的输出能力
GLMOCR 是按照 token 计费的,0.2 元/M token
PaddleOCR QianFanOCR QianFanOCR fast DeepseekOCR 也都是 token 计费,但是都比 GLMOCR 贵
PaddleVL PaddleStructure 是按照 0.09 元/页计费的
GLMOCR 性能好,也便宜
最后我给 extractfromimg 使用 GLMOCR 来做 OCR 识别
1
luya 1 天前
纯代码不要钱百度的还是可以的,文字都能识别的挺好的,上公式啥的我没用过
|
2
crab 1 天前
试了几个还是百度的好。
|
3
pluto1 1 天前 via iPhone
可以试试 mistral 的 ocr 3 ,我试下来感觉不错,注册下用量不大好像是不要钱的(反正我没花过
|
4
snb9 1 天前
腾讯的怎么样
|
5
momo1999 1 天前
|
6
sq892246139 OP @snb9 没用过啊,没看到腾讯开源的是啥模型,我都是在 https://huggingface.co/看看每家发布的模型,并且使用自己熟悉的公司的
|