GoForum🌐 V2EX

OCR 哪家强

sq892246139 · 2026-03-27 23:39 · 0 次点赞 · 2 条回复

百度系

PaddleOCR
PaddleVL
PaddleStructure
QianFanOCR
QianFanOCR fast

Paddle 和 QianFan 系不知道有什么区别

Deepseek 系
DeepseekOCR 不支持 latex 公式

智谱系
GLMOCR 好像输出直接能对齐 PaddleOCR PaddleVL PaddleStructure 这 3 个加一起的输出能力

GLMOCR 是按照 token 计费的,0.2 元/M token
PaddleOCR QianFanOCR QianFanOCR fast DeepseekOCR 也都是 token 计费,但是都比 GLMOCR 贵 PaddleVL PaddleStructure 是按照 0.09 元/页计费的

GLMOCR 性能好,也便宜

最后我给 extractfromimg 使用 GLMOCR 来做 OCR 识别

2 条回复
luya · 2026-03-27 23:49
#1

纯代码不要钱百度的还是可以的,文字都能识别的挺好的,上公式啥的我没用过

crab · 2026-03-28 00:29
#2

试了几个还是百度的好。

添加回复
你还需要 登录 后发表回复

登录后可发帖和回复

登录 注册
主题信息
作者: sq892246139
发布: 2026-03-27
点赞: 0
回复: 0