OCR 已经发展了足够久,关于“document intelligence”的豪言壮语从不缺少。 但说句实话——一旦遇到真正复杂的材料,多数 OCR 依旧会瞬间崩盘: 模糊的 PDF 老旧的数学作业纸 多栏版式的报纸扫描件 数十年前的手写表格 DeepSeek OCR 在干净、规整的页面上表现尚可。