什么是 OCR?
OCR(Optical Character Recognition,光学字符识别)是一种技术,用于从图片、扫描文档或 PDF 文件中提取文本,并将其转换为可编辑的电子文字。OCR 的目标是使静态的图片文字内容变得可搜索、可编辑和可导出。
OCR 的主要特点
- 文字提取: 从图片、PDF 文件或截图中快速识别文字内容。
- 多场景适用: 支持打印文档、手写文字以及复杂版面的识别。
- 数据数字化: 通过将纸质文档或图片内容转为电子文本,提升文档处理的效率。
OCR 的常见用途
- 从扫描的书籍或文档中提取文字。
- 轻松复制图片中的文字,无需手动输入。
- 配合翻译工具,翻译图片中的外文内容。