FileKit

文字提取 (OCR) 测试版

文件始终留在你的设备上

识别语言

将文件拖到这里

或点击选择文件

单个文件最大 50.0 MB·支持格式:JPG · PNG · WebP · BMP · TIFF · PDF

你可能还需要

OCR 工作原理

FileKit 使用 Tesseract.js(Tesseract OCR 引擎的 WebAssembly 移植版)在浏览器本地完成文字识别。语言模型会在首次使用时下载(英语约 4 MB),之后会缓存在本地——不会上传任何文件。为了获得最佳效果,请使用高对比度、文字清晰的图片,分辨率建议不低于 150 DPI。

如何 OCR 识别文档

  1. 1

    上传图片或扫描 PDF

    拖放扫描文档、页面照片或截图。支持 JPG、PNG、WebP 和 PDF 格式。

  2. 2

    选择识别语言

    选择文档的主要语言:英文、简体中文、日文或中英混合。正确的语言选择能显著提高识别精度。

  3. 3

    提取并复制文字

    FileKit 在浏览器中运行 Tesseract.js(WebAssembly OCR 引擎)。识别出的文字显示在可编辑区域——复制或下载为 .txt 文件。

常见问题

相关指南