文字提取 (OCR) 测试版
文件始终留在你的设备上
识别语言
将文件拖到这里
或点击选择文件
单个文件最大 50.0 MB·支持格式:JPG · PNG · WebP · BMP · TIFF · PDF
你可能还需要
OCR 工作原理
FileKit 使用 Tesseract.js(Tesseract OCR 引擎的 WebAssembly 移植版)在浏览器本地完成文字识别。语言模型会在首次使用时下载(英语约 4 MB),之后会缓存在本地——不会上传任何文件。为了获得最佳效果,请使用高对比度、文字清晰的图片,分辨率建议不低于 150 DPI。
如何 OCR 识别文档
- 1
上传图片或扫描 PDF
拖放扫描文档、页面照片或截图。支持 JPG、PNG、WebP 和 PDF 格式。
- 2
选择识别语言
选择文档的主要语言:英文、简体中文、日文或中英混合。正确的语言选择能显著提高识别精度。
- 3
提取并复制文字
FileKit 在浏览器中运行 Tesseract.js(WebAssembly OCR 引擎)。识别出的文字显示在可编辑区域——复制或下载为 .txt 文件。