是的。图片在你的浏览器中本地处理，不会上传到任何服务器。

支持哪些语言？

OCR 引擎支持多种语言，包括英语、中文、日语、韩语、西班牙语、法语、德语等。

识别准确度如何？

取决于图片质量。清晰、高分辨率的图片可达 95% 以上准确率。模糊、旋转或低对比度的图片可能产生更多错误。

能 OCR 多页 PDF 吗？

可以。每页单独处理，所有页面提取的文本合并在输出中。

支持手写文字吗？

OCR 主要针对印刷体文字优化。手写文字识别率较低，取决于书写清晰度。

支持哪些图片格式？

支持 JPG、PNG、WebP、TIFF 等常见图片格式，以及扫描的 PDF 文件。

如何提高 OCR 准确率？

使用高分辨率、高对比度的图片。确保文字清晰、不倾斜。300 DPI 以上的扫描件效果最好。

输出格式是什么？

输出为纯文本。你可以复制到任何文本编辑器或文档中进一步编辑和格式化。

文字提取 (OCR) 测试版

文件始终留在你的设备上

识别语言

将文件拖到这里

或点击选择文件

单个文件最大 50.0 MB·支持格式：JPG · PNG · WebP · BMP · TIFF · PDF

你可能还需要

🔤

图片转文字

使用 OCR 从图片中提取文字——支持中文、英文和日文。

📝

PDF 提取文字

把 PDF 中的全部文字导出为 .txt

📑

图片合成 PDF

把 JPG、PNG、WebP 图片合成一个 PDF

OCR 工作原理

FileKit 使用 Tesseract.js（Tesseract OCR 引擎的 WebAssembly 移植版）在浏览器本地完成文字识别。语言模型会在首次使用时下载（英语约 4 MB），之后会缓存在本地——不会上传任何文件。为了获得最佳效果，请使用高对比度、文字清晰的图片，分辨率建议不低于 150 DPI。

如何 OCR 识别文档

1
上传图片或扫描 PDF
拖放扫描文档、页面照片或截图。支持 JPG、PNG、WebP 和 PDF 格式。
2
选择识别语言
选择文档的主要语言：英文、简体中文、日文或中英混合。正确的语言选择能显著提高识别精度。
3
提取并复制文字
FileKit 在浏览器中运行 Tesseract.js（WebAssembly OCR 引擎）。识别出的文字显示在可编辑区域——复制或下载为 .txt 文件。

文字提取 (OCR) 测试版

你可能还需要

OCR 工作原理

如何 OCR 识别文档

上传图片或扫描 PDF

选择识别语言

提取并复制文字

常见问题

相关指南