提取文本安全吗？

是的。PDF 在你的浏览器中本地处理，内容不会上传到任何服务器。

支持哪些 PDF 类型？

适用于包含嵌入文本的数字 PDF。扫描的 PDF（图片）需要使用 OCR 工具。

对数字 PDF，提取是精确的。对有复杂布局的 PDF，某些格式（如表格列）可能需要手动调整。

如果 PDF 限制了文本复制，你需要先解锁才能提取。仅限打印的限制可能不影响提取。

通常发生在扫描 PDF（包含图片而非文本）或使用自定义字体编码的 PDF。对扫描文档请使用 OCR 工具。

工具从所有页面提取文本。你可以从输出中选择并复制所需部分。

纯文本提取保留阅读顺序但不保留视觉格式。表格可能显示为分散的文本行。

文本提取读取数字 PDF 中嵌入的文本数据。OCR 从扫描 PDF 的图片中识别文本。数字文件用提取，扫描件用 OCR。

文件始终留在你的设备上

将文件拖到这里

或点击选择文件

单个文件最大 500.0 MB·支持格式：PDF

扫描版 PDF（每页都是图片）无法直接提取文字，请改用 OCR 工具。

文字提取 (OCR)

从图片中提取文字——测试版

PDF 转图片

把每一页导出为 JPG 或 PNG 图片

PDF 压缩

缩小 PDF 文件——四档可选，包含整页光栅化

FileKit 使用 pdf.js 直接读取每一页 PDF 中的文字内容——不经过 OCR。阅读顺序通过文字的垂直位置聚类还原。输出为带页码分隔的 UTF-8 纯文本。对于扫描版（每页都是图片）的 PDF，由于没有嵌入的文字层，无法提取，请改用 OCR 工具。所有处理都在你的浏览器中完成。