P

Pdf Ocr

pdf-ocr

🌐 English

PDF扫描件转Word文档。支持中文OCR识别，自动裁掉页眉页脚，保留插图，彩色章节封面页保留为图片。使用百度OCR API（免费额度1000次/月）。当用户要求把扫描PDF转成文字/Word时触发。

数据来源：ClawHub。在 ClawSkills 查看

5.1k下载量

1收藏数

63浏览量

安装

选择你使用的 Agent

方法一：命令行安装（推荐）

关于 Pdf Ocr

--- name: pdf-ocr description: PDF扫描件转Word文档。支持中文OCR识别，自动裁掉页眉页脚，保留插图，彩色章节封面页保留为图片。使用百度OCR API（免费额度1000次/月）。当用户要求把扫描PDF转成文字/Word时触发。 ---

PDF扫描件 OCR 转换技能 📄

配置

百度 OCR API Key: vOBOM7tO0lL8cKMJdZy453Ai
百度 OCR Secret Key: bib8MvDPTfXXdPz4JyzIyDCvCeKxtpyu
免费额度: 1000次/月（1次=1页），592页以内一次免费跑完
接口: 通用文字识别（高精度版）accurate_basic

依赖安装

pip install pymupdf python-docx pillow

使用方法

python3 {baseDir}/scripts/pdf_to_docx.py <PDF路径> [输出目录]

输出文件在 [输出目录]/xxx_全文_ocr.docx，文件较大时用脚本压缩图片：

python3 {baseDir}/scripts/compress_docx.py <docx路径> <输出路径>

处理策略

| 页面类型 | 判断方式 | 处理方式 | |---------|---------|---------| | 正文页 | 默认 | 裁掉顶部6%（页眉）+底部4%（页脚），OCR识别文字 | | 插图页 | OCR无文字输出 | 保留为图片嵌入Word | | 彩色封面/章节页 | 彩色像素占比>25% | 保留为图片，加灰色标注 |

已知限制

图文混排页（图表里有文字）：OCR会把图表内文字识别为正文，需人工替换

- 解决：用户找到问题页，告知PDF页码，截图后手动替换

白底目录页：不会被自动识别为特殊页，会被OCR识别（效果一般）

- 解决：转换后人工替换目录页为图片

实战案例（《预测之书》592页）

处理时间：约20分钟（含0.6s/页间隔）
输出原始大小：303MB（嵌入144张图片）
压缩后大小：3.4MB（图片降分辨率至600px宽，质量60%）
识别效果：正文准确率高，图表页需人工处理
每50页自动保存一次进度，防止中途崩溃

注意事项

免费版 QPS=2，脚本已加0.6秒/页间隔
裁剪比例（页眉6%/页脚4%）可在脚本顶部调整
OCR完成后建议抽查几页校对准确率
原始高清版保留在服务器，压缩版用于分发

Prompt 示例

安装 Pdf Ocr 后，可以对 AI 说这些话来触发它

U

Help me get started with Pdf Ocr

A

Explains what Pdf Ocr does, walks through the setup, and runs a quick demo based on your current project

U

Use Pdf Ocr to convert PDF scans to Word documents

A

Invokes Pdf Ocr with the right parameters and returns the result directly in the conversation

U

What can I do with Pdf Ocr in my documents & notes workflow?

A

Lists the top use cases for Pdf Ocr, with example commands for each scenario

常见问题

如何安装 Pdf Ocr？▾

将技能文件夹放到 ~/.claude/skills/pdf-ocr/ 目录（个人级，所有项目可用），或 .claude/skills/pdf-ocr/（项目级）。重启 AI 客户端后，用 /pdf-ocr 主动调用，或让 AI 根据上下文自动发现并使用。

Pdf Ocr 支持哪些 AI 平台？▾

Pdf Ocr 支持 Claude、Cursor、OpenClaw，可与这些 AI 平台无缝集成，扩展其能力。

Pdf Ocr 是免费的吗？▾

Pdf Ocr 可免费安装使用。请查阅仓库了解许可证信息。

Pdf Ocr 有什么功能？▾

PDF扫描件转Word文档。支持中文OCR识别，自动裁掉页眉页脚，保留插图，彩色章节封面页保留为图片。使用百度OCR API（免费额度1000次/月）。当用户要求把扫描PDF转成文字/Word时触发。

Pdf Ocr 属于哪个分类？▾

Pdf Ocr 属于「Documents & Notes」分类，该分类的技能帮助 AI 智能体在此领域执行专业任务。

使用场景

Getting Started with Pdf Ocr→Automate Documents & Notes Workflows with Pdf Ocr→Team Collaboration with Pdf Ocr→