Extract structured data from PDFs, images, and Word files with layout analysis, table recognition, OCR, seal detection, and directory extraction.
数据来源:ClawHub。 在 ClawSkills 查看
选择你使用的 Agent
方法一:命令行安装(推荐)
推荐(无需提前安装 clawhub)
npx clawhub@latest --dir ~/.claude/skills install document-parser或使用 clawhub CLI(需提前安装)
clawhub --dir ~/.claude/skills install document-parser⚠️ 需要 Node.js 18+,没有 Node?请使用下方方法二直接下载 ZIP。 安装 Node.js →
方法二:手动下载安装(无需 Node)
下载 ZIP,解压后将文件夹放到以下路径,重启 Agent 即可:
安装路径
~/.claude/skills/document-parser/💡解压后将文件夹放到上方路径,重启 Agent 即可生效
高精度文档解析技能,从 PDF、图片、Word 文档中提取结构化数据。
document-parser parse <文件路径> [选项]
示例:
document-parser parse C:\docs\report.pdf
document-parser parse C:\docs\scan.jpg --layout --table
document-parser parse C:\docs\contract.docx --output markdown
document-parser status <任务 ID>
| 参数 | 说明 | 示例 | |------|------|------| | 文件路径 | PDF/图片/Word 文件路径 | C:\docs\report.pdf | | --layout | 启用版面分析 | --layout | | --table | 启用表格识别 | --table | | --seal | 启用印章检测 | --seal | | --output | 输出格式 (json/markdown/both) | --output markdown | | --pages | 页码范围 | --pages 1-5,8,10-12 |
DOCUMENT_PARSER_API_KEY=your_api_key
DOCUMENT_PARSER_BASE_URL=http://47.111.146.164:8088/taidp/v1/idp/general_parse
在技能目录创建 config.json:
{
"api_key": "your_api_key",
"base_url": "http://47.111.146.164:8088/taidp/v1/idp/general_parse"
}
返回结构化 JSON 包含:
| 错误码 | 消息 | 说明 | |--------|------|------| | 10000 | Success | 识别成功 | | 10001 | Missing parameter | 参数缺失 | | 10002 | Invalid parameter | 非法参数 | | 10003 | Invalid file | 文件格式非法 | | 10004 | Failed to recognize | 识别失败 | | 10005 | Internal error | 内部错误 |
安装 document-parser 后,可以对 AI 说这些话来触发它
Help me get started with document-parser
Explains what document-parser does, walks through the setup, and runs a quick demo based on your current project
Use document-parser to extract structured data from PDFs, images, and Word files with layo...
Invokes document-parser with the right parameters and returns the result directly in the conversation
What can I do with document-parser in my documents & notes workflow?
Lists the top use cases for document-parser, with example commands for each scenario
将技能文件夹放到 ~/.claude/skills/document-parser/ 目录(个人级,所有项目可用),或 .claude/skills/document-parser/(项目级)。重启 AI 客户端后,用 /document-parser 主动调用,或让 AI 根据上下文自动发现并使用。
document-parser 支持 Claude、Cursor、OpenClaw,可与这些 AI 平台无缝集成,扩展其能力。
document-parser 可免费安装使用。请查阅仓库了解许可证信息。
Extract structured data from PDFs, images, and Word files with layout analysis, table recognition, OCR, seal detection, and directory extraction.
document-parser 属于「Documents & Notes」分类,该分类的技能帮助 AI 智能体在此领域执行专业任务。
Automate my documents & notes tasks using document-parser
Identifies repetitive steps in your workflow and sets up document-parser to handle them automatically