用 MinerU API 解析 PDF/Word/PPT/图片为 Markdown,支持公式、表格、OCR。适用于论文解析、文档提取。
数据来源:ClawHub。 在 ClawSkills 查看
选择你使用的 Agent
方法一:命令行安装(推荐)
推荐(无需提前安装 clawhub)
npx clawhub@latest --dir ~/.claude/skills install mineru或使用 clawhub CLI(需提前安装)
clawhub --dir ~/.claude/skills install mineru⚠️ 需要 Node.js 18+,没有 Node?请使用下方方法二直接下载 ZIP。 安装 Node.js →
方法二:手动下载安装(无需 Node)
下载 ZIP,解压后将文件夹放到以下路径,重启 Agent 即可:
安装路径
~/.claude/skills/mineru/💡解压后将文件夹放到上方路径,重启 Agent 即可生效
--- name: mineru description: 用 MinerU API 解析 PDF/Word/PPT/图片为 Markdown,支持公式、表格、OCR。适用于论文解析、文档提取。 ---
OpenDataLab 出品
> PDF/Word/PPT/图片 → 结构化 Markdown,公式表格全保留!
---
| 资源 | 链接 | |------|------| | 官网 | https://mineru.net/ | | API 文档 | https://mineru.net/apiManage/docs | | GitHub | https://github.com/opendatalab/MinerU |
---
| 类型 | 格式 | |------|------| | 📕 PDF | 论文、书籍、扫描件 | | 📝 Word | .docx | | 📊 PPT | .pptx | | 🖼️ 图片 | .jpg, .png (OCR) |
---
# Header 认证
Authorization: Bearer {YOUR_API_KEY}
# 1. 提交任务
curl -X POST "https://mineru.net/api/v4/extract/task" \
-H "Authorization: Bearer $MINERU_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"url": "https://arxiv.org/pdf/2410.17247",
"enable_formula": true,
"enable_table": true,
"layout_model": "doclayout_yolo",
"language": "en"
}'
# 返回: {"task_id": "xxx", "status": "pending"}
# 2. 轮询结果
curl "https://mineru.net/api/v4/extract/task/{task_id}" \
-H "Authorization: Bearer $MINERU_TOKEN"
# 返回: {"status": "done", "result": {...}}
# 1. 获取上传 URL
curl -X POST "https://mineru.net/api/v4/file-urls/batch" \
-H "Authorization: Bearer $MINERU_TOKEN" \
-d '{"file_names": ["paper1.pdf", "paper2.pdf"]}'
# 2. 上传文件到返回的 presigned URLs
# 3. 批量提交任务
curl -X POST "https://mineru.net/api/v4/extract/task/batch" \
-H "Authorization: Bearer $MINERU_TOKEN" \
-d '{"files": [{"url": "...", "name": "paper1.pdf"}, ...]}'
---
| 参数 | 类型 | 说明 | |------|------|------| | url | string | 文件 URL (支持 http/https) | | enable_formula | bool | 启用公式识别 (默认 true) | | enable_table | bool | 启用表格识别 (默认 true) | | layout_model | string | doclayout_yolo (快) / layoutlmv3 (准) | | language | string | en / ch / auto | | model_version | string | pipeline / vlm / MinerU-HTML |
| 版本 | 速度 | 准确度 | 适用场景 | |------|------|--------|----------| | pipeline | ⚡ 快 | 高 | 常规文档 | | vlm | 🐢 慢 | 最高 | 复杂版面 | | MinerU-HTML | ⚡ 快 | 高 | 网页样式输出 |
---
解析完成后下载的 ZIP 包含:
output/
├── full.md # 完整 Markdown
├── content_list.json # 结构化内容
├── images/ # 提取的图片
└── layout.json # 版面分析结果
---
# 1. 创建论文目录
mkdir -p "./paper-reading/[CVPR 2025] NewPaper"
cd "./paper-reading/[CVPR 2025] NewPaper"
# 2. 提交解析任务
TASK_ID=$(curl -s -X POST "https://mineru.net/api/v4/extract/task" \
-H "Authorization: Bearer $MINERU_TOKEN" \
-H "Content-Type: application/json" \
-d '{"url": "https://arxiv.org/pdf/XXXX.XXXXX"}' | jq -r '.task_id')
# 3. 等待完成 & 下载
# (轮询 status 直到 done,然后下载 result.zip)
# 4. 解压
unzip result.zip -d .
在 ~/.bashrc 或 OpenClaw config 中设置:
export MINERU_TOKEN="your_api_key_here"
---
| 限制 | 数值 | |------|------| | 单文件大小 | 200 MB | | 单文件页数 | 600 页 | | 并发任务数 | 根据套餐 |
---
``` https://arxiv.org/pdf/2410.17247 ```
language: chvlm 模型- 一次提交多个文件,比单个提交更高效
---
---
论文解析不再手动复制粘贴!📖
安装 MinerU PDF Parser 后,可以对 AI 说这些话来触发它
Help me get started with MinerU PDF Parser
Explains what MinerU PDF Parser does, walks through the setup, and runs a quick demo based on your current project
Use MinerU PDF Parser to use MinerU API to parse PDF/Word/PPT/pictures into Markdown, suppor...
Invokes MinerU PDF Parser with the right parameters and returns the result directly in the conversation
What can I do with MinerU PDF Parser in my design & creative workflow?
Lists the top use cases for MinerU PDF Parser, with example commands for each scenario
将技能文件夹放到 ~/.claude/skills/mineru/ 目录(个人级,所有项目可用),或 .claude/skills/mineru/(项目级)。重启 AI 客户端后,用 /mineru 主动调用,或让 AI 根据上下文自动发现并使用。
MinerU PDF Parser 支持 Claude、Cursor、OpenClaw,可与这些 AI 平台无缝集成,扩展其能力。
MinerU PDF Parser 可免费安装使用。请查阅仓库了解许可证信息。
用 MinerU API 解析 PDF/Word/PPT/图片为 Markdown,支持公式、表格、OCR。适用于论文解析、文档提取。
MinerU PDF Parser 属于「Design & Creative」分类,该分类的技能帮助 AI 智能体在此领域执行专业任务。
Automate my design & creative tasks using MinerU PDF Parser
Identifies repetitive steps in your workflow and sets up MinerU PDF Parser to handle them automatically