智能读取任意URL内容,支持微信公众号、小红书、今日头条、抖音、淘宝、天猫、京东、百度等中国主流平台,自动识别平台类型并提取核心内容。自动保存内容为Markdown,下载图片到本地。
数据来源:ClawHub。 在 ClawSkills 查看
选择你使用的 Agent
方法一:命令行安装(推荐)
推荐(无需提前安装 clawhub)
npx clawhub@latest --dir ~/.claude/skills install url-reader或使用 clawhub CLI(需提前安装)
clawhub --dir ~/.claude/skills install url-reader⚠️ 需要 Node.js 18+,没有 Node?请使用下方方法二直接下载 ZIP。 安装 Node.js →
方法二:手动下载安装(无需 Node)
下载 ZIP,解压后将文件夹放到以下路径,重启 Agent 即可:
安装路径
~/.claude/skills/url-reader/💡解压后将文件夹放到上方路径,重启 Agent 即可生效
--- name: url-reader description: 智能读取任意URL内容,支持微信公众号、小红书、今日头条、抖音、淘宝、天猫、京东、百度等中国主流平台,自动识别平台类型并提取核心内容。自动保存内容为Markdown,下载图片到本地。 ---
一键读取任意URL的内容,自动识别平台类型,智能选择最佳读取策略,自动保存内容和图片到本地。
/Users/ys/laoyang知识库/nickys/素材/
保存格式:
素材/
└── 2026-01-30_文章标题/
├── content.md # Markdown内容
├── img_01.webp # 图片1
├── img_02.webp # 图片2
└── ...
┌─────────────────────────────────────────────────────────────────┐
│ URL Reader 技术架构 │
├─────────────────────────────────────────────────────────────────┤
│ │
│ 用户输入 URL │
│ ↓ │
│ ┌─────────────┐ │
│ │ 平台识别器 │ → 识别URL所属平台(微信/小红书/淘宝等) │
│ └─────────────┘ │
│ ↓ │
│ ┌─────────────────────────────────────────────────────────────┐│
│ │ 策略选择器 ││
│ │ ┌───────────┐ ┌───────────┐ ┌───────────┐ ││
│ │ │ 策略1 │ │ 策略2 │ │ 策略3 │ ││
│ │ │ Firecrawl │→│ Jina │→│ Playwright │ ││
│ │ │ (首选) │ │ (备选) │ │ (兜底) │ ││
│ │ └───────────┘ └───────────┘ └───────────┘ ││
│ └─────────────────────────────────────────────────────────────┘│
│ ↓ │
│ ┌─────────────┐ │
│ │ 内容提取器 │ → 提取标题、正文、作者、时间等 │
│ └─────────────┘ │
│ ↓ │
│ ┌─────────────┐ │
│ │ 格式化输出 │ → Markdown 格式 │
│ └─────────────┘ │
│ │
└─────────────────────────────────────────────────────────────────┘
特点:
API 调用:
from firecrawl import Firecrawl
app = Firecrawl(api_key="fc-YOUR_API_KEY")
result = app.scrape(url, formats=["markdown"])
定价:
特点:
使用方式:
https://r.jina.ai/{原始URL}
特点:
适用场景:
用户:帮我读取这个链接 https://mp.weixin.qq.com/s/xxxxx
用户:看看这个小红书 https://www.xiaohongshu.com/explore/xxxxx
用户:读一下这个网页 https://example.com/article
/url-reader https://example.com/article
| 平台 | 域名 | 推荐策略 | 备注 | |------|------|----------|------| | 微信公众号 | mp.weixin.qq.com | Firecrawl → Playwright | 可能需要登录 | | 小红书 | xiaohongshu.com | Firecrawl → Jina | 短链接需解析 | | 今日头条 | toutiao.com | Firecrawl → Jina | - | | 抖音 | douyin.com | Firecrawl | 提取视频描述 | | 淘宝 | taobao.com | Firecrawl → Playwright | 可能需要登录 | | 天猫 | tmall.com | Firecrawl → Playwright | 可能需要登录 | | 京东 | jd.com | Firecrawl → Jina | - | | 百度 | baidu.com | Firecrawl → Jina | - | | 知乎 | zhihu.com | Firecrawl → Jina | - | | 微博 | weibo.com | Firecrawl → Playwright | 可能需要登录 | | B站 | bilibili.com | Firecrawl → Jina | - | | 通用网站 | * | Firecrawl → Jina | - |
1. 接收 URL
2. 识别平台类型
3. 选择读取策略:
├─ 尝试 Firecrawl API
│ ├─ 成功 → 返回内容
│ └─ 失败 → 继续
├─ 尝试 Jina Reader
│ ├─ 成功 → 返回内容
│ └─ 失败 → 继续
└─ 尝试 Playwright(需要登录态)
├─ 有登录态 → 读取内容
└─ 无登录态 → 提示用户设置
4. 提取核心内容
5. 格式化输出
# [文章标题]
**来源**:[平台名称]
**作者**:[作者名称]
**发布时间**:[时间]
**原文链接**:[URL]
---
[正文内容]
---
**互动数据**(如有):
- 阅读/播放:xxx
- 点赞:xxx
- 评论:xxx
```bash export FIRECRAWL_API_KEY="fc-YOUR_API_KEY" ```
用于需要登录的平台(如微信公众号):
cd ~/.claude/skills/url-reader
source .venv/bin/activate
python scripts/wechat_reader.py setup
url-reader/
├── skill.md # 本文档
├── metadata.json # 元数据
├── scripts/
│ ├── url_reader.py # 主读取器(整合三种策略)
│ ├── firecrawl_reader.py # Firecrawl 策略
│ ├── jina_reader.py # Jina 策略
│ ├── wechat_reader.py # Playwright 策略(微信)
│ └── url_identifier.py # URL 平台识别器
└── data/
└── wechat_auth.json # 微信登录态(自动生成)
cd ~/.claude/skills/url-reader
python3 -m venv .venv
source .venv/bin/activate
# 核心依赖
pip install firecrawl-py requests
# Playwright(可选,用于需要登录的平台)
pip install playwright
playwright install chromium
A: 可能原因:
A:
A: 微信反爬最严格,建议:
安装 Url Reader 后,可以对 AI 说这些话来触发它
Help me get started with Url Reader
Explains what Url Reader does, walks through the setup, and runs a quick demo based on your current project
Use Url Reader to intelligently reads the content of any URL, supports WeChat officia...
Invokes Url Reader with the right parameters and returns the result directly in the conversation
What can I do with Url Reader in my marketing & growth workflow?
Lists the top use cases for Url Reader, with example commands for each scenario
将技能文件夹放到 ~/.claude/skills/url-reader/ 目录(个人级,所有项目可用),或 .claude/skills/url-reader/(项目级)。重启 AI 客户端后,用 /url-reader 主动调用,或让 AI 根据上下文自动发现并使用。
Url Reader 支持 Claude、Cursor、OpenClaw,可与这些 AI 平台无缝集成,扩展其能力。
Url Reader 可免费安装使用。请查阅仓库了解许可证信息。
智能读取任意URL内容,支持微信公众号、小红书、今日头条、抖音、淘宝、天猫、京东、百度等中国主流平台,自动识别平台类型并提取核心内容。自动保存内容为Markdown,下载图片到本地。
Url Reader 属于「Marketing & Growth」分类,该分类的技能帮助 AI 智能体在此领域执行专业任务。
Automate my marketing & growth tasks using Url Reader
Identifies repetitive steps in your workflow and sets up Url Reader to handle them automatically