skill-browser-crawl
Browser-Based Web Crawler (浏览器网页爬虫)
一个基于浏览器的轻量级网页爬取工具,专为实际应用场景设计。当用户需要爬取需要 JavaScript 渲染的页面、将内容提取为 Markdown 格式或递归爬取整个文档站点时,请使用此技能。
快速开始
基础单页爬取
用于爬取单个 URL 并提取其 Markdown 内容:
python skills/skill-browser-crawl/scripts/basic_crawl.py <url>
示例:
python skills/skill-browser-crawl/scripts/basic_crawl.py https://example.com
More from hwj123hwj/custom-skills
bilibili-toolkit
B 站综合工具箱。集成视频下载、文稿采集、向量知识库构建、语义检索问答及 UP 主人格画像分析等功能。
26bilibili-video-helper
搜索、分析和提取 Bilibili 视频的综合工具。每当用户提到 B 站、bilibili、提供 B 站链接(bilibili.com, b23.tv)、要求搜索特定视频、提取视频元数据(标题、UP主、播放量、简介)、获取视频字幕、获取评论或弹幕进行分析总结时,必须触发此技能。支持处理 412 风控引导及 Cookie 注入。
20idea-incubator
专业的 CPO + 技术合伙人助手,帮助用户孵化想法、分析可行性并编写技术文档。适用于当你有新产品想法、技术方案或“灵光一现”需要结构化整理时。
10bjtuo-classroom-query
北京交通大学(BJTU)教室综合查询。结合教务系统课表(判断是否有课)和实时人数接口(当前在场人数),综合评估教室空闲情况。
7media-analyze
媒体分析报告生成。多源搜索话题,自动生成结构化分析报告。触发场景:(1) 用户要求分析某个话题 (2) 需要生成话题调研报告 (3) 了解事件的舆论反应。关键词:分析话题、媒体报告、话题调研、舆论分析。
4bilibili-cli
CLI skill for Bilibili (哔哩哔哩, B站) with token-efficient YAML output for AI agents to browse videos, users, search, trending, dynamics, favorites, and interactions from the terminal
4