data-cleaning-claw
SKILL.md
数据自动化清洗虾
处理脏数据的专用 skill。核心脚本:scripts/data_clean.py。
工作流程
1. 接收数据
用户可通过以下方式提供数据:
- 上传文件(CSV / Excel / JSON)→ 保存到 workspace,记录路径
- 直接粘贴数据 → 写入临时 CSV 文件
2. 确认清洗需求
如果用户没有明确说明,询问以下信息(可一次性问完):
- 需要哪些清洗操作(去重/缺失值/格式标准化/HTML去噪/数据验证)?
- 去重时是否有关键字段(如手机号、邮箱)?
- 输出格式(CSV/Excel/JSON)?