doc-to-repo
Installation
SKILL.md
doc-to-repo: 外部ファイル抽出スキル
外部ファイル(PDF, PPTX, DOCX, 画像, テキスト等)からテキストとメタデータを抽出し、.docstore/ に構造化された中間ファイルとして保存する。
ワークフロー
Step 1: 入力検証
- 引数からファイルパスを取得する。引数がない場合はユーザーに確認する。
- ファイルが存在するか確認する(
lsで確認)。 - ファイル形式を拡張子から判定する(対応形式: pdf, pptx, ppt, docx, png, jpg, jpeg, gif, txt, md)。
.docstore/sources.yamlが存在する場合、同じファイルが既に抽出済みかチェックする。- 既に抽出済みの場合、ユーザーに上書きするか確認する(AskUserQuestion を使用)。