evaluation-harness

Installation

SKILL.md

Evaluation Harness

Build systematic evaluation frameworks for LLM applications.

Golden Dataset Format

Installs

181

Repository

patricio0312rev/skills

GitHub Stars

49

First Seen

Jan 24, 2026

Security Audits

Gen Agent Trust HubPass

evaluation-harness — patricio0312rev/skills