constitutional-ai

Installation

SKILL.md

Constitutional AI - Harmlessness from AI Feedback

Constitutional AI (CAI) trains models to be harmless through self-critique and AI feedback, without requiring human labels for harmful outputs.

Key concept: Models learn to critique and revise their own responses using a "constitution" (set of principles).

Two phases:

Installs

105

Repository

GitHub Stars

10.3K

First Seen

Jan 21, 2026

Security Audits

constitutional-ai — zechenzhangagi/ai-research-skills