llm-jailbreaking

Installation

SKILL.md

LLM Jailbreaking Techniques

Master advanced jailbreaking methods that bypass LLM safety training through sophisticated social engineering and technical exploitation.

Quick Reference

Skill:       llm-jailbreaking
Agent:       02-prompt-injection-specialist
OWASP:       LLM01 (Prompt Injection), LLM07 (System Prompt Leakage)
Risk Level:  CRITICAL

Jailbreak Taxonomy

1. Authority Jailbreaks (20-30% success)

Techniques:

Related skills

More from pluginagentmarketplace/custom-plugin-ai-red-teaming

prompt-hacking
Advanced prompt manipulation including direct attacks, indirect injection, and multi-turn exploitation
14
safety-filter-bypass
Techniques to test and bypass AI safety filters, content moderation systems, and guardrails for security assessment
10
red-team-frameworks
Tools and frameworks for AI red teaming including PyRIT, garak, Counterfit, and custom attack automation
6
responsible-disclosure
Ethical vulnerability reporting, coordinated disclosure, and bug bounty participation for AI systems
5
certifications-training
Professional certifications, CTF competitions, and training resources for AI security practitioners
5
security-testing
Comprehensive security testing automation for AI/ML systems with CI/CD integration
5

Installs

Repository

pluginagentmark…-teaming

GitHub Stars

First Seen

Jan 28, 2026

Security Audits

Gen Agent Trust HubFail

SocketFail

SnykFail

llm-jailbreaking

LLM Jailbreaking Techniques

Quick Reference

Jailbreak Taxonomy

1. Authority Jailbreaks (20-30% success)

More from pluginagentmarketplace/custom-plugin-ai-red-teaming

prompt-hacking

safety-filter-bypass

red-team-frameworks

responsible-disclosure

certifications-training

security-testing