safety-filter-bypass

Installation

SKILL.md

Safety Filter Bypass Testing

Test AI system safety filters and content moderation to identify weaknesses in protective mechanisms.

Quick Reference

Skill:       safety-filter-bypass
Agent:       02-prompt-injection-specialist
OWASP:       LLM01 (Prompt Injection), LLM05 (Improper Output Handling)
Risk Level:  HIGH

Filter Type Analysis

Installs

Repository

pluginagentmark…-teaming

GitHub Stars

First Seen

Jan 28, 2026

Security Audits

Gen Agent Trust HubFail

SocketFail

SnykFail

safety-filter-bypass — pluginagentmarketplace/custom-plugin-ai-red-teaming