browser-xterm-interaction

Installation

SKILL.md

Playwright Browser MCP × Web 终端交互

Web 终端（xterm.js、hterm 等）在浏览器中渲染终端界面，但其输出通常用 canvas 或自定义 DOM 渲染，标准的 browser_snapshot() 只能看到 accessibility tree 中的最后一行 prompt。这是与 Web 终端交互时最大的痛点——需要用特定的 JS 方法才能可靠地读取终端输出。

核心原则

一次定型 — 找到有效的读取方法后坚持用它，不要每次都换方法，因为来回切换会浪费大量 turn
3 次法则 — 一种方法最多试 3 次就切换下一种，避免在死路上消耗 turn
screenshot 兜底 — JS 方法全部失败时，截图+视觉分析是 100% 可靠的最终手段
marker 包裹 — 用 echo "===START==="; cmd; echo "===END===" 包裹命令输出，方便精确提取

Phase 1: 识别终端类型

先用一次 browser_snapshot() 或 browser_evaluate 探测终端类型：

Related skills

More from wgpsec/aboutsecurity

Installs

6

Repository

wgpsec/aboutsecurity

GitHub Stars

1.3K

First Seen

Apr 22, 2026

Security Audits

Gen Agent Trust HubPass