browser-xterm-interaction

Installation
SKILL.md

Playwright Browser MCP × Web 终端交互

Web 终端(xterm.js、hterm 等)在浏览器中渲染终端界面,但其输出通常用 canvas 或自定义 DOM 渲染,标准的 browser_snapshot() 只能看到 accessibility tree 中的最后一行 prompt。这是与 Web 终端交互时最大的痛点——需要用特定的 JS 方法才能可靠地读取终端输出。

核心原则

  1. 一次定型 — 找到有效的读取方法后坚持用它,不要每次都换方法,因为来回切换会浪费大量 turn
  2. 3 次法则 — 一种方法最多试 3 次就切换下一种,避免在死路上消耗 turn
  3. screenshot 兜底 — JS 方法全部失败时,截图+视觉分析是 100% 可靠的最终手段
  4. marker 包裹 — 用 echo "===START==="; cmd; echo "===END===" 包裹命令输出,方便精确提取

Phase 1: 识别终端类型

先用一次 browser_snapshot()browser_evaluate 探测终端类型:

Related skills

More from wgpsec/aboutsecurity

Installs
6
GitHub Stars
1.3K
First Seen
Apr 22, 2026