byted-podcast-tts

Installation
SKILL.md

Podcast TTS Skill

基于火山引擎豆包语音合成 WebSocket 协议(PodcastTTS,/api/v3/sami/podcasttts)将某个话题合成为播客音频并保存为本地文件。支持:

  • 输入一句话题文本或者一个网页地址(也可以是个文件下载地址,支持 pdf/word/txt 格式)生成播客
  • 输出播客音频下载链接
  • 输出播客分段文本(JSON)

适用场景

  1. 用户提到 生成播客播客合成 等相关关键词。
  2. 用户需要为某个话题生成播客形式的音频文件。
  3. 用户需要某个网页或文件内容生成播客形式的音频文件。
  4. 用户需要为用户上传的文件内容或者一个长上下文生成播客形式的音频文件。

使用步骤

  1. 分析用户需要合成播客的内容,准备要合成的输入:prompt_text(原始话题,一般不超过 20 个字)或 input_url(网页地址或文件下载地址) 或者 text(用户上传文件读取出来的内容或者是一个比较长的文本,一般超过 200 个字)。
  2. 运行脚本前先 cd 到本技能目录:skills/byted-podcast-gen
  3. 配置鉴权(环境变量或命令行参数)。
  4. 执行脚本:python scripts/podcast.py [参数]。参考下面示例部分。
  5. 根据脚本输出的 JSON 里的 audio_path / texts / audio_url 使用生成结果,如果有 audio_url 是一个带过期时间的 URL, 可以返回给用户, audio_path 是本地文件路径, 可以给用户提供下载。

环境变量与鉴权

Related skills

More from bytedance/agentkit-samples

Installs
1
GitHub Stars
330
First Seen
Mar 18, 2026