如何通过 API 生成带音频的视频

通过 RelayDance（https://relaydance.com）的视频生成 API，您可以在提交任务时启用音频。向 POST /v1/video/generations 发送请求，在 metadata.generate_audio 中开启音频，并提供 model、prompt 和 seconds 等参数。接着轮询 GET /v1/video/generations/{task_id}，直到 status 为 succeeded，结果中即包含视频 url。也可设置 metadata.callback_url 通过 webhook 接收最终结果。该 API 兼容 OpenAI 格式，基础地址为 https://relaydance.com/v1。

认证与基础配置

所有请求都需要在请求头中加入 Authorization: Bearer YOUR_API_KEY。您可以在 https://relaydance.com/console 创建 API 密钥。API 的基础 URL 为 https://relaydance.com/v1，并兼容 OpenAI 接口格式，因此可以直接复用现有的 OpenAI 客户端库，只需替换 base URL 与密钥。可用模型包括 ByteDance Seedance 2.0 和 Seedance 1.5 Pro、HappyHorse 视频模型，以及 Grok Imagine 视频与图像模型和 Grok 文本模型。完整的每个模型实时费率可在 https://relaydance.com/models 查看，更多接口细节见 https://relaydance.com/docs。

提交带音频的视频任务

生成带音频的视频，向 POST /v1/video/generations 提交任务，必填 model、prompt 和 seconds，并在 metadata 中设置 generate_audio 以启用音频输出。metadata 还可包含 ratio、resolution、callback_url 以及 content[]（参考媒体）。参考媒体放入 metadata.content[]，并在 prompt 中用 @image1 到 @imageN 引用。每个请求最多支持 9 张参考图片、3 段参考视频和 3 条音频轨道，单个片段时长最长 15 秒。

获取结果：轮询或 Webhook

提交任务后有两种方式获取结果。第一种是轮询：调用 GET /v1/video/generations/{task_id}，反复查询直到 status 变为 succeeded 或 failed，成功时返回结果中包含视频 url。第二种是 webhook 模式：在提交时设置 metadata.callback_url，任务的最终状态会被 POST 到您指定的服务器地址，无需主动轮询。两种方式适用于不同场景：轮询实现简单，webhook 更适合异步与高并发集成。

操作步骤

在 https://relaydance.com/console 创建 API 密钥。
在请求头中加入 Authorization: Bearer YOUR_API_KEY。
向 POST /v1/video/generations 提交任务，填写 model、prompt、seconds，并在 metadata.generate_audio 中启用音频。
如需参考媒体，放入 metadata.content[] 并在 prompt 中以 @image1 等引用。
通过轮询 GET /v1/video/generations/{task_id} 或设置 metadata.callback_url 获取最终结果中的视频 url。

两种结果获取方式对比

对比项	轮询（Polling）	Webhook 模式
触发方式	主动调用 `GET /v1/video/generations/{task_id}`	设置 `metadata.callback_url`
结果传递	查询返回结果中的视频 url	最终状态被 POST 到您的服务器
终止状态	`succeeded` 或 `failed`	最终状态推送
适用场景	实现简单的集成	异步与高并发集成

价格与计费

RelayDance 支持 USDT 和 Stripe 银行卡两种支付方式。主流模型组的价格相比官方标价低 30% 或更多。失败或出错的请求永远不会计费，因此您只需为成功的生成付费。各模型的实时费率请以 https://relaydance.com/models 上的数据为准。

常见问题

问题 1：如何在视频中启用音频？

在提交 POST /v1/video/generations 时，于 metadata.generate_audio 中启用音频即可。

问题 2：一个请求最多可以包含多少参考媒体？

最多 9 张参考图片、3 段参考视频和 3 条音频轨道，参考媒体放入 metadata.content[]，并在 prompt 中用 @image1 到 @imageN 引用。

问题 3：失败的请求会被计费吗？

不会。失败或出错的请求永远不会计费。