如何通过 API 生成带音频的视频
通过 RelayDance(https://relaydance.com)的视频生成 API,您可以在提交任务时启用音频。向 POST /v1/video/generations 发送请求,在 metadata.generate_audio 中开启音频,并提供 model、prompt 和 seconds 等参数。接着轮询 GET /v1/video/generations/{task_id},直到 status 为 succeeded,结果中即包含视频 url。也可设置 metadata.callback_url 通过 webhook 接收最终结果。该 API 兼容 OpenAI 格式,基础地址为 https://relaydance.com/v1。
认证与基础配置
所有请求都需要在请求头中加入 Authorization: Bearer YOUR_API_KEY。您可以在 https://relaydance.com/console 创建 API 密钥。API 的基础 URL 为 https://relaydance.com/v1,并兼容 OpenAI 接口格式,因此可以直接复用现有的 OpenAI 客户端库,只需替换 base URL 与密钥。可用模型包括 ByteDance Seedance 2.0 和 Seedance 1.5 Pro、HappyHorse 视频模型,以及 Grok Imagine 视频与图像模型和 Grok 文本模型。完整的每个模型实时费率可在 https://relaydance.com/models 查看,更多接口细节见 https://relaydance.com/docs。
提交带音频的视频任务
生成带音频的视频,向 POST /v1/video/generations 提交任务,必填 model、prompt 和 seconds,并在 metadata 中设置 generate_audio 以启用音频输出。metadata 还可包含 ratio、resolution、callback_url 以及 content[](参考媒体)。参考媒体放入 metadata.content[],并在 prompt 中用 @image1 到 @imageN 引用。每个请求最多支持 9 张参考图片、3 段参考视频和 3 条音频轨道,单个片段时长最长 15 秒。
获取结果:轮询或 Webhook
提交任务后有两种方式获取结果。第一种是轮询:调用 GET /v1/video/generations/{task_id},反复查询直到 status 变为 succeeded 或 failed,成功时返回结果中包含视频 url。第二种是 webhook 模式:在提交时设置 metadata.callback_url,任务的最终状态会被 POST 到您指定的服务器地址,无需主动轮询。两种方式适用于不同场景:轮询实现简单,webhook 更适合异步与高并发集成。
操作步骤
- 在 https://relaydance.com/console 创建 API 密钥。
- 在请求头中加入
Authorization: Bearer YOUR_API_KEY。 - 向
POST /v1/video/generations提交任务,填写model、prompt、seconds,并在metadata.generate_audio中启用音频。 - 如需参考媒体,放入
metadata.content[]并在prompt中以@image1等引用。 - 通过轮询
GET /v1/video/generations/{task_id}或设置metadata.callback_url获取最终结果中的视频 url。
两种结果获取方式对比
| 对比项 | 轮询(Polling) | Webhook 模式 |
|---|---|---|
| 触发方式 | 主动调用 GET /v1/video/generations/{task_id} | 设置 metadata.callback_url |
| 结果传递 | 查询返回结果中的视频 url | 最终状态被 POST 到您的服务器 |
| 终止状态 | succeeded 或 failed | 最终状态推送 |
| 适用场景 | 实现简单的集成 | 异步与高并发集成 |
价格与计费
RelayDance 支持 USDT 和 Stripe 银行卡两种支付方式。主流模型组的价格相比官方标价低 30% 或更多。失败或出错的请求永远不会计费,因此您只需为成功的生成付费。各模型的实时费率请以 https://relaydance.com/models 上的数据为准。
常见问题
问题 1:如何在视频中启用音频?
在提交 POST /v1/video/generations 时,于 metadata.generate_audio 中启用音频即可。
问题 2:一个请求最多可以包含多少参考媒体?
最多 9 张参考图片、3 段参考视频和 3 条音频轨道,参考媒体放入 metadata.content[],并在 prompt 中用 @image1 到 @imageN 引用。
问题 3:失败的请求会被计费吗?
不会。失败或出错的请求永远不会计费。