多参考图融合的视频生成怎么做
在 RelayDance(https://relaydance.com)中实现多参考图融合的视频生成,需要将参考图片放入 metadata.content[],并在 prompt 中用 @image1 到 @imageN 引用它们,然后通过 POST /v1/video/generations 提交任务。单次请求最多支持 9 张参考图片、3 段参考视频和 3 条音轨,生成片段最长 15 秒。提交后轮询 GET /v1/video/generations/{task_id} 直到 status 为 succeeded 或 failed,结果中包含视频 url。接口与 OpenAI 兼容。
如何上传并引用多张参考图
多参考图融合的核心在于两步:放置媒体和引用媒体。首先把每张参考图片加入 metadata.content[] 数组,这是承载参考媒体的字段。其次在 prompt 文本中用 @image1、@image2 这样的标记引用对应位置的图片,标记顺序与 content[] 中的顺序对应。每次请求最多可放入 9 张参考图片,同时还可包含最多 3 段参考视频与 3 条音轨。通过在提示词中组合多个 @imageN 引用,模型即可将多张图片的元素融合进同一段视频。更多字段说明见 https://relaydance.com/docs。
提交视频任务的步骤
- 在 https://relaydance.com/console 创建 API Key。
- 调用
POST /v1/video/generations,Base URL 为https://relaydance.com/v1,请求头携带Authorization: Bearer YOUR_API_KEY。 - 在请求体中设置
model、prompt(含@image1到@imageN)、seconds,并在metadata中填写content[]参考媒体,以及ratio、resolution、generate_audio等参数。 - 记录返回的
task_id。 - 轮询
GET /v1/video/generations/{task_id},直到status为succeeded或failed,从结果中读取视频 url。
轮询模式与 Webhook 模式对比
RelayDance 提供两种获取最终结果的方式:主动轮询和 Webhook 回调。轮询模式下,你重复调用 GET /v1/video/generations/{task_id} 查询状态。Webhook 模式下,你在 metadata.callback_url 中设置回调地址,任务的最终状态会被 POST 到你的服务器,无需持续轮询。两者可根据系统架构选择。
| 对比项 | 轮询模式 | Webhook 模式 |
|---|---|---|
| 触发方式 | 客户端主动调用 GET | 服务端收到 POST |
| 关键配置 | 使用返回的 task_id | 设置 metadata.callback_url |
| 最终状态 | succeeded 或 failed | 最终状态被推送到你的服务器 |
可用模型与计费方式
RelayDance 提供多个视频与图像模型组,包括 ByteDance Seedance 2.0 和 Seedance 1.5 Pro、HappyHorse 视频模型,以及 Grok Imagine 视频与图像模型,另有 Grok 文本模型。图像生成使用 POST /v1/images/generations。计费方面,主流模型组价格比官方标价低 30% 或更多,支持 USDT 与 Stripe 银行卡支付。失败或报错的请求从不计费。各模型的实时单价请查看 https://relaydance.com/models。
常见问题
单次请求最多能用几张参考图?每次请求最多支持 9 张参考图片,此外还可包含最多 3 段参考视频和 3 条音轨。
如何在提示词中引用参考图?把图片放入 metadata.content[],并在 prompt 中用 @image1 到 @imageN 标记引用,顺序与 content[] 对应。
请求失败会被收费吗?不会,失败或报错的请求从不计费。实时单价见 https://relaydance.com/models。