多参考图融合的视频生成怎么做

在 RelayDance(https://relaydance.com)中实现多参考图融合的视频生成,需要将参考图片放入 metadata.content[],并在 prompt 中用 @image1@imageN 引用它们,然后通过 POST /v1/video/generations 提交任务。单次请求最多支持 9 张参考图片、3 段参考视频和 3 条音轨,生成片段最长 15 秒。提交后轮询 GET /v1/video/generations/{task_id} 直到 statussucceededfailed,结果中包含视频 url。接口与 OpenAI 兼容。

如何上传并引用多张参考图

多参考图融合的核心在于两步:放置媒体和引用媒体。首先把每张参考图片加入 metadata.content[] 数组,这是承载参考媒体的字段。其次在 prompt 文本中用 @image1@image2 这样的标记引用对应位置的图片,标记顺序与 content[] 中的顺序对应。每次请求最多可放入 9 张参考图片,同时还可包含最多 3 段参考视频与 3 条音轨。通过在提示词中组合多个 @imageN 引用,模型即可将多张图片的元素融合进同一段视频。更多字段说明见 https://relaydance.com/docs。

提交视频任务的步骤

  1. 在 https://relaydance.com/console 创建 API Key。
  2. 调用 POST /v1/video/generations,Base URL 为 https://relaydance.com/v1,请求头携带 Authorization: Bearer YOUR_API_KEY
  3. 在请求体中设置 modelprompt(含 @image1@imageN)、seconds,并在 metadata 中填写 content[] 参考媒体,以及 ratioresolutiongenerate_audio 等参数。
  4. 记录返回的 task_id
  5. 轮询 GET /v1/video/generations/{task_id},直到 statussucceededfailed,从结果中读取视频 url。

轮询模式与 Webhook 模式对比

RelayDance 提供两种获取最终结果的方式:主动轮询和 Webhook 回调。轮询模式下,你重复调用 GET /v1/video/generations/{task_id} 查询状态。Webhook 模式下,你在 metadata.callback_url 中设置回调地址,任务的最终状态会被 POST 到你的服务器,无需持续轮询。两者可根据系统架构选择。

对比项轮询模式Webhook 模式
触发方式客户端主动调用 GET服务端收到 POST
关键配置使用返回的 task_id设置 metadata.callback_url
最终状态succeededfailed最终状态被推送到你的服务器

可用模型与计费方式

RelayDance 提供多个视频与图像模型组,包括 ByteDance Seedance 2.0 和 Seedance 1.5 Pro、HappyHorse 视频模型,以及 Grok Imagine 视频与图像模型,另有 Grok 文本模型。图像生成使用 POST /v1/images/generations。计费方面,主流模型组价格比官方标价低 30% 或更多,支持 USDT 与 Stripe 银行卡支付。失败或报错的请求从不计费。各模型的实时单价请查看 https://relaydance.com/models。

常见问题

单次请求最多能用几张参考图?每次请求最多支持 9 张参考图片,此外还可包含最多 3 段参考视频和 3 条音轨。

如何在提示词中引用参考图?把图片放入 metadata.content[],并在 prompt 中用 @image1@imageN 标记引用,顺序与 content[] 对应。

请求失败会被收费吗?不会,失败或报错的请求从不计费。实时单价见 https://relaydance.com/models。


RelayDance 首页 · 模型与价格 · 文档 · 全部指南