数眼智能
首页常见问题
首页常见问题
  1. Vidu视频生成
  • 快速开始
    • 平台简介
    • 控制台(入门)
    • API key
    • Base URL
  • 开发工具接入
    • OpenClaw
    • Claude Code
    • Claude Code IDE
    • Codex
    • OpenCode
    • Cline
    • Grok CLI
    • Gemini CLI
    • N8N
    • AutoClaw
    • 其他工具
  • AI大模型API
    • 文本生成API
      • 对话补全 Chat Completions
    • 官方接口视频生成API
      • 豆包Seedance视频生成
        • 00-概述
        • 01-创建视频生成任务
        • 02-查询视频生成任务
        • 03-查询视频生成任务列表
        • 04-取消或删除视频生成任务
      • 海螺Hailuo视频生成
        • 00-概述
        • 01-文生视频-T2V
        • 02-图生视频-I2V
        • 03-首尾帧生成视频-FL2V
        • 04-主体参考视频-S2V
        • 05-查询任务状态
        • 06-视频下载
        • 07-附录-运镜指令与回调
      • 可灵AI视频生成
        • 00-概述
        • 01-文生视频
        • 02-图生视频
        • 03-视频Omni
        • 04-多图参考生视频
        • 05-动作控制
        • 06-多模态视频编辑
        • 07-视频延长
        • 08-对口型
        • 09-数字人
        • 10-文生音效
        • 11-视频配音效
        • 12-语音合成
        • 13-音色克隆
        • 14-图像识别
        • 15-主体管理
        • 16-视频特效
      • Vidu视频生成
        • 00-概述
        • 01-文生视频
        • 02-图生视频
        • 03-参考生视频
        • 04-首尾帧
        • 05-智能多帧
        • 06-场景特效模板
        • 07-模板成片
        • 08-查询任务
      • 即梦视频生成
        • 00-概述
        • 01-3.0Pro视频生成
        • 02-720P文生视频
        • 03-720P图生视频-首帧
        • 04-720P图生视频-首尾帧
        • 05-720P图生视频-运镜
        • 06-1080P文生视频
        • 07-1080P图生视频-首帧
        • 08-1080P图生视频-首尾帧
        • 09-错误码
    • 通用视频生成API
      • 通用视频生成 API 接口调用文档
    • 通用图像生成API
      • 图像生成接口文档
    • Rerank重排序模型
      • 重排序
  • 搜索/阅读API
    • 网页阅读API
      • Web Reader API
    • 联网搜索API
      • 搜索API
      • 搜索+阅读API
    • 模态卡API
      • 天气
        • 天气模态卡
        • 国内外城市ID
        • 天气查询API
      • 搜索 API(旧)
      • 热搜 API
    • 文件OCR解析API
      • PDF文件
      • URL解析
  • 进阶与系统接口
    • CODE&错误码
    • HTTP注意事项
    • 身份验证
    • 接入指南
    • 在线调试
    • 数据更新相关
    • API 密钥与额度查询接口
    • Models(列出模型)
    • 查询账户信息
  1. Vidu视频生成

02-图生视频

图生视频#

文档版本:v1.0.0 | 最后更新:2026-06-11
本平台已完整适配 Vidu 系列官方视频生成接口,请求与响应均为透传,参数语义与官方一致。
以首帧图片驱动生成视频。
POST https://platform.shuyanai.com/vidu/ent/v2/img2video

请求参数#

请求头#

头部必填说明
Content-Type是application/json
Authorization是Token {API_KEY}

请求体#

参数类型必填默认值说明
modelString是模型名称
可选值:viduq3-turbo、viduq3-pro、viduq3-pro-fast、viduq2-pro-fast、viduq2-pro、viduq2-turbo、viduq1、viduq1-classic、vidu2.0
- viduq3-pro-fast:高效生成优质音视频内容,生成速度更快,性价比高
- viduq3-turbo:对比 viduq3-pro,生成速度更快
- viduq3-pro:高效生成优质音视频内容,效果更好
- viduq2-pro-fast:价格触底、效果稳定,生成速度较 viduq2-turbo 提高 2–3 倍
- viduq2-pro:效果好,细节丰富
- viduq2-turbo:效果好,生成快
- viduq1:画面清晰,平滑转场,运镜稳定
- viduq1-classic:画面清晰,转场、运镜更丰富
- vidu2.0:生成速度快
imagesArray[String]是首帧图像。模型以此图片为首帧画面生成视频。
- 支持图片 Base64 编码或图片 URL(确保可访问)
- 仅支持 1 张图
- 支持 png、jpeg、jpg、webp 格式
- 图片比例需小于 1:4 或 4:1
- 图片大小不超过 50 MB
- POST body 不超过 20MB,Base64 须包含内容类型前缀,如 data:image/png;base64,{base64_encode}
promptString否文本提示词。字符长度不超过 5000 个字符。
注:若使用 is_rec 推荐提示词参数,模型将忽略此提示词
audioBool否false是否使用音视频直出能力(q3-pro、q3-turbo、q3-pro-fast 默认为 true)
- true:输出带台词及背景音的视频
- false:输出静音视频
注 1:该参数为 true 时,voice_id 参数才生效
注 2:该参数为 true 时,仅 q3 模型支持错峰
audio_typeString否all音频类型,audio 为 true 时生效
- all:音效+人声
- speech_only:仅人声
- sound_effect_only:仅音效
注:目前仅支持 q2、q1、2.0 系列模型的音频拆分
voice_idString否音色 ID,q3 系列模型不生效。为空时系统自动推荐。
is_recBool否是否使用推荐提示词
- true:系统自动推荐提示词并使用其生成视频
- false:根据输入的 prompt 生成视频
注:启用后每个任务多消耗 10 积分
bgmBool否false是否添加背景音乐
注:q2 模型 duration 为 9s 或 10s 时不生效;q3 系列不生效
durationInt否视频时长(秒)。默认值依模型而定:
- viduq3-pro、viduq3-turbo、viduq3-pro-fast:默认 5,可选 1–16
- viduq2-pro-fast、viduq2-pro、viduq2-turbo:默认 5,可选 1–10
- viduq1、viduq1-classic:默认 5,可选 5
- vidu2.0:默认 4,可选 4、8
seedInt否随机种子。不传或传 0 时使用随机数。
resolutionString否分辨率。默认值依模型和时长而定:
- viduq3-pro-fast(1–16s):默认 720p,可选 720p、1080p
- viduq3-pro、viduq3-turbo(1–16s):默认 720p,可选 540p、720p、1080p
- viduq2-pro-fast(1–10s):默认 720p,可选 720p、1080p
- viduq2-pro、viduq2-turbo(1–10s):默认 720p,可选 540p、720p、1080p
- viduq1、viduq1-classic(5s):默认 1080p,可选 1080p
- vidu2.0(4s):默认 360p,可选 360p、720p、1080p
- vidu2.0(8s):默认 720p,可选 720p
movement_amplitudeString否auto运动幅度。可选值:auto、small、medium、large
注:q2、q3 系列模型该参数不生效
off_peakBool否false错峰模式
注:除 q3 外的其他音视频直出功能不支持错峰模式
watermarkBool否false是否添加水印。默认不加。
wm_positionInt否3水印位置
1:左上角,2:右上角,3:右下角,4:左下角
wm_urlString否自定义水印图片 URL。不传时使用默认水印。
payloadString否透传参数。最多 1048576 个字符。
meta_dataString否元数据标识,JSON 格式字符串,透传字段。
callback_urlString否回调地址。任务状态变化时以 POST 方式发送回调请求。

请求示例#


响应参数#

字段类型说明
task_idString任务 ID
stateString处理状态:created、queueing、processing、success、failed
modelString本次调用的模型名称
promptString本次调用的提示词
imagesArray[String]本次调用的图像参数
durationInt视频时长
audioBool是否使用音视频直出
audio_typeString音频类型
seedInt随机种子
resolutionString分辨率
movement_amplitudeString运动幅度
payloadString透传参数
off_peakBool是否使用错峰模式
creditsInt本次调用消耗的积分数
watermarkBool是否使用水印
created_atString任务创建时间

响应示例#

{
  "task_id": "{task_id}",
  "state": "created",
  "model": "viduq3-pro",
  "images": ["https://example.com/image.png"],
  "prompt": "The astronaut waved and the camera moved up.",
  "duration": 5,
  "seed": 123456,
  "resolution": "1080p",
  "movement_amplitude": "auto",
  "payload": "",
  "off_peak": false,
  "credits": 8,
  "created_at": "2025-01-01T15:41:31.968916Z"
}
上一页
01-文生视频
下一页
03-参考生视频