图生视频

文档版本：v1.0.0 | 最后更新：2026-06-11

本平台已完整适配可灵 AI 系列官方视频生成接口，请求与响应均为透传，参数语义与官方一致。

创建任务

POST https://platform.shuyanai.com/kling/v1/videos/image2video

请您注意，为了保持命名统一，原 model 字段变更为 model_name 字段，未来请您使用该字段来指定需要调用的模型版本。
同时，我们保持了行为上的向前兼容，如您继续使用原 model 字段，不会对接口调用有任何影响、不会有任何异常，等价于 model_name 为空时的默认行为（即调用V1模型）

请求头

参数	类型	必填	默认值	说明
`Content-Type`	string	是	application/json	数据交换格式
`Authorization`	string	是		鉴权信息，参考接口鉴权

请求体

参数	类型	必填	默认值	说明
`model_name`	string	否	kling-v1	模型名称可选值: `kling-v1`, `kling-v1-5`, `kling-v1-6`, `kling-v2-master`, `kling-v2-1`, `kling-v2-1-master`, `kling-v2-5-turbo`, `kling-v2-6`, `kling-v3`
`image`	string	否		参考图像 - 支持传入图片 Base64 编码或图片 URL（确保可访问） - 注意：请确保您传递的所有图像数据参数均采用Base64编码格式。若您使用 Base64 方式，请不要在 Base64 编码字符串前添加任何前缀（如 `data:image/png;base64,`），直接传递 Base64 编码后的字符串即可。 - 正确的 Base64 编码参数： - 错误的 Base64 编码参数（包含 data: 前缀）： - 图片格式支持 `.jpg / .jpeg / .png` - 图片文件大小不能超过 10MB，图片宽高尺寸不小于 300px，图片宽高比介于 1:2.5 ~ 2.5:1 之间 - image 参数与 image_tail 参数至少二选一，二者不能同时为空不同模型版本、视频模式支持范围不同，详见能力地图
`image_tail`	string	否		参考图像 - 尾帧控制 - 支持传入图片 Base64 编码或图片 URL（确保可访问） - 注意：若您使用 Base64 方式，请不要在 Base64 编码字符串前添加任何前缀（如 `data:image/png;base64,`），直接传递 Base64 编码后的字符串即可。 - 图片格式支持 `.jpg / .jpeg / .png` - 图片文件大小不能超过 10MB，图片宽高尺寸不小于 300px - image 参数与 image_tail 参数至少二选一，二者不能同时为空 - image_tail 参数、dynamic_masks/static_mask 参数、camera_control 参数三选一，不能同时使用不同模型版本、视频模式支持范围不同，详见能力地图
`multi_shot`	boolean	否	false	是否生成多镜头视频当前参数为 true 时，prompt 参数无效当前参数为 false 时，shot_type 参数及 multi_prompt 参数无效
`shot_type`	string	否		分镜方式可选值: `customize`, `intelligence` 当 multi_shot 参数为 true 时，当前参数必填
`prompt`	string	否		正向文本提示词 Omni模型可通过Prompt与主体、图片、视频等内容实现多种能力： - 通过<<<>>>的格式来指定某个主体、图片或视频，如：<<<element_1>>>、<<<image_1>>>、<<<video_1>>> - 能力范围详见使用手册：可灵Omni模型使用指南、可灵视频 3.0 Omni 使用指南 - 不能超过 2500 个字符 - 当 multi_shot 为 false 或 shot_type 为 intelligence 时不得为空。 - 用 `<<<voice_1>>>` 来指定音色，序号同 voice_list 参数所引用音色的排列顺序 - 一次视频生成任务至多引用 2 个音色；指定音色时，sound 参数值必须为 on - 语法结构越简单越好，如：男人<<<voice_1>>>说："你好" - 当 voice_list 参数不为空且 prompt 参数中引用音色 ID 时，视频生成任务按"有指定音色"计量计费不同模型版本、视频模式支持范围不同，详见能力地图
`multi_prompt`	array	否		各分镜信息，如提示词、时长等通过 index、prompt、duration 定义分镜序号及提示词、时长。 - 最多支持6个分镜，最小支持1个分镜； - 每个分镜相关内容的最大长度不超过512； - 每个分镜的时长不大于当前任务的总时长，不小于1； - 所有分镜的时长之和等于当前任务的总时长; 用key:value承载，格式如下： ```json "multi_prompt":[ {"index":int,"prompt":"string","duration":"5"}, {"index":int,"prompt":"string","duration":"5"} ] 当 multi_shot 为 true 且 shot_type 为 customize 时当前参数必填
`negative_prompt`	string	否		负向文本提示词 - 不能超过 2500 个字符 - 建议通过正向提示词中的负向句子补充负向提示信息
`element_list`	array	否		参考主体列表，基于主体库中主体的 ID 配置 - 最多支持 3 个参考主体主体分为视频角色主体和多图主体，适用范围不同。详见可灵「主体库 3.0」使用指南。 - 用 key:value 承载，格式如上：不同模型版本、视频模式支持范围不同，详见能力地图
`element_id`	long	是		主体库中的主体 ID
`voice_list`	array	否		生成视频时所引用的音色的列表 - 一次视频生成任务至多引用 2 个音色 - 当 voice_list 参数不为空且 prompt 参数中引用音色 ID 时，视频生成任务按"有指定音色"计量计费 - voice_id 参数值通过音色定制接口返回，也可使用系统预置音色，详见音色定制相关API；非对口型 API 的 voice_id - element_list 与 voice_list 互斥，不能共存示例：不同模型版本、视频模式支持范围不同，详见能力地图
`sound`	string	否	off	生成视频时是否同时生成声音可选值: `on`, `off` 不同模型版本、视频模式支持范围不同，详见能力地图
`cfg_scale`	float	否	0.5	生成视频的自由度；值越大，模型自由度越小，与用户输入的提示词相关性越强 - 取值范围：[0, 1] kling-v2.x 模型不支持当前参数
`mode`	string	否	std	生成视频的模式可选值: `std`, `pro`, `4k` - `std`：标准模式（标准），基础模式，性价比高，输出视频分辨率为720P。 - `pro`：专家模式（高品质），高表现模式，生成视频质量更佳，输出视频分辨率为1080P。 - `4k`：4K模式，高表现（同pro），生成视频质量更佳，输出视频分辨率为4K。不同模型版本、视频模式支持范围不同，详见能力地图
`static_mask`	string	否		静态笔刷涂抹区域（用户通过运动笔刷涂抹的 mask 图片） "运动笔刷"能力包含"动态笔刷 dynamic_masks"和"静态笔刷 static_mask"两种 - 支持传入图片 Base64 编码或图片 URL（确保可访问，格式要求同 image 字段） - 图片格式支持 `.jpg / .jpeg / .png` - 图片长宽比必须与输入图片相同（即 image 字段），否则任务失败（failed） - static_mask 和 dynamic_masks.mask 这两张图片的分辨率必须一致，否则任务失败（failed）不同模型版本、视频模式支持范围不同，详见能力地图
`dynamic_masks`	array	否		动态笔刷配置列表 - 可配置多组（最多 6 组），每组包含"涂抹区域 mask"与"运动轨迹 trajectories"序列不同模型版本、视频模式支持范围不同，详见能力地图
`mask`	string	是		动态笔刷涂抹区域（用户通过运动笔刷涂抹的 mask 图片） - 支持传入图片 Base64 编码或图片 URL（确保可访问，格式要求同 image 字段） - 图片格式支持 .jpg / .jpeg / .png - 图片长宽比必须与输入图片相同（即 image 字段），否则任务失败（failed） - static_mask 和 dynamic_masks.mask 这两张图片的分辨率必须一致，否则任务失败（failed）
`trajectories`	array	是		运动轨迹坐标序列 - 生成 5s 的视频，轨迹长度不超过 77，即坐标个数取值范围：[2, 77] - 轨迹坐标系，以图片左下角为坐标原点注1：坐标点个数越多轨迹刻画越准确，如只有 2 个轨迹点则为这两点连接的直线注2：轨迹方向以传入顺序为指向，以最先传入的坐标为轨迹起点，依次链接后续坐标形成运动轨迹
`x`	int	是		轨迹点横坐标（在像素二维坐标系下，以输入图片 image 左下为原点的像素坐标）
`y`	int	是		轨迹点纵坐标（在像素二维坐标系下，以输入图片 image 左下为原点的像素坐标）
`camera_control`	object	否		控制摄像机运动的协议（如未指定，模型将根据输入的文本/图片进行智能匹配）不同模型版本、视频模式支持范围不同，详见能力地图
`type`	string	是		预定义的运镜类型可选值: `simple`, `down_back`, `forward_up`, `right_turn_forward`, `left_turn_forward` - simple：简单运镜，此类型下可在"config"中六选一进行运镜 - down_back：镜头下压并后退 ➡️ 下移拉远，此类型下 config 参数无需填写 - forward_up：镜头前进并上仰 ➡️ 推进上移，此类型下 config 参数无需填写 - right_turn_forward：先右旋转后前进 ➡️ 右旋推进，此类型下 config 参数无需填写 - left_turn_forward：先左旋并前进 ➡️ 左旋推进，此类型下 config 参数无需填写
`config`	object	否		包含六个字段，用于指定摄像机在不同方向上的运动或变化 - 当运镜类型指定 simple 时必填，指定其他类型时不填 - 以下参数 6 选 1，即只能有一个参数不为 0，其余参数为 0
`horizontal`	float	否		水平运镜，控制摄像机在水平方向上的移动量（沿 x 轴平移） - 取值范围：[-10, 10]，负值表示向左平移，正值表示向右平移
`vertical`	float	否		垂直运镜，控制摄像机在垂直方向上的移动量（沿 y 轴平移） - 取值范围：[-10, 10]，负值表示向下平移，正值表示向上平移
`pan`	float	否		水平摇镜，控制摄像机在水平面上的旋转量（绕 y 轴旋转） - 取值范围：[-10, 10]，负值表示绕 y 轴向左旋转，正值表示绕 y 轴向右旋转
`tilt`	float	否		垂直摇镜，控制摄像机在垂直面上的旋转量（沿 x 轴旋转） - 取值范围：[-10, 10]，负值表示绕 x 轴向下旋转，正值表示绕 x 轴向上旋转
`roll`	float	否		旋转运镜，控制摄像机的滚动量（绕 z 轴旋转） - 取值范围：[-10, 10]，负值表示绕 z 轴逆时针旋转，正值表示绕 z 轴顺时针旋转
`zoom`	float	否		变焦，控制摄像机的焦距变化，影响视野的远近 - 取值范围：[-10, 10]，负值表示焦距变长、视野范围变小，正值表示焦距变短、视野范围变大
`duration`	string	否	5	生成视频时长，单位 s 可选值: `3`, `4`, `5`, `6`, `7`, `8`, `9`, `10`, `11`, `12`, `13`, `14`, `15` 不同模型版本、视频模式支持范围不同，详见能力地图
`watermark_info`	object	否		是否同时生成含水印的结果 - 通过enabled参数定义，具体格式如下： - true 为生成，false 为不生成 - 暂不支持自定义水印
`callback_url`	string	否		本次任务结果回调通知地址，如果配置，服务端会在任务状态发生变更时主动通知 - 具体通知的消息 schema 见 Callback 协议
`external_task_id`	string	否		自定义任务 ID - 用户自定义任务 ID，传入不会覆盖系统生成的任务 ID，但支持通过该 ID 进行任务查询 - 请注意，单用户下需要保证唯一性
参数格式说明

image

iVBORw0KGgoAAAANSUhEUgAAAAUA...

data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAAAUA...

element_list

"element_list":[
  { "element_id": long },
  { "element_id": long }
]

voice_list

"voice_list":[
  {"voice_id":"voice_id_1"},
  {"voice_id":"voice_id_2"}
]

watermark_info

"watermark_info": { "enabled": boolean }

请求示例

curl --location --request POST 'https://platform.shuyanai.com/kling/v1/videos/image2video' \
--header 'Authorization: Bearer <token>' \
--header 'Content-Type: application/json' \
--data-raw '{
    "model_name": "kling-v2-6",
    "image": "https://p2-kling.klingai.com/kcdn/cdn-kcdn112452/kling-qa-test/multi-2.png",
    "image_tail": "https://p2-kling.klingai.com/kcdn/cdn-kcdn112452/kling-qa-test/multi-1.png",
    "prompt": "镜头拉远，女生微笑",
    "negative_prompt": "",
    "duration": "5",
    "mode": "pro",
    "sound": "off",
    "callback_url": "",
    "external_task_id": ""
}'

响应示例

{
  "code": 0, // 错误码；具体定义见错误码
  "message": "string", // 错误信息
  "request_id": "string", // 请求ID，系统生成，用于跟踪请求、排查问题
  "data": {
    "task_id": "string", // 任务ID，系统生成
    "task_info": { // 任务创建时的参数信息
      "external_task_id": "string" // 客户自定义任务ID
    },
    "task_status": "string", // 任务状态，枚举值：submitted（已提交）、processing（处理中）、succeed（成功）、failed（失败）
    "created_at": 1722769557708, // 任务创建时间，Unix时间戳、单位ms
    "updated_at": 1722769557708 // 任务更新时间，Unix时间戳、单位ms
  }
}

查询任务（单个）

GET https://platform.shuyanai.com/kling/v1/videos/image2video/{id}

请求头

参数	类型	必填	默认值	说明
`Content-Type`	string	是	application/json	数据交换格式
`Authorization`	string	是		鉴权信息，参考接口鉴权

请求示例

curl --request GET \
  --url https://platform.shuyanai.com/kling/v1/videos/image2video/{task_id} \
  --header 'Authorization: Bearer <token>'

响应示例

{
  "code": 0, // 错误码；具体定义见错误码
  "message": "string", // 错误信息
  "request_id": "string", // 请求ID，系统生成，用于跟踪请求、排查问题
  "data": {
    "task_id": "string", // 任务ID，系统生成
    "task_status": "string", // 任务状态，枚举值：submitted（已提交）、processing（处理中）、succeed（成功）、failed（失败）
    "task_status_msg": "string", // 任务状态信息，当任务失败时展示失败原因（如触发平台的内容风控等）
    "watermark_info": {
      "enabled": boolean
    },
    "task_result": {
      "videos": [
        {
          "id": "string", // 生成的视频ID；全局唯一
          "url": "string", // 生成视频的URL（请注意，为保障信息安全，生成的图片/视频会在30天后被清理，请及时转存）
          "watermark_url": "string", // 含水印视频下载URL，防盗链格式
          "duration": "string" // 视频总时长，单位s
        }
      ]
    },
    "task_info": { // 任务创建时的参数信息
      "external_task_id": "string" // 客户自定义任务ID
    },
    "final_unit_deduction": "string", // 任务最终扣减积分数值
    "created_at": 1722769557708, // 任务创建时间，Unix时间戳、单位ms
    "updated_at": 1722769557708 // 任务更新时间，Unix时间戳、单位ms
  }
}

查询任务（列表）

GET https://platform.shuyanai.com/kling/v1/videos/image2video

请求头

参数	类型	必填	默认值	说明
`Content-Type`	string	是	application/json	数据交换格式
`Authorization`	string	是		鉴权信息，参考接口鉴权

请求示例

curl --request GET \
  --url 'https://platform.shuyanai.com/kling/v1/videos/image2video?pageNum=1&pageSize=30' \
  --header 'Authorization: Bearer <token>'

响应示例

{
  "code": 0, // 错误码；具体定义见错误码
  "message": "string", // 错误信息
  "request_id": "string", // 请求ID，系统生成，用于跟踪请求、排查问题
  "data": [
    {
      "task_id": "string", // 任务ID，系统生成
      "task_status": "string", // 任务状态，枚举值：submitted（已提交）、processing（处理中）、succeed（成功）、failed（失败）
      "task_status_msg": "string", // 任务状态信息，当任务失败时展示失败原因（如触发平台的内容风控等）
      "task_info": { // 任务创建时的参数信息
        "external_task_id": "string" // 客户自定义任务ID
      },
      "task_result": {
        "videos": [
          {
            "id": "string", // 生成的视频ID；全局唯一
            "url": "string", // 生成视频的URL（请注意，为保障信息安全，生成的图片/视频会在30天后被清理，请及时转存）
            "watermark_url": "string", // 含水印视频下载URL，防盗链格式
            "duration": "string" // 视频总时长，单位s
          }
        ]
      },
      "watermark_info": {
        "enabled": boolean
      },
      "final_unit_deduction": "string", // 任务最终扣减积分数值
      "created_at": 1722769557708, // 任务创建时间，Unix时间戳、单位ms
      "updated_at": 1722769557708 // 任务更新时间，Unix时间戳、单位ms
    }
  ]
}

02-图生视频

图生视频

创建任务

请求头

请求体

请求示例

响应示例

查询任务（单个）

请求头

请求示例

响应示例

查询任务（列表）

请求头

请求示例

响应示例