概要
動画生成は非同期です。リクエストを送信すると、task_id と poll_url が返り、その後はポーリングで最終結果を取得します。
最も安定したポーリングのため、作成レスポンスで返された
poll_url をそのまま使用してください。作成レスポンスで
poll_url が返る場合は、その URL をそのまま使ってください。/v1/tasks/{id} を指す場合は、それを固定の正規ステータスエンドポイントとして扱ってください。本番環境では、画像・動画・音声入力には公開アクセス可能な
https URL を優先してください。互換モデルでは data: URL も利用できますが、大きな base64 は retry・観測・デバッグを難しくします。リクエストボディ
生成したい動画のテキスト説明です。大半の公開動画モデルで必須です。
実行する動画操作です。公開契約では
text-to-video、image-to-video、reference-to-video、start-end-to-video、video-to-video、video-extension、audio-to-video、motion-control を受け付けます。入力から自動推定もできますが、本番では明示指定を推奨します。画像から動画生成に使う開始画像 URL です。最も広い互換性を得るには
image_url を優先してください。data:image/...;base64,... 形式のインライン画像です。互換モデルでは利用できますが、image_url の方が一般に扱いやすく安定します。参照画像から動画生成で使う参考画像です。最大 3 件まで渡せます。公開
https URL を推奨しますが、互換モデルでは data: URL も利用できます。asset と style を区別するモデル向けの任意フィールドです。元動画の公開 URL です。現在の公開
video-to-video フローおよび motion-control モデルで必要です。audio-to-video 系モデルで使う公開音声 URL です。一部の継続・延長・派生フローで使う プロバイダー 側の task ID です。
一部の
video-extension フローで使うモデル固有の延長開始オフセットです。一部の
video-extension フローで使うモデル固有の延長回数・倍率です。動画の長さ(秒)です。利用可能な値はモデルごとに異なります。
アスペクト比です。例:
16:9、9:16、1:1。出力解像度です。例:
720p、1080p、4k。対応可否はモデル依存です。モデル依存の音声出力トグルです。LemonData では Veo 3 系列は省略時に
true として扱われます。camelCase の別名 outputAudio も受け付けます。フレームレート(1〜120)。FPS を公開しているモデルのみ有効です。
生成で避けたい内容です。
再現性のための乱数 seed です。
プロンプト追従強度(0〜20)。対応モデルのみ有効です。
動きの強さ(0〜1)。対応モデルのみ有効です。
start-end-to-video で使う開始フレーム画像 URL または互換画像入力です。start-end-to-video で使う終了フレーム画像 URL または互換画像入力です。一部の OpenAI 互換動画モデルで使うサイズティアです。
一部モデルが公開しているウォーターマーク切り替えです。
一部の編集・エフェクト系フローで使うモデル固有のエフェクト指定です。
エンドユーザーを識別する一意な ID です。
互換メモ
- 正式な公開フィールドは snake_case の
reference_images、reference_image_type、output_audioです。 - 互換性のため
referenceImages、referenceImageType、outputAudioも受け付けます。 operationを省略した場合、LemonData は入力内容から自動推定しますが、本番では明示指定を推奨します。
入力のベストプラクティス
image_url、reference_images、video_url、audio_urlには、公開アクセス可能なhttpsURL を優先してください。- 同一リクエスト内で base64 とリモート URL を混在させるのは避ける方が安全です。
- 署名付き URL を使う場合は、再試行や非同期タスク生成をカバーできる有効期限を確保してください。
レスポンス
正規の非同期タスク ID です。
id と task_id の両方がある場合は、同じタスク識別子として扱ってください。ポーリング用の一意なタスク ID です。
このタスクに推奨されるポーリング URL です。状態確認にはこのパスをそのまま使ってください。
初期ステータスは
pending です。タスク作成時の Unix タイムスタンプです。
使用されたモデルです。
画像から動画
参照画像から動画
参照画像による条件制御を持つモデルではoperation=reference-to-video を使用します。LemonData の公開契約では、参考画像は reference_images で渡します。
開始・終了フレーム制御
start_image と end_image を使って最初と最後のフレームを制御します。
動画から動画
既存の動画を主入力として使う場合はoperation=video-to-video を使用します。
モーション制御
主体画像とモーション参照動画の両方を必要とするモデルではoperation=motion-control を使用します。LemonData は公開リクエスト形の image_url と video_url を上流契約へ正規化します。
Audio-to-Video / Video Extension の公開可用性
LemonData の公開契約はaudio-to-video と video-extension を受け付けますが、このドキュメント時点の「一般公開かつ有効」モデル一覧には、これらを広く提供する公開モデルは含まれていません。統合前に Models API か モデルページ で最新可用性を確認してください。
現在の公開モデル一覧
この一覧は、このドキュメントビルド時点で有効な公開動画モデルの在庫と揃えています。最新状態は Models API を参照してください。
OpenAI
| Model | 公開オペレーション |
|---|---|
sora-2 | テキストから動画、画像から動画 |
sora-2-pro | テキストから動画、画像から動画 |
sora-2-pro-storyboard | 画像から動画 |
Kuaishou
| Model | 公開オペレーション |
|---|---|
kling-3.0-motion-control | モーション制御 |
kling-3.0-video | テキストから動画、画像から動画、開始・終了フレームから動画 |
kling-v2.5-turbo-pro | テキストから動画、画像から動画、開始・終了フレームから動画 |
kling-v2.5-turbo-std | テキストから動画、画像から動画 |
kling-v2.6-pro | テキストから動画、画像から動画、開始・終了フレームから動画 |
kling-v2.6-std | テキストから動画、画像から動画 |
kling-v3.0-pro | テキストから動画、画像から動画、開始・終了フレームから動画 |
kling-v3.0-std | テキストから動画、画像から動画、開始・終了フレームから動画 |
kling-video-o1-pro | テキストから動画、画像から動画、参考画像から動画、開始・終了フレームから動画、動画から動画 |
kling-video-o1-std | テキストから動画、画像から動画、参考画像から動画、開始・終了フレームから動画、動画から動画 |
| Model | 公開オペレーション |
|---|---|
veo3 | テキストから動画、画像から動画 |
veo3-fast | テキストから動画、画像から動画 |
veo3-pro | テキストから動画、画像から動画 |
veo3.1 | テキストから動画、画像から動画、参考画像から動画、開始・終了フレームから動画 |
veo3.1-fast | テキストから動画、画像から動画、参考画像から動画、開始・終了フレームから動画 |
veo3.1-pro | テキストから動画、画像から動画、開始・終了フレームから動画 |
ByteDance
| Model | 公開オペレーション |
|---|---|
seedance-1.5-pro | テキストから動画、画像から動画 |
MiniMax
| Model | 公開オペレーション |
|---|---|
hailuo-2.3-fast | 画像から動画 |
hailuo-2.3-pro | テキストから動画、画像から動画 |
hailuo-2.3-standard | テキストから動画、画像から動画 |
Alibaba
| Model | 公開オペレーション |
|---|---|
wan-2.2-plus | テキストから動画、画像から動画 |
wan-2.5 | テキストから動画、画像から動画 |
wan-2.6 | テキストから動画、画像から動画、参考画像から動画 |
Shengshu
| Model | 公開オペレーション |
|---|---|
viduq2 | テキストから動画、参考画像から動画 |
viduq2-pro | 画像から動画、参考画像から動画、開始・終了フレームから動画 |
viduq2-pro-fast | 画像から動画、開始・終了フレームから動画 |
viduq2-turbo | 画像から動画、開始・終了フレームから動画 |
viduq3-pro | テキストから動画、画像から動画、開始・終了フレームから動画 |
viduq3-turbo | テキストから動画、画像から動画、開始・終了フレームから動画 |
xAI
| Model | 公開オペレーション |
|---|---|
grok-imagine-image-to-video | 画像から動画 |
grok-imagine-text-to-video | テキストから動画 |
grok-imagine-upscale | 動画から動画 |
Other
| Model | 公開オペレーション |
|---|---|
topaz-video-upscale | 動画から動画 |