Créer une vidéo

Vue d’ensemble

La génération vidéo est asynchrone. Une fois la requête envoyée, vous recevez un task_id et un poll_url, puis vous interrogez ce task jusqu’au résultat final.

Pour un polling fiable, utilisez exactement le poll_url renvoyé par la requête de création.

Si une réponse de création renvoie poll_url, appelez exactement cette URL. Lorsqu’elle pointe vers /v1/tasks/{id}, traitez-la comme l’endpoint fixe canonique de statut.

La sortie audio dépend du modèle. Dans LemonData, la famille Veo 3 active l’audio par défaut lorsque output_audio est omis. Si un modèle prend en charge ce contrôle, utilisez output_audio pour le piloter explicitement. L’alias camelCase outputAudio est également accepté pour compatibilité.

En production, privilégiez des URLs https publiques pour les images, vidéos et fichiers audio. Les modèles compatibles acceptent toujours les data: URLs, mais les gros payloads base64 compliquent les retries, l’observabilité et le débogage.

Corps de la requête

model

string

défaut:"sora-2"

ID du modèle vidéo. La valeur par défaut de l’API est sora-2. Pour voir la matrice actuelle des modèles publics et leurs capacités, consultez le guide de génération vidéo.

prompt

string

requis

Description textuelle de la vidéo à générer. Ce champ est requis pour la plupart des modèles publics.

operation

string

Opération vidéo à exécuter. Le contrat public accepte text-to-video, image-to-video, reference-to-video, start-end-to-video, video-to-video, video-extension, audio-to-video et motion-control. LemonData peut déduire l’opération à partir des entrées, mais une valeur explicite est recommandée en production.

image_url

string

URL de l’image de départ pour les flux image-vers-vidéo. Pour la compatibilité la plus large, privilégiez image_url.

image

string

Image inline au format data: (par exemple data:image/jpeg;base64,...). Les modèles compatibles la prennent en charge, mais image_url reste l’option la plus robuste.

reference_images

array

Images de référence pour les flux de référence-vers-vidéo. Jusqu’à 3 entrées sont acceptées. Les URLs https publiques sont recommandées, mais les data: URLs restent compatibles sur certains modèles.

reference_image_type

string

Champ facultatif pour les modèles qui distinguent les références asset et style.

video_url

string

URL publique de la vidéo source. Requise pour les flux publics video-to-video et pour les modèles motion-control.

audio_url

string

URL publique du fichier audio pour les modèles audio-to-video.

task_id

string

ID de tâche côté provider utilisé dans certains flux de continuation, d’extension ou de dérivation.

extend_at

integer

Offset de départ spécifique au modèle pour certains flux video-extension.

extend_times

string

Multiplicateur ou nombre de répétitions spécifique au modèle pour certains flux video-extension.

duration

integer

Durée de la vidéo en secondes. Les valeurs autorisées dépendent du modèle.

aspect_ratio

string

Ratio d’image, par exemple 16:9, 9:16 ou 1:1.

resolution

string

Résolution de sortie, par exemple 720p, 1080p ou 4k. La prise en charge dépend du modèle.

output_audio

boolean

Commutateur de sortie audio dépendant du modèle. Dans LemonData, la famille Veo 3 est traitée comme true par défaut quand ce champ est omis. L’alias camelCase outputAudio est aussi accepté.

fps

integer

Fréquence d’images (1–120). N’a d’effet que sur les modèles qui l’exposent publiquement.

negative_prompt

string

Éléments à éviter dans la génération.

seed

integer

Seed aléatoire pour obtenir des résultats reproductibles.

cfg_scale

number

Intensité de suivi du prompt (0–20), effective uniquement sur les modèles qui la prennent en charge.

motion_strength

number

Intensité du mouvement (0–1), effective uniquement sur les modèles compatibles.

start_image

string

URL de l’image de premier frame, ou entrée image compatible, pour start-end-to-video.

end_image

string

URL de l’image de dernier frame, ou entrée image compatible, pour start-end-to-video.

size

string

Tier de taille utilisé par certains modèles vidéo compatibles OpenAI.

watermark

boolean

Bascule de watermark exposée par certains modèles.

effect_type

string

Sélecteur d’effet spécifique au modèle pour certains flux d’édition ou d’effets.

user

string

Identifiant unique de l’utilisateur final.

Notes de compatibilité

Les champs publics canoniques utilisent le snake_case : reference_images, reference_image_type et output_audio.
Pour compatibilité, LemonData accepte aussi les alias camelCase referenceImages, referenceImageType et outputAudio.
Si operation est omis, LemonData la déduit à partir des entrées, mais une valeur explicite reste préférable en production.

Bonnes pratiques d’entrée

Pour image_url, reference_images, video_url et audio_url, privilégiez des URLs https publiques.
Évitez, si possible, de mélanger base64 inline et URLs distantes dans une même requête.
Si vous utilisez des URLs signées, assurez-vous qu’elles restent valides pendant la fenêtre de retry et de création asynchrone.

Réponse

string

Identifiant canonique de tâche asynchrone. Lorsque id et task_id sont tous les deux présents, considérez-les comme la même tâche.

task_id

string

Identifiant unique du task pour le polling.

poll_url

string

URL de polling recommandée pour ce task. Utilisez ce chemin tel quel lors des vérifications d’état.

status

string

Statut initial : pending.

created

integer

Timestamp Unix de création de la tâche.

model

string

Modèle utilisé.

curl -X POST "https://api.lemondata.cc/v1/videos/generations" \
  -H "Authorization: Bearer sk-your-api-key" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "sora-2",
    "prompt": "A cat walking through a garden, cinematic lighting",
    "operation": "text-to-video",
    "duration": 4,
    "aspect_ratio": "16:9"
  }'

{
  "id": "ldtask_aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa",
  "task_id": "ldtask_aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa",
  "poll_url": "/v1/tasks/ldtask_aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa",
  "status": "pending",
  "model": "sora-2",
  "created": 1706000000
}

Image vers vidéo

response = requests.post(
    "https://api.lemondata.cc/v1/videos/generations",
    headers={"Authorization": "Bearer sk-your-api-key"},
    json={
        "model": "hailuo-2.3-standard",
        "prompt": "The scene begins from the provided image and adds gentle natural motion.",
        "operation": "image-to-video",
        "image_url": "https://example.com/image.jpg",
        "duration": 6,
        "aspect_ratio": "16:9"
    }
)

Référence vers vidéo

Pour les modèles qui prennent en charge un conditionnement dédié par images de référence, utilisez operation=reference-to-video. Dans le contrat public LemonData, les références passent par reference_images.

response = requests.post(
    "https://api.lemondata.cc/v1/videos/generations",
    headers={"Authorization": "Bearer sk-your-api-key"},
    json={
        "model": "veo3.1",
        "prompt": "Keep the same subject identity and palette while adding subtle motion.",
        "operation": "reference-to-video",
        "reference_images": [
            "https://example.com/ref-a.jpg",
            "https://example.com/ref-b.jpg"
        ],
        "reference_image_type": "asset",
        "duration": 8,
        "resolution": "720p",
        "aspect_ratio": "9:16"
    }
)

Contrôle début / fin

Utilisez start_image et end_image pour contrôler la première et la dernière image.

response = requests.post(
    "https://api.lemondata.cc/v1/videos/generations",
    headers={"Authorization": "Bearer sk-your-api-key"},
    json={
        "model": "viduq2-pro",
        "prompt": "Smooth transition from day to night",
        "operation": "start-end-to-video",
        "start_image": "https://example.com/day.jpg",
        "end_image": "https://example.com/night.jpg",
        "duration": 5,
        "resolution": "720p",
        "aspect_ratio": "16:9"
    }
)

Vidéo vers vidéo

Si un modèle accepte une vidéo existante comme entrée principale, utilisez operation=video-to-video.

response = requests.post(
    "https://api.lemondata.cc/v1/videos/generations",
    headers={"Authorization": "Bearer sk-your-api-key"},
    json={
        "model": "topaz-video-upscale",
        "operation": "video-to-video",
        "video_url": "https://example.com/source.mp4",
        "prompt": "Upscale the clip while preserving the original motion.",
        "resolution": "1080p"
    }
)

Contrôle de mouvement

Quand un modèle exige à la fois une image de sujet et une vidéo de mouvement de référence, utilisez operation=motion-control. LemonData normalise la forme publique image_url + video_url vers le contrat amont.

response = requests.post(
    "https://api.lemondata.cc/v1/videos/generations",
    headers={"Authorization": "Bearer sk-your-api-key"},
    json={
        "model": "kling-3.0-motion-control",
        "operation": "motion-control",
        "prompt": "Keep the subject stable while following the motion reference.",
        "image_url": "https://example.com/subject.png",
        "video_url": "https://example.com/motion.mp4",
        "resolution": "720p"
    }
)

Disponibilité actuelle de Audio-to-Video et Video Extension

Le contrat public LemonData accepte audio-to-video et video-extension pour des flux spécifiques à certains modèles. Cependant, dans la liste actuelle des modèles publics généralement activés pour cette documentation, aucun modèle public largement activé n’expose clairement ces capacités. Vérifiez donc l’état réel via la Models API ou la page des modèles.

Inventaire public actuel des modèles

Cette liste est alignée sur l’inventaire actuel des modèles vidéo publics activés dans cette build de documentation. Pour l’état le plus récent, interrogez la Models API.

OpenAI

Model	Opérations publiques
`sora-2`	Texte vers vidéo, Image vers vidéo
`sora-2-pro`	Texte vers vidéo, Image vers vidéo
`sora-2-pro-storyboard`	Image vers vidéo

Kuaishou

Model	Opérations publiques
`kling-3.0-motion-control`	Contrôle du mouvement
`kling-3.0-video`	Texte vers vidéo, Image vers vidéo, Début-fin vers vidéo
`kling-v2.5-turbo-pro`	Texte vers vidéo, Image vers vidéo, Début-fin vers vidéo
`kling-v2.5-turbo-std`	Texte vers vidéo, Image vers vidéo
`kling-v2.6-pro`	Texte vers vidéo, Image vers vidéo, Début-fin vers vidéo
`kling-v2.6-std`	Texte vers vidéo, Image vers vidéo
`kling-v3.0-pro`	Texte vers vidéo, Image vers vidéo, Début-fin vers vidéo
`kling-v3.0-std`	Texte vers vidéo, Image vers vidéo, Début-fin vers vidéo
`kling-video-o1-pro`	Texte vers vidéo, Image vers vidéo, Référence vers vidéo, Début-fin vers vidéo, Vidéo vers vidéo
`kling-video-o1-std`	Texte vers vidéo, Image vers vidéo, Référence vers vidéo, Début-fin vers vidéo, Vidéo vers vidéo

Google

Model	Opérations publiques
`veo3`	Texte vers vidéo, Image vers vidéo
`veo3-fast`	Texte vers vidéo, Image vers vidéo
`veo3-pro`	Texte vers vidéo, Image vers vidéo
`veo3.1`	Texte vers vidéo, Image vers vidéo, Référence vers vidéo, Début-fin vers vidéo
`veo3.1-fast`	Texte vers vidéo, Image vers vidéo, Référence vers vidéo, Début-fin vers vidéo
`veo3.1-pro`	Texte vers vidéo, Image vers vidéo, Début-fin vers vidéo

ByteDance

Model	Opérations publiques
`seedance-1.5-pro`	Texte vers vidéo, Image vers vidéo

MiniMax

Model	Opérations publiques
`hailuo-2.3-fast`	Image vers vidéo
`hailuo-2.3-pro`	Texte vers vidéo, Image vers vidéo
`hailuo-2.3-standard`	Texte vers vidéo, Image vers vidéo

Alibaba

Model	Opérations publiques
`wan-2.2-plus`	Texte vers vidéo, Image vers vidéo
`wan-2.5`	Texte vers vidéo, Image vers vidéo
`wan-2.6`	Texte vers vidéo, Image vers vidéo, Référence vers vidéo

Shengshu

Model	Opérations publiques
`viduq2`	Texte vers vidéo, Référence vers vidéo
`viduq2-pro`	Image vers vidéo, Référence vers vidéo, Début-fin vers vidéo
`viduq2-pro-fast`	Image vers vidéo, Début-fin vers vidéo
`viduq2-turbo`	Image vers vidéo, Début-fin vers vidéo
`viduq3-pro`	Texte vers vidéo, Image vers vidéo, Début-fin vers vidéo
`viduq3-turbo`	Texte vers vidéo, Image vers vidéo, Début-fin vers vidéo

xAI

Model	Opérations publiques
`grok-imagine-image-to-video`	Image vers vidéo
`grok-imagine-text-to-video`	Texte vers vidéo
`grok-imagine-upscale`	Vidéo vers vidéo

Other

Model	Opérations publiques
`topaz-video-upscale`	Vidéo vers vidéo

Essentiel

Texte

Fichiers & lots

Images & médias

Tâches asynchrones

Gemini natif

Gestion

Vue d’ensemble

Corps de la requête

Notes de compatibilité

Bonnes pratiques d’entrée

Réponse

Image vers vidéo

Référence vers vidéo

Contrôle début / fin

Vidéo vers vidéo

Contrôle de mouvement

Disponibilité actuelle de Audio-to-Video et Video Extension

Inventaire public actuel des modèles

OpenAI

Kuaishou

Google

ByteDance

MiniMax

Alibaba

Shengshu

xAI

Other

Essentiel

Texte

Fichiers & lots

Images & médias

Tâches asynchrones

Gemini natif

Gestion

​Vue d’ensemble

​Corps de la requête

​Notes de compatibilité

​Bonnes pratiques d’entrée

​Réponse

​Image vers vidéo

​Référence vers vidéo

​Contrôle début / fin

​Vidéo vers vidéo

​Contrôle de mouvement

​Disponibilité actuelle de Audio-to-Video et Video Extension

​Inventaire public actuel des modèles

​OpenAI

​Kuaishou

​Google

​ByteDance

​MiniMax

​Alibaba

​Shengshu

​xAI

​Other

Vue d’ensemble

Corps de la requête

Notes de compatibilité

Bonnes pratiques d’entrée

Réponse

Image vers vidéo

Référence vers vidéo

Contrôle début / fin

Vidéo vers vidéo

Contrôle de mouvement

Disponibilité actuelle de Audio-to-Video et Video Extension

Inventaire public actuel des modèles

OpenAI

Kuaishou

Google

ByteDance

MiniMax

Alibaba

Shengshu

xAI

Other