Vue d’ensemble
La génération vidéo est asynchrone. Une fois la requête envoyée, vous recevez untask_id et un poll_url, puis vous interrogez ce task jusqu’au résultat final.
Pour un polling fiable, utilisez exactement le
poll_url renvoyé par la requête de création.Si une réponse de création renvoie
poll_url, appelez exactement cette URL. Lorsqu’elle pointe vers /v1/tasks/{id}, traitez-la comme l’endpoint fixe canonique de statut.En production, privilégiez des URLs
https publiques pour les images, vidéos et fichiers audio. Les modèles compatibles acceptent toujours les data: URLs, mais les gros payloads base64 compliquent les retries, l’observabilité et le débogage.Corps de la requête
ID du modèle vidéo. La valeur par défaut de l’API est
sora-2. Pour voir la matrice actuelle des modèles publics et leurs capacités, consultez le guide de génération vidéo.Description textuelle de la vidéo à générer. Ce champ est requis pour la plupart des modèles publics.
Opération vidéo à exécuter. Le contrat public accepte
text-to-video, image-to-video, reference-to-video, start-end-to-video, video-to-video, video-extension, audio-to-video et motion-control. LemonData peut déduire l’opération à partir des entrées, mais une valeur explicite est recommandée en production.URL de l’image de départ pour les flux image-vers-vidéo. Pour la compatibilité la plus large, privilégiez
image_url.Image inline au format
data: (par exemple data:image/jpeg;base64,...). Les modèles compatibles la prennent en charge, mais image_url reste l’option la plus robuste.Images de référence pour les flux de référence-vers-vidéo. Jusqu’à 3 entrées sont acceptées. Les URLs
https publiques sont recommandées, mais les data: URLs restent compatibles sur certains modèles.Champ facultatif pour les modèles qui distinguent les références
asset et style.URL publique de la vidéo source. Requise pour les flux publics
video-to-video et pour les modèles motion-control.URL publique du fichier audio pour les modèles
audio-to-video.ID de tâche côté provider utilisé dans certains flux de continuation, d’extension ou de dérivation.
Offset de départ spécifique au modèle pour certains flux
video-extension.Multiplicateur ou nombre de répétitions spécifique au modèle pour certains flux
video-extension.Durée de la vidéo en secondes. Les valeurs autorisées dépendent du modèle.
Ratio d’image, par exemple
16:9, 9:16 ou 1:1.Résolution de sortie, par exemple
720p, 1080p ou 4k. La prise en charge dépend du modèle.Commutateur de sortie audio dépendant du modèle. Dans LemonData, la famille Veo 3 est traitée comme
true par défaut quand ce champ est omis. L’alias camelCase outputAudio est aussi accepté.Fréquence d’images (1–120). N’a d’effet que sur les modèles qui l’exposent publiquement.
Éléments à éviter dans la génération.
Seed aléatoire pour obtenir des résultats reproductibles.
Intensité de suivi du prompt (0–20), effective uniquement sur les modèles qui la prennent en charge.
Intensité du mouvement (0–1), effective uniquement sur les modèles compatibles.
URL de l’image de premier frame, ou entrée image compatible, pour
start-end-to-video.URL de l’image de dernier frame, ou entrée image compatible, pour
start-end-to-video.Tier de taille utilisé par certains modèles vidéo compatibles OpenAI.
Bascule de watermark exposée par certains modèles.
Sélecteur d’effet spécifique au modèle pour certains flux d’édition ou d’effets.
Identifiant unique de l’utilisateur final.
Notes de compatibilité
- Les champs publics canoniques utilisent le snake_case :
reference_images,reference_image_typeetoutput_audio. - Pour compatibilité, LemonData accepte aussi les alias camelCase
referenceImages,referenceImageTypeetoutputAudio. - Si
operationest omis, LemonData la déduit à partir des entrées, mais une valeur explicite reste préférable en production.
Bonnes pratiques d’entrée
- Pour
image_url,reference_images,video_urletaudio_url, privilégiez des URLshttpspubliques. - Évitez, si possible, de mélanger base64 inline et URLs distantes dans une même requête.
- Si vous utilisez des URLs signées, assurez-vous qu’elles restent valides pendant la fenêtre de retry et de création asynchrone.
Réponse
Identifiant canonique de tâche asynchrone. Lorsque
id et task_id sont tous les deux présents, considérez-les comme la même tâche.Identifiant unique du task pour le polling.
URL de polling recommandée pour ce task. Utilisez ce chemin tel quel lors des vérifications d’état.
Statut initial :
pending.Timestamp Unix de création de la tâche.
Modèle utilisé.
Image vers vidéo
Référence vers vidéo
Pour les modèles qui prennent en charge un conditionnement dédié par images de référence, utilisezoperation=reference-to-video. Dans le contrat public LemonData, les références passent par reference_images.
Contrôle début / fin
Utilisezstart_image et end_image pour contrôler la première et la dernière image.
Vidéo vers vidéo
Si un modèle accepte une vidéo existante comme entrée principale, utilisezoperation=video-to-video.
Contrôle de mouvement
Quand un modèle exige à la fois une image de sujet et une vidéo de mouvement de référence, utilisezoperation=motion-control. LemonData normalise la forme publique image_url + video_url vers le contrat amont.
Disponibilité actuelle de Audio-to-Video et Video Extension
Le contrat public LemonData accepteaudio-to-video et video-extension pour des flux spécifiques à certains modèles. Cependant, dans la liste actuelle des modèles publics généralement activés pour cette documentation, aucun modèle public largement activé n’expose clairement ces capacités. Vérifiez donc l’état réel via la Models API ou la page des modèles.
Inventaire public actuel des modèles
Cette liste est alignée sur l’inventaire actuel des modèles vidéo publics activés dans cette build de documentation. Pour l’état le plus récent, interrogez la Models API.
OpenAI
| Model | Opérations publiques |
|---|---|
sora-2 | Texte vers vidéo, Image vers vidéo |
sora-2-pro | Texte vers vidéo, Image vers vidéo |
sora-2-pro-storyboard | Image vers vidéo |
Kuaishou
| Model | Opérations publiques |
|---|---|
kling-3.0-motion-control | Contrôle du mouvement |
kling-3.0-video | Texte vers vidéo, Image vers vidéo, Début-fin vers vidéo |
kling-v2.5-turbo-pro | Texte vers vidéo, Image vers vidéo, Début-fin vers vidéo |
kling-v2.5-turbo-std | Texte vers vidéo, Image vers vidéo |
kling-v2.6-pro | Texte vers vidéo, Image vers vidéo, Début-fin vers vidéo |
kling-v2.6-std | Texte vers vidéo, Image vers vidéo |
kling-v3.0-pro | Texte vers vidéo, Image vers vidéo, Début-fin vers vidéo |
kling-v3.0-std | Texte vers vidéo, Image vers vidéo, Début-fin vers vidéo |
kling-video-o1-pro | Texte vers vidéo, Image vers vidéo, Référence vers vidéo, Début-fin vers vidéo, Vidéo vers vidéo |
kling-video-o1-std | Texte vers vidéo, Image vers vidéo, Référence vers vidéo, Début-fin vers vidéo, Vidéo vers vidéo |
| Model | Opérations publiques |
|---|---|
veo3 | Texte vers vidéo, Image vers vidéo |
veo3-fast | Texte vers vidéo, Image vers vidéo |
veo3-pro | Texte vers vidéo, Image vers vidéo |
veo3.1 | Texte vers vidéo, Image vers vidéo, Référence vers vidéo, Début-fin vers vidéo |
veo3.1-fast | Texte vers vidéo, Image vers vidéo, Référence vers vidéo, Début-fin vers vidéo |
veo3.1-pro | Texte vers vidéo, Image vers vidéo, Début-fin vers vidéo |
ByteDance
| Model | Opérations publiques |
|---|---|
seedance-1.5-pro | Texte vers vidéo, Image vers vidéo |
MiniMax
| Model | Opérations publiques |
|---|---|
hailuo-2.3-fast | Image vers vidéo |
hailuo-2.3-pro | Texte vers vidéo, Image vers vidéo |
hailuo-2.3-standard | Texte vers vidéo, Image vers vidéo |
Alibaba
| Model | Opérations publiques |
|---|---|
wan-2.2-plus | Texte vers vidéo, Image vers vidéo |
wan-2.5 | Texte vers vidéo, Image vers vidéo |
wan-2.6 | Texte vers vidéo, Image vers vidéo, Référence vers vidéo |
Shengshu
| Model | Opérations publiques |
|---|---|
viduq2 | Texte vers vidéo, Référence vers vidéo |
viduq2-pro | Image vers vidéo, Référence vers vidéo, Début-fin vers vidéo |
viduq2-pro-fast | Image vers vidéo, Début-fin vers vidéo |
viduq2-turbo | Image vers vidéo, Début-fin vers vidéo |
viduq3-pro | Texte vers vidéo, Image vers vidéo, Début-fin vers vidéo |
viduq3-turbo | Texte vers vidéo, Image vers vidéo, Début-fin vers vidéo |
xAI
| Model | Opérations publiques |
|---|---|
grok-imagine-image-to-video | Image vers vidéo |
grok-imagine-text-to-video | Texte vers vidéo |
grok-imagine-upscale | Vidéo vers vidéo |
Other
| Model | Opérations publiques |
|---|---|
topaz-video-upscale | Vidéo vers vidéo |