Video-Generierung

Überblick

LemonData bietet Video-Generierung über eine einheitliche API an. Die Generierung ist asynchron: Sie senden eine Anfrage, erhalten task_id und poll_url und pollen anschließend auf das Endergebnis.

Den aktuellen Bestand öffentlicher Videomodelle finden Sie über die Models API oder auf der Modellseite.

Wenn eine Create-Response poll_url zurückgibt, verwenden Sie genau diese URL. Wenn sie auf /v1/tasks/{id} zeigt, behandeln Sie sie als kanonischen festen Status-Endpunkt.

Das Audioverhalten ist modellabhängig. In LemonData wird die Veo-3-Familie bei weggelassenem output_audio standardmäßig als audio-on behandelt. Andere öffentliche Modelle sind standardmäßig stumm oder veröffentlichen keinen stabilen Audio-Schalter.

In Produktion sollten Sie für Bild-, Video- und Audioeingaben öffentlich erreichbare https-URLs bevorzugen. Kompatible Modelle akzeptieren weiterhin data:-URLs, aber URLs sind für Retry, Observability und Debugging in der Regel robuster.

Asynchroner Workflow

Aktuelle öffentliche Operationen

Der öffentliche Videovertrag von LemonData konzentriert sich derzeit auf diese Operationen:

text-to-video
image-to-video
reference-to-video
start-end-to-video
video-to-video
motion-control

Der Vertrag akzeptiert außerdem audio-to-video und video-extension für modellspezifische Flows, aber in der aktuell allgemein aktivierten öffentlichen Modellliste dieses Docs-Builds gibt es kein breit aktiviertes Modell, das diese Fähigkeiten öffentlich anbietet.

Fähigkeitsmatrix

Legende: ✅ In dieser Provider-Familie gibt es mindestens ein aktuell aktives öffentliches Modell mit dieser Fähigkeit | ❌ In den aktuell aktiven öffentlichen Modellen nicht öffentlich verfügbar

Series	T2V	I2V	Reference	Start-End	V2V	Motion
OpenAI	✅	✅	❌	❌	❌	❌
Kuaishou	✅	✅	✅	✅	✅	✅
Google	✅	✅	✅	✅	❌	❌
ByteDance	✅	✅	❌	❌	❌	❌
MiniMax	✅	✅	❌	❌	❌	❌
Alibaba	✅	✅	✅	❌	❌	❌
Shengshu	✅	✅	✅	✅	❌	❌
xAI	✅	✅	❌	❌	✅	❌
Other	❌	❌	❌	❌	✅	❌

Begriffserläuterung

T2V (Text-to-Video): Video aus einem Text-Prompt erzeugen
I2V (Image-to-Video): Video aus einem Startbild erzeugen; aus Kompatibilitätsgründen wird image_url empfohlen
Reference: Konditionierung über ein oder mehrere Referenzbilder via reference_images
Start-End: Ersten und letzten Frame mit start_image und end_image steuern
V2V (Video-to-Video): Ein bestehendes Video als Haupteingang verwenden
Motion: Motivbild und Bewegungsreferenzvideo gemeinsam verwenden

Aktueller öffentlicher Modellbestand

OpenAI

Model	Öffentliche Operationen
`sora-2`	Text-zu-Video, Bild-zu-Video
`sora-2-pro`	Text-zu-Video, Bild-zu-Video
`sora-2-pro-storyboard`	Bild-zu-Video

Kuaishou

Model	Öffentliche Operationen
`kling-3.0-motion-control`	Bewegungssteuerung
`kling-3.0-video`	Text-zu-Video, Bild-zu-Video, Start-Endbild-zu-Video
`kling-v2.5-turbo-pro`	Text-zu-Video, Bild-zu-Video, Start-Endbild-zu-Video
`kling-v2.5-turbo-std`	Text-zu-Video, Bild-zu-Video
`kling-v2.6-pro`	Text-zu-Video, Bild-zu-Video, Start-Endbild-zu-Video
`kling-v2.6-std`	Text-zu-Video, Bild-zu-Video
`kling-v3.0-pro`	Text-zu-Video, Bild-zu-Video, Start-Endbild-zu-Video
`kling-v3.0-std`	Text-zu-Video, Bild-zu-Video, Start-Endbild-zu-Video
`kling-video-o1-pro`	Text-zu-Video, Bild-zu-Video, Referenzbild-zu-Video, Start-Endbild-zu-Video, Video-zu-Video
`kling-video-o1-std`	Text-zu-Video, Bild-zu-Video, Referenzbild-zu-Video, Start-Endbild-zu-Video, Video-zu-Video

Google

Model	Öffentliche Operationen
`veo3`	Text-zu-Video, Bild-zu-Video
`veo3-fast`	Text-zu-Video, Bild-zu-Video
`veo3-pro`	Text-zu-Video, Bild-zu-Video
`veo3.1`	Text-zu-Video, Bild-zu-Video, Referenzbild-zu-Video, Start-Endbild-zu-Video
`veo3.1-fast`	Text-zu-Video, Bild-zu-Video, Referenzbild-zu-Video, Start-Endbild-zu-Video
`veo3.1-pro`	Text-zu-Video, Bild-zu-Video, Start-Endbild-zu-Video

ByteDance

Model	Öffentliche Operationen
`seedance-1.5-pro`	Text-zu-Video, Bild-zu-Video

MiniMax

Model	Öffentliche Operationen
`hailuo-2.3-fast`	Bild-zu-Video
`hailuo-2.3-pro`	Text-zu-Video, Bild-zu-Video
`hailuo-2.3-standard`	Text-zu-Video, Bild-zu-Video

Alibaba

Model	Öffentliche Operationen
`wan-2.2-plus`	Text-zu-Video, Bild-zu-Video
`wan-2.5`	Text-zu-Video, Bild-zu-Video
`wan-2.6`	Text-zu-Video, Bild-zu-Video, Referenzbild-zu-Video

Shengshu

Model	Öffentliche Operationen
`viduq2`	Text-zu-Video, Referenzbild-zu-Video
`viduq2-pro`	Bild-zu-Video, Referenzbild-zu-Video, Start-Endbild-zu-Video
`viduq2-pro-fast`	Bild-zu-Video, Start-Endbild-zu-Video
`viduq2-turbo`	Bild-zu-Video, Start-Endbild-zu-Video
`viduq3-pro`	Text-zu-Video, Bild-zu-Video, Start-Endbild-zu-Video
`viduq3-turbo`	Text-zu-Video, Bild-zu-Video, Start-Endbild-zu-Video

xAI

Model	Öffentliche Operationen
`grok-imagine-image-to-video`	Bild-zu-Video
`grok-imagine-text-to-video`	Text-zu-Video
`grok-imagine-upscale`	Video-zu-Video

Other

Model	Öffentliche Operationen
`topaz-video-upscale`	Video-zu-Video

Verwendungsbeispiele

Text-zu-Video

response = requests.post(f"{BASE}/videos/generations",
    headers=headers,
    json={
        "model": "sora-2",
        "prompt": "A calm cinematic shot of a cat walking through a sunlit garden.",
        "operation": "text-to-video",
        "duration": 4,
        "aspect_ratio": "16:9"
    }
)

Bild-zu-Video

response = requests.post(f"{BASE}/videos/generations",
    headers=headers,
    json={
        "model": "hailuo-2.3-standard",
        "prompt": "The scene begins from the provided image and adds gentle natural motion.",
        "operation": "image-to-video",
        "image_url": "https://example.com/portrait.jpg",
        "duration": 6,
        "aspect_ratio": "16:9"
    }
)

Referenzbild-zu-Video

response = requests.post(f"{BASE}/videos/generations",
    headers=headers,
    json={
        "model": "veo3.1",
        "prompt": "Keep the same subject identity and palette while adding subtle motion.",
        "operation": "reference-to-video",
        "reference_images": [
            "https://example.com/ref-a.jpg",
            "https://example.com/ref-b.jpg"
        ],
        "duration": 8,
        "resolution": "720p",
        "aspect_ratio": "9:16"
    }
)

Start- und Endframe-Steuerung

response = requests.post(f"{BASE}/videos/generations",
    headers=headers,
    json={
        "model": "viduq2-pro",
        "prompt": "Smooth transition from day to night.",
        "operation": "start-end-to-video",
        "start_image": "https://example.com/city-day.jpg",
        "end_image": "https://example.com/city-night.jpg",
        "duration": 5,
        "resolution": "720p",
        "aspect_ratio": "16:9"
    }
)

Video-zu-Video

response = requests.post(f"{BASE}/videos/generations",
    headers=headers,
    json={
        "model": "topaz-video-upscale",
        "operation": "video-to-video",
        "video_url": "https://example.com/source.mp4",
        "prompt": "Upscale this clip while preserving the original motion."
    }
)

Bewegungssteuerung

response = requests.post(f"{BASE}/videos/generations",
    headers=headers,
    json={
        "model": "kling-3.0-motion-control",
        "operation": "motion-control",
        "prompt": "Keep the subject stable while following the motion reference.",
        "image_url": "https://example.com/subject.png",
        "video_url": "https://example.com/motion.mp4",
        "resolution": "720p"
    }
)

Hinweise zu Parametern

Parameter	Typ	Hinweis
`operation`	string	In Produktion explizit angeben
`image_url`	string	Robusteste Form für Bildeingaben
`image`	string	`data:`-URL für lokale Tests und kleine Integrationen
`reference_images`	string[]	Kanonisches öffentliches Feld für Referenzbild-Konditionierung
`reference_image_type`	string	Optionaler `asset` / `style`-Schalter
`video_url`	string	Für aktuelle öffentliche `video-to-video`- und `motion-control`-Modelle erforderlich
`audio_url`	string	Für modellspezifische Audio-zu-Video-Flows
`output_audio`	boolean	Veo-3-Familie behandelt Auslassung als `true`

Hinweise zur Modellauswahl

Höchste Qualität

Wenn Qualität wichtiger ist als Geschwindigkeit, sind veo3.1-pro, kling-video-o1-pro und viduq3-pro starke Kandidaten.

Schnelle Iteration

Für schnelle Schleifen eignen sich veo3.1-fast, hailuo-2.3-fast und viduq3-turbo.

Referenzbild-Konditionierung

Für dedizierte Referenzbild-Steuerung sind veo3.1, veo3.1-fast, wan-2.6 sowie kling-video-o1-pro / std gute Startpunkte.

Video-zu-Video

Die allgemein aktivierten öffentlichen video-to-video-Pfade sind derzeit vor allem topaz-video-upscale, grok-imagine-upscale und kling-video-o1-pro / std.

Abrechnung

Die Abrechnung ist modellabhängig. Einige öffentliche Videomodelle verhalten sich effektiv wie requestbasierte Modelle, andere eher wie sekundenbasierte Modelle. Verlassen Sie sich für die aktuelle öffentliche Preisfläche auf die Modellseite oder die Pricing API.

Erste Schritte

Kernleitfäden

Coding Agents

Überblick

Asynchroner Workflow

Aktuelle öffentliche Operationen

Fähigkeitsmatrix

Begriffserläuterung

Aktueller öffentlicher Modellbestand

OpenAI

Kuaishou

Google

ByteDance

MiniMax

Alibaba

Shengshu

xAI

Other

Verwendungsbeispiele

Text-zu-Video

Bild-zu-Video

Referenzbild-zu-Video

Start- und Endframe-Steuerung

Video-zu-Video

Bewegungssteuerung

Hinweise zu Parametern

Hinweise zur Modellauswahl

Höchste Qualität

Schnelle Iteration

Referenzbild-Konditionierung

Video-zu-Video

Abrechnung

Erste Schritte

Kernleitfäden

Coding Agents

​Überblick

​Asynchroner Workflow

​Aktuelle öffentliche Operationen

​Fähigkeitsmatrix

​Begriffserläuterung

​Aktueller öffentlicher Modellbestand

​OpenAI

​Kuaishou

​Google

​ByteDance

​MiniMax

​Alibaba

​Shengshu

​xAI

​Other

​Verwendungsbeispiele

​Text-zu-Video

​Bild-zu-Video

​Referenzbild-zu-Video

​Start- und Endframe-Steuerung

​Video-zu-Video

​Bewegungssteuerung

​Hinweise zu Parametern

​Hinweise zur Modellauswahl

Höchste Qualität

Schnelle Iteration

Referenzbild-Konditionierung

Video-zu-Video

​Abrechnung

Überblick

Asynchroner Workflow

Aktuelle öffentliche Operationen

Fähigkeitsmatrix

Begriffserläuterung

Aktueller öffentlicher Modellbestand

OpenAI

Kuaishou

Google

ByteDance

MiniMax

Alibaba

Shengshu

xAI

Other

Verwendungsbeispiele

Text-zu-Video

Bild-zu-Video

Referenzbild-zu-Video

Start- und Endframe-Steuerung

Video-zu-Video

Bewegungssteuerung

Hinweise zu Parametern

Hinweise zur Modellauswahl

Abrechnung