Langsung ke konten utama

Ringkasan

LemonData menyediakan generasi video melalui satu API terpadu. Prosesnya asinkron: Anda mengirim permintaan, menerima task_id dan poll_url, lalu memeriksa status secara berkala sampai hasil akhir tersedia.
Inventaris model video publik terbaru dapat dilihat melalui Models API atau halaman model.
Jika respons create mengembalikan poll_url, panggil URL tersebut secara persis. Saat URL itu mengarah ke /v1/tasks/{id}, perlakukan itu sebagai endpoint status tetap yang kanonik.
Perilaku audio bergantung pada model. Di LemonData, keluarga Veo 3 diperlakukan sebagai audio aktif secara default ketika output_audio dihilangkan. Model publik lainnya bisa saja diam secara default atau tidak mengekspos sakelar audio yang stabil.
Untuk integrasi produksi, lebih baik gunakan URL https publik untuk gambar, video, dan audio. Model yang kompatibel masih menerima URL data:, tetapi URL publik biasanya lebih andal untuk coba ulang, observabilitas, dan debugging.

Alur asinkron

Operasi publik saat ini

Saat ini kontrak video publik LemonData berpusat pada operasi berikut:
  • text-to-video
  • image-to-video
  • reference-to-video
  • start-end-to-video
  • video-to-video
  • motion-control
Kontrak juga menerima audio-to-video dan video-extension untuk alur spesifik model tertentu, tetapi pada build dokumentasi ini belum ada model publik yang secara luas diaktifkan dan mempromosikan dua kemampuan itu.

Matriks kemampuan

Legenda: ✅ Ada setidaknya satu model publik yang saat ini aktif di keluarga penyedia tersebut | ❌ Belum ada model publik aktif yang mewakili kemampuan itu
SeriT2VI2VReferensiStart-EndV2VMotion
OpenAI
Kuaishou
Google
ByteDance
MiniMax
Alibaba
Shengshu
xAI
Lainnya

Definisi kemampuan

  • T2V (Text-to-Video): menghasilkan video dari prompt teks
  • I2V (Image-to-Video): menghasilkan video dari gambar awal; untuk kompatibilitas terluas, gunakan image_url
  • Referensi: mengondisikan generasi dengan satu atau beberapa gambar referensi melalui reference_images
  • Start-End: mengontrol frame pertama dan terakhir dengan start_image dan end_image
  • V2V (Video-to-Video): menggunakan video yang sudah ada sebagai input utama
  • Motion: menggabungkan gambar subjek dengan video referensi gerakan

Inventaris model publik saat ini

OpenAI

ModelOperasi publik
sora-2Teks ke video, image-to-video
sora-2-proTeks ke video, image-to-video
sora-2-pro-storyboardImage-to-video

Kuaishou

ModelOperasi publik
kling-3.0-motion-controlMotion control
kling-3.0-videoTeks ke video, image-to-video, start-end-to-video
kling-v2.5-turbo-proTeks ke video, image-to-video, start-end-to-video
kling-v2.5-turbo-stdTeks ke video, image-to-video
kling-v2.6-proTeks ke video, image-to-video, start-end-to-video
kling-v2.6-stdTeks ke video, image-to-video
kling-v3.0-proTeks ke video, image-to-video, start-end-to-video
kling-v3.0-stdTeks ke video, image-to-video, start-end-to-video
kling-video-o1-proTeks ke video, image-to-video, reference-to-video, start-end-to-video, video-to-video
kling-video-o1-stdTeks ke video, image-to-video, reference-to-video, start-end-to-video, video-to-video

Google

ModelOperasi publik
veo3Teks ke video, image-to-video
veo3-fastTeks ke video, image-to-video
veo3-proTeks ke video, image-to-video
veo3.1Teks ke video, image-to-video, reference-to-video, start-end-to-video
veo3.1-fastTeks ke video, image-to-video, reference-to-video, start-end-to-video
veo3.1-proTeks ke video, image-to-video, start-end-to-video

ByteDance

ModelOperasi publik
seedance-1.5-proTeks ke video, image-to-video

MiniMax

ModelOperasi publik
hailuo-2.3-fastImage-to-video
hailuo-2.3-proTeks ke video, image-to-video
hailuo-2.3-standardTeks ke video, image-to-video

Alibaba

ModelOperasi publik
wan-2.2-plusTeks ke video, image-to-video
wan-2.5Teks ke video, image-to-video
wan-2.6Teks ke video, image-to-video, reference-to-video

Shengshu

ModelOperasi publik
viduq2Teks ke video, reference-to-video
viduq2-proImage-to-video, reference-to-video, start-end-to-video
viduq2-pro-fastImage-to-video, start-end-to-video
viduq2-turboImage-to-video, start-end-to-video
viduq3-proTeks ke video, image-to-video, start-end-to-video
viduq3-turboTeks ke video, image-to-video, start-end-to-video

xAI

ModelOperasi publik
grok-imagine-image-to-videoImage-to-video
grok-imagine-text-to-videoTeks ke video
grok-imagine-upscaleVideo-to-video

Lainnya

ModelOperasi publik
topaz-video-upscaleVideo-to-video

Contoh penggunaan

Text-to-video

response = requests.post(f"{BASE}/videos/generations",
    headers=headers,
    json={
        "model": "sora-2",
        "prompt": "A calm cinematic shot of a cat walking through a sunlit garden.",
        "operation": "text-to-video",
        "duration": 4,
        "aspect_ratio": "16:9"
    }
)

Image-to-video

response = requests.post(f"{BASE}/videos/generations",
    headers=headers,
    json={
        "model": "hailuo-2.3-standard",
        "prompt": "The scene begins from the provided image and adds gentle natural motion.",
        "operation": "image-to-video",
        "image_url": "https://example.com/portrait.jpg",
        "duration": 6,
        "aspect_ratio": "16:9"
    }
)

Reference-to-video

response = requests.post(f"{BASE}/videos/generations",
    headers=headers,
    json={
        "model": "veo3.1",
        "prompt": "Keep the same subject identity and palette while adding subtle motion.",
        "operation": "reference-to-video",
        "reference_images": [
            "https://example.com/ref-a.jpg",
            "https://example.com/ref-b.jpg"
        ],
        "duration": 8,
        "resolution": "720p",
        "aspect_ratio": "9:16"
    }
)

Start-end-to-video

response = requests.post(f"{BASE}/videos/generations",
    headers=headers,
    json={
        "model": "viduq2-pro",
        "prompt": "Smooth transition from day to night.",
        "operation": "start-end-to-video",
        "start_image": "https://example.com/city-day.jpg",
        "end_image": "https://example.com/city-night.jpg",
        "duration": 5,
        "resolution": "720p",
        "aspect_ratio": "16:9"
    }
)

Video-to-video

response = requests.post(f"{BASE}/videos/generations",
    headers=headers,
    json={
        "model": "topaz-video-upscale",
        "operation": "video-to-video",
        "video_url": "https://example.com/source.mp4",
        "prompt": "Upscale this clip while preserving the original motion."
    }
)

Motion control

response = requests.post(f"{BASE}/videos/generations",
    headers=headers,
    json={
        "model": "kling-3.0-motion-control",
        "operation": "motion-control",
        "prompt": "Keep the subject stable while following the motion reference.",
        "image_url": "https://example.com/subject.png",
        "video_url": "https://example.com/motion.mp4",
        "resolution": "720p"
    }
)

Referensi parameter

ParameterTipeCatatan
operationstringDi produksi, sebaiknya dikirim eksplisit
image_urlstringBentuk input gambar yang paling stabil
imagestringURL data: untuk pengujian lokal dan integrasi kecil
reference_imagesstring[]Field publik kanonis untuk conditioning berbasis referensi
reference_image_typestringPemilih opsional asset / style
video_urlstringWajib untuk model publik video-to-video dan motion-control saat ini
audio_urlstringDipakai oleh alur audio-conditioned tertentu jika tersedia
output_audiobooleanKeluarga Veo 3 memperlakukan field yang dihilangkan sebagai true

Panduan cepat memilih model

Kualitas tertinggi

Jika kualitas lebih penting daripada kecepatan, veo3.1-pro, kling-video-o1-pro, dan viduq3-pro adalah pilihan yang kuat.

Iterasi cepat

Untuk iterasi cepat, veo3.1-fast, hailuo-2.3-fast, dan viduq3-turbo adalah titik awal yang bagus.

Alur berbasis referensi

Jika Anda membutuhkan conditioning khusus dengan gambar referensi, mulai dari veo3.1, veo3.1-fast, wan-2.6, atau kling-video-o1-pro / std.

Video-to-video

Jalur video-to-video publik yang saat ini paling umum diaktifkan terutama adalah topaz-video-upscale, grok-imagine-upscale, dan kling-video-o1-pro / std.

Billing

Penagihan bergantung pada model. Beberapa model video publik secara efektif berperilaku seperti model berbasis permintaan, sedangkan yang lain lebih mirip model berbasis durasi. Untuk informasi harga publik terbaru, lihat halaman model atau Pricing API.