Saltar al contenido principal

Resumen

LemonData proporciona acceso a más de 69 modelos de generación de video de 11 proveedores a través de una única API unificada. La generación de video es asíncrona: usted envía una solicitud y recibe un task_id, luego realiza consultas (poll) para obtener el resultado.
La lista de modelos se actualiza con frecuencia. Para conocer los últimos modelos disponibles y sus precios, visite la página de Modelos o utilice la API de Modelos.

Flujo de trabajo asíncrono

import requests
import time

API_KEY = "sk-your-api-key"
BASE = "https://api.lemondata.cc/v1"
headers = {"Authorization": f"Bearer {API_KEY}"}

# Step 1: Submit generation request
resp = requests.post(f"{BASE}/videos/generations",
    headers=headers,
    json={
        "model": "kling-v2.6-pro",
        "prompt": "A golden retriever running on a beach at sunset, cinematic 4K",
        "duration": 5,
        "aspect_ratio": "16:9"
    }
)
task_id = resp.json()["task_id"]

# Step 2: Poll for result
while True:
    status = requests.get(f"{BASE}/videos/generations/{task_id}", headers=headers).json()
    if status["status"] in ("completed", "succeeded"):
        print(f"Video URL: {status['video_url']}")
        break
    elif status["status"] == "failed":
        print(f"Failed: {status.get('error')}")
        break
    time.sleep(10)

Matriz de capacidades de los modelos

Diferentes modelos destacan en diferentes tareas. Utilice esta matriz para elegir el modelo adecuado para su caso de uso. Leyenda: ✅ Soportado | ❌ No soportado
SerieProveedorT2VI2VKeyframeExtensiónEdiciónDuración máx.
SoraOpenAI~20s
KlingKuaishou10s
VeoGoogle8s
SeedanceByteDance10s
HailuoMiniMax6s
WanAlibaba5s
RunwayRunway10s
LumaLuma5s
ViduVidu8s
GrokxAI~10s
HiggsfieldHiggsfield~5s

Definiciones de capacidades

  • T2V (Text-to-Video): Generar video a partir de un prompt de texto
  • I2V (Image-to-Video): Animar una imagen estática en video usando image_url o image
  • Keyframe: Controlar los fotogramas inicial y final con start_image + end_image
  • Extensión: Extender la duración de un video existente
  • Edición: Modificar aspectos específicos de un video existente

Modelos disponibles por serie

Sora (OpenAI)

ModeloCalidadNotas
sora-2EstándarModelo predeterminado, buen equilibrio entre calidad y velocidad
sora-2-proAltaMayor calidad, mayor tiempo de generación
sora-2-charactersEstándarGeneración enfocada en personajes

Kling (Kuaishou)

ModeloCapacidadNotas
kling-v2.6-proT2VÚltima generación, calidad profesional
kling-v2.6-stdT2VÚltima generación, rápido
kling-v2.5-turbo-proT2VVelocidad turbo, calidad pro
kling-v2.1-masterT2V/I2VCalidad maestra
kling-v2.1-proT2V/I2VCalidad profesional
kling-v2.1-standardT2V/I2VCalidad estándar
kling-videoT2V/I2VModelo base
kling-video-extendExtensiónExtender videos existentes
kling-video-o1-proT2VRazonamiento O1, calidad pro
kling-video-o1-stdT2VRazonamiento O1, estándar
kling-effectsEfectosAplicar efectos visuales
kling-omni-videoT2VModelo Omni
kling-motion-controlT2VGeneración con control de movimiento

Veo (Google)

ModeloCalidadNotas
veo3.1EstándarEl modelo de video más reciente de Google
veo3.1-proAltaCalidad profesional
veo3.1-4kUltraSalida en resolución 4K
veo3.1-fastRápidoGeneración más rápida
veo3.1-fast-4kRápido + 4KGeneración rápida con salida 4K
veo3.1-componentsEstándarGeneración basada en componentes
veo3EstándarGeneración anterior
veo3-proAltaGeneración anterior, profesional
veo3-fastRápidoGeneración anterior, rápido

Seedance (ByteDance)

ModeloCapacidadNotas
seedance-2-0T2V/I2V/Keyframe/Extensión/EdiciónMás reciente, más capaz
seedance-1-5-proT2V/I2VGeneración anterior, calidad pro
seedance-1-0-proT2V/I2VPrimera generación, pro
seedance-1-0-pro-fastT2V/I2VPrimera generación, rápido
seedance-1-0-lite-t2vT2VText-to-video ligero
seedance-1-0-lite-i2vI2VImage-to-video ligero
Seedance 2.0 admite la gama más amplia de capacidades, incluyendo multimodal-to-video, extensión de video y edición de video, todo a través del mismo endpoint de la API.

Hailuo (MiniMax)

ModeloCalidadNotas
hailuo-2.3EstándarBuena calidad
hailuo-2.3-proAltaSalida de mayor calidad
hailuo-2.3-fastRápidoGeneración más rápida
hailuo-2.3-standardEstándarNivel estándar
video-01EstándarMiniMax video-01
video-01-liveEstándarGeneración estilo en vivo

Wan (Alibaba)

ModeloCapacidadNotas
wan-2.6T2VÚltimo text-to-video
wan2.6-i2vI2VÚltimo image-to-video
wan-2.5T2VGeneración anterior
wan2.5-i2v-previewI2VI2V de generación anterior
wan-2.2-plusT2VGeneración más temprana
vace-14bT2VArquitectura VACE

Runway

ModeloDuraciónNotas
runwayml-gen4-turbo-55sGeneración rápida
runwayml-gen4-turbo-1010sClips más largos

Luma

ModeloCapacidadNotas
luma-video-apiT2VText-to-video
luma-video-extend-apiExtensiónExtender videos existentes

Vidu (Shengshu)

ModeloCalidadNotas
viduq3-proAltaÚltima generación
viduq2-proAltaGeneración anterior, pro
viduq2-pro-fastRápidoGeneración anterior, pro rápido
viduq2EstándarGeneración anterior, estándar
viduq2-turboRápidoVelocidad turbo
vidu2.0EstándarModelo base

Grok (xAI)

ModeloNotas
grok-video-3Modelo de generación de video de xAI
grok-video-3-10sVariante de 10 segundos

Higgsfield

ModeloNotas
higgsfield-turboMás rápido, menor costo
higgsfield-standardCalidad estándar
higgsfield-liteLigero

Ejemplos de uso

Text-to-Video (T2V)

El caso de uso más común. Todos los modelos lo admiten.
response = requests.post(f"{BASE}/videos/generations",
    headers=headers,
    json={
        "model": "veo3.1-pro",
        "prompt": "Aerial drone shot of a coastal city at golden hour, waves crashing against cliffs",
        "duration": 5,
        "aspect_ratio": "16:9",
        "resolution": "1080p"
    }
)

Image-to-Video (I2V)

Anime una imagen estática. Use image_url para una URL o image para datos en base64.
# Using image URL
response = requests.post(f"{BASE}/videos/generations",
    headers=headers,
    json={
        "model": "wan2.6-i2v",
        "prompt": "The person slowly turns and smiles at the camera",
        "image_url": "https://example.com/portrait.jpg"
    }
)

# Using base64 image
import base64
with open("photo.jpg", "rb") as f:
    image_b64 = base64.b64encode(f.read()).decode()

response = requests.post(f"{BASE}/videos/generations",
    headers=headers,
    json={
        "model": "kling-v2.1-master",
        "prompt": "Gentle wind blows through the scene",
        "image": f"data:image/jpeg;base64,{image_b64}"
    }
)

Control de Keyframes (Imagen inicial + final)

Controle tanto el primer como el último fotograma para transiciones precisas. Actualmente compatible con Seedance 2.0.
response = requests.post(f"{BASE}/videos/generations",
    headers=headers,
    json={
        "model": "seedance-2-0",
        "prompt": "Smooth transition from day to night, city lights gradually turning on",
        "start_image": "https://example.com/city-day.jpg",
        "end_image": "https://example.com/city-night.jpg",
        "duration": 5
    }
)

Extensión de video

Extienda la duración de un video existente. Use modelos con capacidad de extensión.
response = requests.post(f"{BASE}/videos/generations",
    headers=headers,
    json={
        "model": "kling-video-extend",
        "prompt": "Continue the scene naturally",
        "image_url": "https://example.com/last-frame.jpg"
    }
)

Referencia de parámetros

ParámetroTipoDescripción
modelstringID del modelo (predeterminado: sora-2)
promptstringRequerido. Descripción de texto del video
image_urlstringURL de la imagen inicial (para I2V)
imagestringImagen codificada en base64 con prefijo de URL de datos (para I2V)
durationintegerDuración del video en segundos (1-60, depende del modelo)
aspect_ratiostring16:9, 9:16, 1:1, etc.
resolutionstring1080p, 720p, 4k
fpsintegerFotogramas por segundo (1-120)
negative_promptstringQué evitar en la generación
seedintegerSemilla aleatoria para reproducibilidad
cfg_scalenumberEscala de guía (0-20)
motion_strengthnumberIntensidad del movimiento (0-1)
start_imagestringURL del keyframe inicial
end_imagestringURL del keyframe final
No todos los parámetros son compatibles con todos los modelos. Los parámetros no compatibles se ignoran silenciosamente. Consulte la documentación del modelo para conocer los parámetros admitidos.

Guía de selección de modelos

Mejor calidad

Seedance 2.0 o Kling v2.6 Pro: calidad cinematográfica, detalles ricos, movimiento natural

Generación más rápida

Higgsfield Turbo o Hailuo 2.3: resultados rápidos para prototipado e iteración

Más versátil

Seedance 2.0: admite T2V, I2V, keyframe, extensión y edición en un solo modelo

Mejor relación calidad-precio

Wan 2.6 o Hailuo 2.3: calidad competitiva a un menor costo por generación

Facturación

La generación de video utiliza un precio fijo por generación. Se le cobra una vez cuando se envía la tarea, independientemente de la duración del video. Si la generación falla, el cargo se reembolsa automáticamente. Consulte los precios actuales en la página de Modelos o a través de la API de Precios.