Visão geral
A geração de vídeo é assíncrona. Você envia uma solicitação, recebe umatask_id e um poll_url, e então faz polling até obter o resultado final.
Para o comportamento de polling mais confiável, use exatamente o
poll_url retornado pela resposta de criação.Se uma resposta de criação retornar
poll_url, chame exatamente essa URL. Quando ela apontar para /v1/tasks/{id}, trate-a como o endpoint fixo canônico de status.Em integrações de produção, prefira URLs
https públicas para imagens, vídeos e áudio. Modelos compatíveis continuam aceitando URLs data:, mas payloads base64 grandes dificultam retry, observabilidade e depuração.Corpo da requisição
ID do modelo de vídeo. O padrão da API é
sora-2. Consulte o guia de geração de vídeo para ver a matriz pública atual e os recursos compatíveis.Descrição em texto do vídeo a ser gerado. Este campo é obrigatório para a maioria dos modelos públicos de vídeo.
Operação de vídeo a ser executada. O contrato público suporta
text-to-video, image-to-video, reference-to-video, start-end-to-video, video-to-video, video-extension, audio-to-video e motion-control. A LemonData pode inferir a operação a partir das entradas, mas em produção o ideal é informá-la explicitamente.URL pública da imagem inicial para fluxos image-to-video. Para a compatibilidade mais ampla entre modelos, prefira
image_url.Imagem inline como URL
data: (por exemplo, data:image/jpeg;base64,...). Modelos compatíveis aceitam esse formato, mas image_url costuma ser mais robusto em produção.Imagens de referência para fluxos reference-to-video. Você pode enviar até 3 itens. Recomendam-se URLs
https públicas, embora modelos compatíveis também aceitem URLs data:.Campo opcional para modelos que distinguem entre referências
asset e style.URL pública do vídeo de origem. É obrigatória para os fluxos públicos atuais de
video-to-video e para os modelos de motion-control.URL pública de áudio para modelos que suportam
audio-to-video.Identificador de tarefa do provedor para alguns fluxos de continuação, extensão ou derivação.
Deslocamento inicial específico do modelo para alguns fluxos
video-extension.Multiplicador ou quantidade de repetições específica do modelo para alguns fluxos
video-extension.Duração do vídeo em segundos. Os valores permitidos dependem do modelo.
Proporção de aspecto, por exemplo
16:9, 9:16 ou 1:1.Resolução de saída, por exemplo
720p, 1080p ou 4k. A compatibilidade depende do modelo.Alternador de saída de áudio dependente do modelo. Na LemonData, a família Veo 3 usa
true por padrão quando esse campo é omitido. O alias camelCase outputAudio também é aceito por compatibilidade.Quadros por segundo (1-120). Só tem efeito em modelos que expõem controle de FPS.
Elementos que devem ser evitados no vídeo gerado.
Seed aleatória para resultados reproduzíveis.
Intensidade de aderência ao prompt (0-20) nos modelos que expõem esse controle.
Intensidade de movimento (0-1) nos modelos que expõem esse controle.
URL da imagem do primeiro quadro, ou entrada compatível, para
start-end-to-video.URL da imagem do último quadro, ou entrada compatível, para
start-end-to-video.Faixa de tamanho específica do modelo para alguns modelos de vídeo compatíveis com OpenAI.
Alternador de marca-d’água para modelos que o expõem publicamente.
Seletor de efeito específico do modelo para alguns fluxos especializados de edição ou efeitos.
Identificador único do usuário final.
Notas de compatibilidade
- Os campos públicos canônicos usam snake_case:
reference_images,reference_image_typeeoutput_audio. - Por compatibilidade, a LemonData também aceita os aliases camelCase
referenceImages,referenceImageTypeeoutputAudio. - Se
operationfor omitido, a LemonData a infere a partir das entradas. Mesmo assim, em produção recomenda-se enviá-la explicitamente.
Boas práticas para entradas de mídia
- Para
image_url,reference_images,video_urleaudio_url, prefira URLshttpspúblicas. - Sempre que possível, evite misturar base64 inline e URLs remotas na mesma requisição.
- Se você usar URLs assinadas, garanta que elas permaneçam válidas durante o período necessário para retries e criação assíncrona da tarefa.
Resposta
Identificador canônico da tarefa assíncrona. Quando
id e task_id estiverem presentes juntos, trate-os como a mesma tarefa.Identificador único da tarefa para polling.
URL de polling recomendada para esta tarefa. Use exatamente esse caminho ao consultar o status.
Status inicial:
pending.Timestamp Unix de criação da tarefa.
Modelo utilizado.
Imagem para vídeo
Referência para vídeo
Quando o modelo suporta condicionamento dedicado por imagens de referência, useoperation=reference-to-video. No contrato público da LemonData, as referências são enviadas por reference_images.
Controle de quadro inicial e final
Usestart_image e end_image para controlar o primeiro e o último quadro.
Vídeo para vídeo
Quando um modelo aceita um vídeo existente como entrada principal, useoperation=video-to-video.
Controle de movimento
Quando um modelo precisa tanto de uma imagem do sujeito quanto de um vídeo de referência de movimento, useoperation=motion-control. A LemonData normaliza a forma pública image_url + video_url para o contrato upstream correspondente.
Disponibilidade atual de audio-to-video e video-extension
O contrato público da LemonData aceitaaudio-to-video e video-extension para fluxos específicos de determinados modelos. No entanto, na lista pública de modelos geralmente habilitados desta compilação de documentação não há nenhum modelo amplamente habilitado que anuncie publicamente essas capacidades. Antes de integrar esses fluxos, confirme a disponibilidade atual pela Models API ou pela página de modelos.
Inventário público atual de modelos
Esta lista está alinhada ao inventário público de modelos de vídeo habilitados nesta compilação da documentação. Para o estado mais recente, consulte a Models API.
OpenAI
| Modelo | Operações públicas |
|---|---|
sora-2 | Texto para vídeo, imagem para vídeo |
sora-2-pro | Texto para vídeo, imagem para vídeo |
sora-2-pro-storyboard | Imagem para vídeo |
Kuaishou
| Modelo | Operações públicas |
|---|---|
kling-3.0-motion-control | Controle de movimento |
kling-3.0-video | Texto para vídeo, imagem para vídeo, início-fim para vídeo |
kling-v2.5-turbo-pro | Texto para vídeo, imagem para vídeo, início-fim para vídeo |
kling-v2.5-turbo-std | Texto para vídeo, imagem para vídeo |
kling-v2.6-pro | Texto para vídeo, imagem para vídeo, início-fim para vídeo |
kling-v2.6-std | Texto para vídeo, imagem para vídeo |
kling-v3.0-pro | Texto para vídeo, imagem para vídeo, início-fim para vídeo |
kling-v3.0-std | Texto para vídeo, imagem para vídeo, início-fim para vídeo |
kling-video-o1-pro | Texto para vídeo, imagem para vídeo, referência para vídeo, início-fim para vídeo, vídeo para vídeo |
kling-video-o1-std | Texto para vídeo, imagem para vídeo, referência para vídeo, início-fim para vídeo, vídeo para vídeo |
| Modelo | Operações públicas |
|---|---|
veo3 | Texto para vídeo, imagem para vídeo |
veo3-fast | Texto para vídeo, imagem para vídeo |
veo3-pro | Texto para vídeo, imagem para vídeo |
veo3.1 | Texto para vídeo, imagem para vídeo, referência para vídeo, início-fim para vídeo |
veo3.1-fast | Texto para vídeo, imagem para vídeo, referência para vídeo, início-fim para vídeo |
veo3.1-pro | Texto para vídeo, imagem para vídeo, início-fim para vídeo |
ByteDance
| Modelo | Operações públicas |
|---|---|
seedance-1.5-pro | Texto para vídeo, imagem para vídeo |
MiniMax
| Modelo | Operações públicas |
|---|---|
hailuo-2.3-fast | Imagem para vídeo |
hailuo-2.3-pro | Texto para vídeo, imagem para vídeo |
hailuo-2.3-standard | Texto para vídeo, imagem para vídeo |
Alibaba
| Modelo | Operações públicas |
|---|---|
wan-2.2-plus | Texto para vídeo, imagem para vídeo |
wan-2.5 | Texto para vídeo, imagem para vídeo |
wan-2.6 | Texto para vídeo, imagem para vídeo, referência para vídeo |
Shengshu
| Modelo | Operações públicas |
|---|---|
viduq2 | Texto para vídeo, referência para vídeo |
viduq2-pro | Imagem para vídeo, referência para vídeo, início-fim para vídeo |
viduq2-pro-fast | Imagem para vídeo, início-fim para vídeo |
viduq2-turbo | Imagem para vídeo, início-fim para vídeo |
viduq3-pro | Texto para vídeo, imagem para vídeo, início-fim para vídeo |
viduq3-turbo | Texto para vídeo, imagem para vídeo, início-fim para vídeo |
xAI
| Modelo | Operações públicas |
|---|---|
grok-imagine-image-to-video | Imagem para vídeo |
grok-imagine-text-to-video | Texto para vídeo |
grok-imagine-upscale | Vídeo para vídeo |
Outros
| Modelo | Operações públicas |
|---|---|
topaz-video-upscale | Vídeo para vídeo |