Chuyển đến nội dung chính

Tổng quan

LemonData cung cấp quyền truy cập vào hơn 69 mô hình tạo video từ 11 nhà cung cấp thông qua một API thống nhất duy nhất. Quá trình tạo video là bất đồng bộ (asynchronous) — bạn gửi một yêu cầu và nhận được một task ID, sau đó thực hiện poll để lấy kết quả.
Danh sách mô hình được cập nhật thường xuyên. Để biết các mô hình và giá cả mới nhất, hãy truy cập Models page hoặc sử dụng Models API.

Quy trình bất đồng bộ

import requests
import time

API_KEY = "sk-your-api-key"
BASE = "https://api.lemondata.cc/v1"
headers = {"Authorization": f"Bearer {API_KEY}"}

# Step 1: Submit generation request
resp = requests.post(f"{BASE}/videos/generations",
    headers=headers,
    json={
        "model": "kling-v2.6-pro",
        "prompt": "A golden retriever running on a beach at sunset, cinematic 4K",
        "duration": 5,
        "aspect_ratio": "16:9"
    }
)
task_id = resp.json()["task_id"]

# Step 2: Poll for result
while True:
    status = requests.get(f"{BASE}/videos/generations/{task_id}", headers=headers).json()
    if status["status"] in ("completed", "succeeded"):
        print(f"Video URL: {status['video_url']}")
        break
    elif status["status"] == "failed":
        print(f"Failed: {status.get('error')}")
        break
    time.sleep(10)

Ma trận khả năng của mô hình

Các mô hình khác nhau có thế mạnh ở các tác vụ khác nhau. Sử dụng ma trận này để chọn mô hình phù hợp cho trường hợp sử dụng của bạn. Chú giải: ✅ Được hỗ trợ | ❌ Không được hỗ trợ
Dòng máyNhà cung cấpT2VI2VKeyframeMở rộngChỉnh sửaThời lượng tối đa
SoraOpenAI~20s
KlingKuaishou10s
VeoGoogle8s
SeedanceByteDance10s
HailuoMiniMax6s
WanAlibaba5s
RunwayRunway10s
LumaLuma5s
ViduVidu8s
GrokxAI~10s
HiggsfieldHiggsfield~5s

Định nghĩa khả năng

  • T2V (Text-to-Video): Tạo video từ một prompt văn bản
  • I2V (Image-to-Video): Chuyển hình ảnh tĩnh thành video bằng cách sử dụng image_url hoặc image
  • Keyframe: Kiểm soát khung hình bắt đầu và kết thúc bằng start_image + end_image
  • Extension: Mở rộng thời lượng của một video hiện có
  • Editing: Sửa đổi các khía cạnh cụ thể của một video hiện có

Các mô hình hiện có theo dòng

Sora (OpenAI)

Mô hìnhChất lượngGhi chú
sora-2Tiêu chuẩnMô hình mặc định, cân bằng tốt giữa chất lượng và tốc độ
sora-2-proCaoChất lượng cao hơn, thời gian tạo lâu hơn
sora-2-charactersTiêu chuẩnTạo video tập trung vào nhân vật

Kling (Kuaishou)

Mô hìnhKhả năngGhi chú
kling-v2.6-proT2VThế hệ mới nhất, chất lượng chuyên nghiệp
kling-v2.6-stdT2VThế hệ mới nhất, tốc độ nhanh
kling-v2.5-turbo-proT2VTốc độ Turbo, chất lượng chuyên nghiệp
kling-v2.1-masterT2V/I2VChất lượng Master
kling-v2.1-proT2V/I2VChất lượng chuyên nghiệp
kling-v2.1-standardT2V/I2VChất lượng tiêu chuẩn
kling-videoT2V/I2VMô hình cơ sở
kling-video-extendMở rộngMở rộng video hiện có
kling-video-o1-proT2VSuy luận O1, chất lượng chuyên nghiệp
kling-video-o1-stdT2VSuy luận O1, tiêu chuẩn
kling-effectsHiệu ứngÁp dụng các hiệu ứng hình ảnh
kling-omni-videoT2VMô hình Omni
kling-motion-controlT2VTạo video với kiểm soát chuyển động

Veo (Google)

Mô hìnhChất lượngGhi chú
veo3.1Tiêu chuẩnMô hình video mới nhất của Google
veo3.1-proCaoChất lượng chuyên nghiệp
veo3.1-4kUltraĐầu ra độ phân giải 4K
veo3.1-fastNhanhTạo video nhanh hơn
veo3.1-fast-4kNhanh + 4KTạo video nhanh với đầu ra 4K
veo3.1-componentsTiêu chuẩnTạo video dựa trên thành phần
veo3Tiêu chuẩnThế hệ trước
veo3-proCaoThế hệ trước, chuyên nghiệp
veo3-fastNhanhThế hệ trước, nhanh

Seedance (ByteDance)

Mô hìnhKhả năngGhi chú
seedance-2-0T2V/I2V/Keyframe/Mở rộng/Chỉnh sửaMới nhất, đa năng nhất
seedance-1-5-proT2V/I2VThế hệ trước, chất lượng chuyên nghiệp
seedance-1-0-proT2V/I2VThế hệ đầu tiên, chuyên nghiệp
seedance-1-0-pro-fastT2V/I2VThế hệ đầu tiên, nhanh
seedance-1-0-lite-t2vT2VText-to-video phiên bản nhẹ
seedance-1-0-lite-i2vI2VImage-to-video phiên bản nhẹ
Seedance 2.0 hỗ trợ phạm vi khả năng rộng nhất bao gồm multimodal-to-video, mở rộng video và chỉnh sửa video — tất cả thông qua cùng một API endpoint.

Hailuo (MiniMax)

Mô hìnhChất lượngGhi chú
hailuo-2.3Tiêu chuẩnChất lượng tốt
hailuo-2.3-proCaoĐầu ra chất lượng cao hơn
hailuo-2.3-fastNhanhTạo video nhanh hơn
hailuo-2.3-standardTiêu chuẩnCấp độ tiêu chuẩn
video-01Tiêu chuẩnMiniMax video-01
video-01-liveTiêu chuẩnTạo video phong cách live

Wan (Alibaba)

Mô hìnhKhả năngGhi chú
wan-2.6T2VText-to-video mới nhất
wan2.6-i2vI2VImage-to-video mới nhất
wan-2.5T2VThế hệ trước
wan2.5-i2v-previewI2VI2V thế hệ trước
wan-2.2-plusT2VThế hệ sớm hơn
vace-14bT2VKiến trúc VACE

Runway

Mô hìnhThời lượngGhi chú
runwayml-gen4-turbo-55sTạo video nhanh
runwayml-gen4-turbo-1010sCác đoạn clip dài hơn

Luma

Mô hìnhKhả năngGhi chú
luma-video-apiT2VText-to-video
luma-video-extend-apiMở rộngMở rộng video hiện có

Vidu (Shengshu)

Mô hìnhChất lượngGhi chú
viduq3-proCaoThế hệ mới nhất
viduq2-proCaoThế hệ trước, chuyên nghiệp
viduq2-pro-fastNhanhThế hệ trước, chuyên nghiệp nhanh
viduq2Tiêu chuẩnThế hệ trước, tiêu chuẩn
viduq2-turboNhanhTốc độ Turbo
vidu2.0Tiêu chuẩnMô hình cơ sở

Grok (xAI)

Mô hìnhGhi chú
grok-video-3Mô hình tạo video của xAI
grok-video-3-10sBiến thể 10 giây

Higgsfield

Mô hìnhGhi chú
higgsfield-turboNhanh nhất, chi phí thấp hơn
higgsfield-standardChất lượng tiêu chuẩn
higgsfield-litePhiên bản nhẹ

Ví dụ sử dụng

Text-to-Video (T2V)

Trường hợp sử dụng phổ biến nhất. Tất cả các mô hình đều hỗ trợ tính năng này.
response = requests.post(f"{BASE}/videos/generations",
    headers=headers,
    json={
        "model": "veo3.1-pro",
        "prompt": "Aerial drone shot of a coastal city at golden hour, waves crashing against cliffs",
        "duration": 5,
        "aspect_ratio": "16:9",
        "resolution": "1080p"
    }
)

Image-to-Video (I2V)

Chuyển hình ảnh tĩnh thành video. Sử dụng image_url cho URL hoặc image cho dữ liệu base64.
# Using image URL
response = requests.post(f"{BASE}/videos/generations",
    headers=headers,
    json={
        "model": "wan2.6-i2v",
        "prompt": "The person slowly turns and smiles at the camera",
        "image_url": "https://example.com/portrait.jpg"
    }
)

# Using base64 image
import base64
with open("photo.jpg", "rb") as f:
    image_b64 = base64.b64encode(f.read()).decode()

response = requests.post(f"{BASE}/videos/generations",
    headers=headers,
    json={
        "model": "kling-v2.1-master",
        "prompt": "Gentle wind blows through the scene",
        "image": f"data:image/jpeg;base64,{image_b64}"
    }
)

Kiểm soát Keyframe (Ảnh bắt đầu + Ảnh kết thúc)

Kiểm soát cả khung hình đầu tiên và cuối cùng để có các chuyển cảnh chính xác. Hiện được hỗ trợ bởi Seedance 2.0.
response = requests.post(f"{BASE}/videos/generations",
    headers=headers,
    json={
        "model": "seedance-2-0",
        "prompt": "Smooth transition from day to night, city lights gradually turning on",
        "start_image": "https://example.com/city-day.jpg",
        "end_image": "https://example.com/city-night.jpg",
        "duration": 5
    }
)

Mở rộng Video

Mở rộng thời lượng của một video hiện có. Sử dụng các mô hình có khả năng mở rộng (extension).
response = requests.post(f"{BASE}/videos/generations",
    headers=headers,
    json={
        "model": "kling-video-extend",
        "prompt": "Continue the scene naturally",
        "image_url": "https://example.com/last-frame.jpg"
    }
)

Tham chiếu tham số

Tham sốKiểuMô tả
modelstringID mô hình (mặc định: sora-2)
promptstringBắt buộc. Mô tả văn bản của video
image_urlstringURL của hình ảnh bắt đầu (cho I2V)
imagestringHình ảnh mã hóa Base64 với tiền tố data URL (cho I2V)
durationintegerThời lượng video tính bằng giây (1-60, tùy thuộc vào mô hình)
aspect_ratiostring16:9, 9:16, 1:1, v.v.
resolutionstring1080p, 720p, 4k
fpsintegerSố khung hình trên giây (1-120)
negative_promptstringNhững gì cần tránh trong quá trình tạo
seedintegerSeed ngẫu nhiên để tái lập kết quả
cfg_scalenumberThang đo hướng dẫn (0-20)
motion_strengthnumberCường độ chuyển động (0-1)
start_imagestringURL của keyframe bắt đầu
end_imagestringURL của keyframe kết thúc
Không phải tất cả các tham số đều được hỗ trợ bởi mọi mô hình. Các tham số không được hỗ trợ sẽ bị bỏ qua một cách âm thầm. Kiểm tra tài liệu của mô hình để biết các tham số được hỗ trợ.

Hướng dẫn chọn mô hình

Chất lượng tốt nhất

Seedance 2.0 hoặc Kling v2.6 Pro — chất lượng điện ảnh, chi tiết phong phú, chuyển động tự nhiên

Tạo nhanh nhất

Higgsfield Turbo hoặc Hailuo 2.3 — kết quả nhanh chóng để tạo mẫu và thử nghiệm

Linh hoạt nhất

Seedance 2.0 — hỗ trợ T2V, I2V, keyframe, mở rộng và chỉnh sửa trong một mô hình duy nhất

Giá trị tốt nhất

Wan 2.6 hoặc Hailuo 2.3 — chất lượng cạnh tranh với chi phí thấp hơn cho mỗi lần tạo

Thanh toán

Việc tạo video sử dụng giá cố định cho mỗi lần tạo. Bạn sẽ bị tính phí một lần khi task được gửi, bất kể thời lượng video. Nếu quá trình tạo thất bại, khoản phí sẽ được tự động hoàn lại. Kiểm tra giá hiện tại trên Models page hoặc thông qua Pricing API.