نظرة عامة
يعمل توليد الفيديو بشكل غير متزامن. ترسل طلبًا، وتتلقىtask_id و poll_url، ثم تتحقق من الحالة بشكل دوري إلى أن تصبح النتيجة النهائية جاهزة.
للحصول على أكثر سلوك موثوق في التحقق من الحالة، استخدم قيمة
poll_url المعادة من استجابة الإنشاء كما هي تمامًا.إذا أعادت استجابة الإنشاء
poll_url، فاستدعِ هذا الرابط نفسه تمامًا. وعندما يشير إلى /v1/tasks/{id}، فاعتبره نقطة الحالة الثابتة المعيارية.في تكاملات الإنتاج، يُفضّل استخدام روابط
https عامة للصور والفيديو والصوت. ما تزال النماذج المتوافقة تقبل روابط data:، لكن حمولات base64 الكبيرة أصعب في إعادة المحاولة والفحص وتتبع الأعطال.جسم الطلب
معرّف نموذج الفيديو. القيمة الافتراضية في API هي
sora-2. راجع دليل توليد الفيديو للاطلاع على مصفوفة النماذج العامة الحالية والقدرات المدعومة.وصف نصي للفيديو المطلوب توليده. هذا الحقل مطلوب لمعظم نماذج الفيديو العامة.
عملية الفيديو المطلوب تنفيذها. يدعم العقد العام القيم
text-to-video و image-to-video و reference-to-video و start-end-to-video و video-to-video و video-extension و audio-to-video و motion-control. يمكن لـ LemonData استنتاج العملية من المدخلات المرسلة، لكن يُنصح بإرسال operation بشكل صريح في بيئات الإنتاج.رابط URL عام للصورة الابتدائية في تدفقات image-to-video. ولأوسع توافق بين النماذج، يُفضّل استخدام
image_url.صورة مضمنة بصيغة URL من نوع
data: (مثل data:image/jpeg;base64,...). تدعمها النماذج المتوافقة، لكن image_url يكون عادةً أكثر استقرارًا في الإنتاج.صور مرجعية لتدفقات reference-to-video. يمكنك إرسال حتى 3 عناصر. ويُفضّل استخدام روابط
https عامة، مع أن النماذج المتوافقة تقبل أيضًا روابط data:.حقل اختياري للنماذج التي تميّز بين المراجع من نوع
asset و style.رابط URL عام للفيديو المصدر. هذا الحقل مطلوب للتدفقات العامة الحالية من نوع
video-to-video ولنماذج motion-control.رابط URL عام للصوت للنماذج التي تدعم
audio-to-video.معرّف مهمة من جهة المزود يُستخدم في بعض تدفقات الاستكمال أو التوسعة أو الاشتقاق.
إزاحة بداية خاصة بالنموذج لبعض تدفقات
video-extension.مضاعف أو عدد تكرارات خاص بالنموذج لبعض تدفقات
video-extension.مدة الفيديو بالثواني. القيم المقبولة تعتمد على النموذج.
نسبة الأبعاد، مثل
16:9 أو 9:16 أو 1:1.دقة الإخراج، مثل
720p أو 1080p أو 4k. ويعتمد توفرها على النموذج.مفتاح إخراج صوت يعتمد على النموذج. في LemonData، تستخدم عائلة Veo 3 القيمة الافتراضية
true عندما يُحذف هذا الحقل. كما يُقبل الاسم البديل camelCase وهو outputAudio للتوافق.عدد الإطارات في الثانية (1-120). لا يكون فعالًا إلا في النماذج التي تكشف التحكم في FPS.
العناصر التي ترغب في تجنبها في الفيديو الناتج.
قيمة seed عشوائية للحصول على نتائج قابلة لإعادة الإنتاج.
شدة الالتزام بالـ prompt (من 0 إلى 20) في النماذج التي تدعم هذا التحكم.
شدة الحركة (من 0 إلى 1) في النماذج التي تدعم هذا التحكم.
رابط الصورة الخاصة بالإطار الأول، أو إدخال صورة متوافق، لعملية
start-end-to-video.رابط الصورة الخاصة بالإطار الأخير، أو إدخال صورة متوافق، لعملية
start-end-to-video.مستوى حجم خاص بالنموذج في بعض نماذج الفيديو المتوافقة مع OpenAI.
مفتاح العلامة المائية للنماذج التي تكشفه بشكل عام.
محدد تأثير خاص بالنموذج لبعض تدفقات التحرير أو التأثيرات المتخصصة.
معرّف فريد للمستخدم النهائي.
ملاحظات التوافق
- الحقول العامة القياسية تستخدم صيغة snake_case:
reference_imagesوreference_image_typeوoutput_audio. - ولأغراض التوافق، يقبل LemonData أيضًا الأسماء البديلة camelCase:
referenceImagesوreferenceImageTypeوoutputAudio. - إذا لم تُرسل
operation، فسيقوم LemonData باستنتاجها من المدخلات. ومع ذلك، في الإنتاج يُنصح بإرسالها بشكل صريح.
أفضل الممارسات لمدخلات الوسائط
- بالنسبة إلى
image_urlوreference_imagesوvideo_urlوaudio_url، يُفضّل استخدام روابطhttpsعامة. - حاول تجنّب خلط base64 المضمن وروابط URL البعيدة داخل الطلب نفسه قدر الإمكان.
- إذا كنت تستخدم روابط موقعة، فتأكد من أن مدة صلاحيتها تغطي إعادة المحاولة ومرحلة إنشاء المهمة غير المتزامنة.
الاستجابة
المعرّف المعياري للمهمة غير المتزامنة. عندما يظهر كلٌّ من
id وtask_id، فاعتبرهما نفس المهمة.معرّف المهمة الفريد لاستخدامه في التحقق من الحالة.
رابط التحقق من الحالة الموصى به لهذه المهمة. استخدم هذا المسار كما هو عند فحص الحالة.
الحالة الأولية:
pending.الطابع الزمني Unix لإنشاء المهمة.
النموذج المستخدم.
من صورة إلى فيديو
من مرجع إلى فيديو
إذا كان النموذج يدعم التكييف المخصص بالصور المرجعية، فاستخدمoperation=reference-to-video. وفي العقد العام لـ LemonData تُمرَّر المراجع عبر reference_images.
التحكم في الإطارين الأول والأخير
استخدمstart_image و end_image للتحكم في الإطار الأول والإطار الأخير.
من فيديو إلى فيديو
إذا كان النموذج يقبل فيديو موجودًا كمدخل رئيسي، فاستخدمoperation=video-to-video.
التحكم في الحركة
إذا كان النموذج يحتاج إلى صورة للعنصر وفيديو مرجعي للحركة معًا، فاستخدمoperation=motion-control. يقوم LemonData بتطبيع الشكل العام image_url + video_url ليتوافق مع عقدة الـ upstream المناسبة.
التوفر الحالي لـ audio-to-video و video-extension
يقبل العقد العام لـ LemonData القيمتينaudio-to-video و video-extension لبعض التدفقات الخاصة بالنماذج. لكن قائمة النماذج العامة المفعلة على نطاق واسع في هذا البناء من الوثائق لا تتضمن حاليًا نموذجًا عامًا واسع التفعيل يعلن أيًا من هاتين القدرتين. قبل دمج هذه التدفقات، تحقق من التوفر الحالي عبر واجهة Models API أو صفحة النماذج.
قائمة نماذج الفيديو العامة المفعّلة حاليًا
هذه القائمة متوافقة مع مخزون نماذج الفيديو العامة المفعلة في هذا البناء من الوثائق. ولأحدث حالة، استخدم واجهة Models API.
OpenAI
| النموذج | العمليات العامة |
|---|---|
sora-2 | نص إلى فيديو، image-to-video |
sora-2-pro | نص إلى فيديو، image-to-video |
sora-2-pro-storyboard | Image-to-video |
Kuaishou
| النموذج | العمليات العامة |
|---|---|
kling-3.0-motion-control | تحكم في الحركة |
kling-3.0-video | نص إلى فيديو، image-to-video، start-end-to-video |
kling-v2.5-turbo-pro | نص إلى فيديو، image-to-video، start-end-to-video |
kling-v2.5-turbo-std | نص إلى فيديو، image-to-video |
kling-v2.6-pro | نص إلى فيديو، image-to-video، start-end-to-video |
kling-v2.6-std | نص إلى فيديو، image-to-video |
kling-v3.0-pro | نص إلى فيديو، image-to-video، start-end-to-video |
kling-v3.0-std | نص إلى فيديو، image-to-video، start-end-to-video |
kling-video-o1-pro | نص إلى فيديو، image-to-video، reference-to-video، start-end-to-video، video-to-video |
kling-video-o1-std | نص إلى فيديو، image-to-video، reference-to-video، start-end-to-video، video-to-video |
| النموذج | العمليات العامة |
|---|---|
veo3 | نص إلى فيديو، image-to-video |
veo3-fast | نص إلى فيديو، image-to-video |
veo3-pro | نص إلى فيديو، image-to-video |
veo3.1 | نص إلى فيديو، image-to-video، reference-to-video، start-end-to-video |
veo3.1-fast | نص إلى فيديو، image-to-video، reference-to-video، start-end-to-video |
veo3.1-pro | نص إلى فيديو، image-to-video، start-end-to-video |
ByteDance
| النموذج | العمليات العامة |
|---|---|
seedance-1.5-pro | نص إلى فيديو، image-to-video |
MiniMax
| النموذج | العمليات العامة |
|---|---|
hailuo-2.3-fast | Image-to-video |
hailuo-2.3-pro | نص إلى فيديو، image-to-video |
hailuo-2.3-standard | نص إلى فيديو، image-to-video |
Alibaba
| النموذج | العمليات العامة |
|---|---|
wan-2.2-plus | نص إلى فيديو، image-to-video |
wan-2.5 | نص إلى فيديو، image-to-video |
wan-2.6 | نص إلى فيديو، image-to-video، reference-to-video |
Shengshu
| النموذج | العمليات العامة |
|---|---|
viduq2 | نص إلى فيديو، reference-to-video |
viduq2-pro | Image-to-video، reference-to-video، start-end-to-video |
viduq2-pro-fast | Image-to-video، start-end-to-video |
viduq2-turbo | Image-to-video، start-end-to-video |
viduq3-pro | نص إلى فيديو، image-to-video، start-end-to-video |
viduq3-turbo | نص إلى فيديو، image-to-video، start-end-to-video |
xAI
| النموذج | العمليات العامة |
|---|---|
grok-imagine-image-to-video | Image-to-video |
grok-imagine-text-to-video | نص إلى فيديو |
grok-imagine-upscale | Video-to-video |
أخرى
| النموذج | العمليات العامة |
|---|---|
topaz-video-upscale | Video-to-video |