جسم الطلب
قائمة بالرسائل التي تشكل المحادثة.يحتوي كل كائن رسالة على:
role(string):system,user, أوassistantcontent(string | array): محتوى الرسالة
content مصفوفة، يدعم LemonData كتلًا مُهيكلة متعددة الوسائط للنماذج المتوافقة:- text:
{ "type": "text", "text": "..." } - image:
{ "type": "image_url", "image_url": { "url": "https://..." } } - video:
{ "type": "video_url", "video_url": { "url": "https://..." } } - audio:
{ "type": "audio_url", "audio_url": { "url": "https://..." } }
https عامة. سيقوم LemonData بترجمة هذه الكتل الوسائطية إلى شكل الطلب الخاص بمزود الخدمة المطلوب للنموذج الفيزيائي الموجه.درجة حرارة العينة بين 0 و2. القيم الأعلى تجعل المخرجات أكثر عشوائية.
الحد الأقصى لعدد التوكنات التي سيتم توليدها.
If true، سيتم إرسال دلتا الرسائل الجزئية كأحداث SSE.
خيارات البث. اضبط
include_usage: true لتلقي استخدام التوكنات في أجزاء البث.معامل Nucleus sampling. نوصي بتغيير هذا أو temperature، وليس كليهما.
رقم بين -2.0 و2.0. القيم الإيجابية تعاقب التوكنات المكررة.
رقم بين -2.0 و2.0. القيم الإيجابية تعاقب التوكنات الموجودة بالفعل في النص.
حتى 4 تسلسلات تتوقف عندها الـ API عن توليد التوكنات.
قائمة بالأدوات التي قد يستدعيها النموذج (استدعاء دوال).
يتحكم في كيفية استخدام النموذج للأدوات. الخيارات:
auto, none, required, أو كائن أداة محدد.ما إذا كان سيتم تمكين استدعاء الدوال المتوازي. اضبط على false لاستدعاء الدوال بشكل متسلسل.
الحد الأقصى للتوكنات للاستكمال. بديل لـ
max_tokens، مفيد لعائلات النماذج الأحدث الممكّنة للتفكير.مستوى جهد الاستدلال للنماذج الممكّنة للتفكير. الخيارات:
low, medium, high.بذرة عشوائية للعينة الحتمية.
عدد الاستكمالات المراد توليدها (1-128).
ما إذا كان سيتم إرجاع لوغاريتمات الاحتمالات.
عدد أعلى لوغاريتمات الاحتمالات المراد إرجاعها (0-20). يتطلب
logprobs: true.معامل Top-K sampling (لنماذج Anthropic/Gemini).
مواصفات تنسيق الاستجابة. استخدم
{"type": "json_object"} لوضع JSON. اعتبر {"type": "json_schema", "json_schema": {...}} كطريق بذل أقصى جهد يعتمد على النموذج المختار والسلوك الموجَّه.تعديل احتمال ظهور توكنات محددة. اربط معرفات التوكن (كسلاسل) بقيم تحيّز من -100 إلى 100.
معرف فريد يمثل المستخدم النهائي لديك لأغراض مراقبة الإساءة.
خيارات تحكم التخزين المؤقت في LemonData.
type(string): استراتيجية التخزين المؤقت -default,no_cache,no_store,response_only,semantic_onlymax_age(integer): مدة بقاء الخ缓存 بالثواني (الحد الأقصى 86400)
الاستجابة
معرف فريد للاستكمال.
دائمًا
chat.completion.طابع زمني بنظام Unix لوقت إنشاء الاستكمال.
النموذج المستخدم للاستكمال.
قائمة بخيارات الاستكمال.يحتوي كل خيار على:
index(integer): مؤشر الخيارmessage(object): الرسالة المولدةfinish_reason(string): سبب توقف النموذج (stop,length,tool_calls)
إحصاءات استخدام التوكنات.
prompt_tokens(integer): التوكنات في المطالبةcompletion_tokens(integer): التوكنات في الاستكمالtotal_tokens(integer): إجمالي التوكنات المستخدمة