نظرة عامة
يتيح لك البث تلقي مخرجات جزئية أثناء إنشائها، مما يحسّن زمن الاستجابة المُدرَك وتجربة المستخدم. بالنسبة إلى عمليات التكامل الجديدة بأسلوب OpenAI، يُفضَّل استخدام Responses streaming أولًا. وإذا كان إطار العمل لديك لا يزال يستخدم Chat Completions streaming، فإن LemonData يدعم مسار التوافق هذا أيضًا.الموصى به: Responses Streaming
بث Chat Completions
إذا كان إطار العمل لديك لا يزال يتوقع مقاطع SSE من/v1/chat/completions، فهذا يعمل أيضًا:
شروط انتهاء البث
شروط الإكمال المعتادة:response.completedلتدفقات Responses APIfinish_reason: "stop"لتدفقات Chat Completionsfinish_reason: "length"عند الوصول إلى حد token- أحداث استدعاء الأداة/الدالة عندما يريد النموذج استخدام الأدوات
نمط تطبيق الويب
أفضل الممارسات
فضّل Responses streaming في الإنشاءات الجديدة
فضّل Responses streaming في الإنشاءات الجديدة
استخدم
/v1/responses إذا كان SDK أو التطبيق لديك يدعمه بالفعل. واحتفِظ ببث /v1/chat/completions لعمليات التكامل التي تتطلب التوافق.ادفع المخرجات تدريجيًا
ادفع المخرجات تدريجيًا
ألحِق مقاطع delta بواجهة المستخدم أو الطرفية عند وصولها بدلًا من انتظار الاستجابة الكاملة.
تعامل مع انقطاعات الاتصال وإعادات المحاولة
تعامل مع انقطاعات الاتصال وإعادات المحاولة
اعتبر انقطاع الشبكة وانفصال المصدر العلوي أوضاع فشل طبيعية، وأعِد الاتصال بحذر للجلسات طويلة التشغيل.