نظرة عامة
توفر LemonData نظام تخزين مؤقت ذكي يمكنه تقليل تكاليف API وزمن استجابة الطلبات بشكل كبير. يتجاوز نظام التخزين المؤقت لدينا مجرد مطابقة الطلبات البسيطة - فهو يفهم المعنى الدلالي للمطالبات الخاصة بك.توفير التكاليف
يتم احتساب رسوم عمليات Cache hits بجزء بسيط من التكلفة العادية.
استجابات أسرع
يتم إرجاع الاستجابات المخزنة مؤقتاً فوراً، دون الحاجة إلى استنتاج النموذج.
مدرك للسياق
تجد المطابقة الدلالية الطلبات المتشابهة حتى مع اختلاف الصياغة.
عناصر التحكم في الخصوصية
تحكم كامل في ما يتم تخزينه مؤقتاً ومشاركته.
كيف يعمل
تستخدم LemonData نظام تخزين مؤقت ثنائي الطبقات:الطبقة 1: تخزين الاستجابة المؤقت (مطابقة تامة)
بالنسبة للطلبات الحتمية (temperature=0)، نقوم بتخزين الاستجابة الدقيقة مؤقتاً:
- المطابقة: نموذج ورسائل ومعلمات متطابقة
- السرعة: فورية (ميكروثانية)
- الأفضل لـ: الاستعلامات المتكررة المتطابقة
الطبقة 2: التخزين المؤقت الدلالي (مطابقة التشابه)
بالنسبة لجميع الطلبات، نتحقق أيضاً من التشابه الدلالي باستخدام خوارزمية مطابقة ثنائية المراحل:- المرحلة 1 (الاستعلام فقط): تشابه ≥95% في استعلام المستخدم
- المرحلة 2 (السياق الكامل): تشابه ≥85% بما في ذلك سياق المحادثة
- الأفضل لـ: استعلامات نمط الأسئلة الشائعة، والأسئلة المتكررة
رؤوس التخزين المؤقت (Cache Headers)
رؤوس الطلب (Request Headers)
التحكم في سلوك التخزين المؤقت لكل طلب:| الرأس | القيمة | التأثير |
|---|---|---|
Cache-Control: no-cache | - | تخطي التخزين المؤقت، استجابة جديدة |
Cache-Control: no-store | - | لا تقم بتخزين هذه الاستجابة مؤقتاً |
رؤوس الاستجابة (Response Headers)
تتضمن كل استجابة حالة التخزين المؤقت:التحقق من حالة التخزين المؤقت
فوترة التخزين المؤقت
تعد عمليات Cache hits أرخص بكثير من الطلبات الجديدة:| النوع | التكلفة |
|---|---|
| Cache HIT | خصم 80% |
| Cache MISS | السعر الكامل |
عناصر التحكم في الخصوصية
مستوى مفتاح API
تكوين سلوك التخزين المؤقت لكل مفتاح API في لوحة التحكم الخاصة بك:| الوضع | الوصف |
|---|---|
| Default | التخزين المؤقت مفعل، قد تتم المشاركة مع طلبات مماثلة |
| No Share | التخزين المؤقت مفعل، لكن الاستجابات خاصة بحسابك فقط |
| Disabled | لا يوجد تخزين مؤقت على الإطلاق |
مستوى الطلب
التجاوز لكل طلب:ملاحظات التخزين المؤقت
إذا تلقيت استجابة مخزنة مؤقتاً غير صحيحة، يمكنك الإبلاغ عنها:wrong_answer- غير صحيح واقعياًoutdated- المعلومات قديمةirrelevant- لا يطابق السؤالother- مشكلات أخرى
أفضل الممارسات
استخدم temperature=0 للاستعلامات القابلة للتخزين المؤقت
استخدم temperature=0 للاستعلامات القابلة للتخزين المؤقت
تزيد الإعدادات الحتمية من معدلات نجاح التخزين المؤقت (cache hit rates).
توحيد تنسيقات المطالبات
توحيد تنسيقات المطالبات
يؤدي التنسيق المتسق إلى تحسين المطابقة الدلالية.
استخدم no-cache للاستعلامات الحساسة للوقت
استخدم no-cache للاستعلامات الحساسة للوقت
يجب أن تتخطى الأحداث الجارية والبيانات في الوقت الفعلي التخزين المؤقت.
مراقبة معدلات نجاح التخزين المؤقت
مراقبة معدلات نجاح التخزين المؤقت
تحقق من لوحة التحكم الخاصة بك للحصول على إحصائيات التخزين المؤقت والتوفير.
متى لا يجب التخزين المؤقت
قم بتعطيل التخزين المؤقت لـ:- المعلومات في الوقت الفعلي: أسعار الأسهم، الطقس، الأخبار
- المحتوى المخصص: التوصيات الخاصة بالمستخدم
- المهام الإبداعية: عندما يكون التنوع مطلوباً
- البيانات الحساسة: المعلومات السرية