نظرة عامة
بالإضافة إلى التخزين المؤقت الدلالي للمنصة الخاص بـ LemonData، يقدم العديد من مزودي الذكاء الاصطناعي ميزة التخزين المؤقت للمطالبات الخاصة بهم. هذه آلية تخزين مؤقت منفصلة تعمل على مستوى المزود (Anthropic، OpenAI، DeepSeek، إلخ).نوعان من التخزين المؤقت
هذان النوعان متنافيان: إذا حدثت إصابة في التخزين المؤقت للمنصة، فلن يتم إجراء استدعاء للمصدر، وبالتالي لا ينطبق التخزين المؤقت للمزود.
| النوع | المكان | آلية العمل | التكلفة |
|---|---|---|---|
| التخزين المؤقت للمنصة | LemonData | مطابقة التشابه الدلالي | 10% من السعر العادي |
| التخزين المؤقت للمزود | المصدر (Anthropic/OpenAI/إلخ) | مطابقة البادئة الدقيقة | أسعار مخفضة للـ tokens |
كيف يعمل التخزين المؤقت للمطالبات لدى المزود
يقوم التخزين المؤقت للمطالبات لدى المزود بتخزين التمثيل المعالج لبادئة مطالبتك على خوادم المزود. عندما ترسل طلباً بنفس البادئة، يمكن للمزود تخطي إعادة معالجة تلك الـ tokens.الخصائص الرئيسية
- يعتمد على البادئة: يمكن تخزين بداية مطالبتك فقط مؤقتاً
- مطابقة دقيقة: يتطلب tokens متطابقة تماماً (وليس تشابهاً دلالياً)
- محدد بوقت: تنتهي صلاحية مدخلات التخزين المؤقت (عادةً من 5 إلى 60 دقيقة)
- تلقائي: لا يلزم إجراء تكوين خاص
المزودون المدعومون
| المزود | خصم قراءة التخزين المؤقت | تكلفة كتابة التخزين المؤقت | الحد الأدنى للـ Tokens |
|---|---|---|---|
| Anthropic | خصم 90% | علاوة 25% | 1024 |
| OpenAI | خصم 50% | نفس تكلفة الإدخال | 1024 |
| DeepSeek | خصم 90% | نفس تكلفة الإدخال | 64 |
| خصم 75% | علاوة 25% | 32768 |
يتم تطبيق الخصومات تلقائياً. تقوم LemonData بتمرير أسعار التخزين المؤقت من المزود إليك مباشرة.
تحديد استخدام التخزين المؤقت
في سجلات الاستخدام
تعرض سجلات الاستخدام الخاصة بك تفصيلاً مفصلاً لـ tokens التخزين المؤقت:| الحقل | الوصف |
|---|---|
cacheReadTokens | الـ tokens المقدمة من التخزين المؤقت للمزود (مخفضة) |
cacheWriteTokens | الـ tokens المكتوبة في التخزين المؤقت (للطلبات المستقبلية) |
nonCachedPromptTokens | الـ tokens المعالجة بدون تخزين مؤقت |
في المعاملات
تعرض المعاملات علامة Provider Cache عند استخدام التخزين المؤقت من المصدر:- Cache (أزرق سماوي): إصابة التخزين المؤقت الدلالي للمنصة - خصم 90%
- Provider Cache (أزرق مخضر): إصابة التخزين المؤقت للمزود - أسعار مخفضة
مثال على حساب التكلفة
لطلب يحتوي على 10,000 token إدخال إلى Claude (Anthropic): بدون تخزين مؤقت:أفضل الممارسات
استخدم مطالبات نظام متسقة
استخدم مطالبات نظام متسقة
ضع مطالبة النظام والسياق الثابت في بداية رسائلك. هذا يزيد من احتمالية إصابة التخزين المؤقت.
اجمع الطلبات المتشابهة
اجمع الطلبات المتشابهة
أرسل الطلبات ذات البادئة المتماثلة بشكل متقارب زمنياً للاستفادة من التخزين المؤقت قبل انتهاء صلاحيته.
استوفِ الحد الأدنى لمتطلبات الـ tokens
استوفِ الحد الأدنى لمتطلبات الـ tokens
تأكد من أن البادئة القابلة للتخزين المؤقت تستوفي الحد الأدنى للمزود (مثلاً 1024 token لـ Anthropic/OpenAI).
راقب مقاييس التخزين المؤقت
راقب مقاييس التخزين المؤقت
تحقق من إحصائيات الاستخدام في لوحة التحكم لمعرفة معدلات إصابة التخزين المؤقت والتوفير.
التخزين المؤقت للمنصة مقابل التخزين المؤقت للمزود
| الجانب | التخزين المؤقت للمنصة | التخزين المؤقت للمزود |
|---|---|---|
| المطابقة | التشابه الدلالي | مطابقة البادئة الدقيقة |
| التكلفة | 10% من السعر العادي | أسعار مخفضة |
| زمن الاستجابة | فوري (~1 مللي ثانية) | مخفض (تخطي المعالجة) |
| التحكم | إعدادات لوحة التحكم | تلقائي |
| النطاق | عبر المستخدمين (اختياري) | لكل مفتاح API |
متى ينطبق كل نوع
التحقق من حالة التخزين المؤقت
رؤوس الاستجابة
واجهة برمجة تطبيقات الاستخدام
استعلم عن سجلات الاستخدام لرؤية تفصيل التخزين المؤقت:الأسئلة الشائعة
هل يمكنني تعطيل التخزين المؤقت للمزود؟
هل يمكنني تعطيل التخزين المؤقت للمزود؟
التخزين المؤقت للمزود تلقائي ولا يمكن تعطيله. ومع ذلك، فهو يفيدك فقط (تكاليف أقل)، لذا لا يوجد سبب لتعطيله.
لماذا لم يصب طلبي التخزين المؤقت للمزود؟
لماذا لم يصب طلبي التخزين المؤقت للمزود؟
الأسباب الشائعة:
- تغيرت البادئة (حتى اختلاف token واحد)
- انتهت صلاحية التخزين المؤقت (عادةً من 5 إلى 60 دقيقة)
- البادئة قصيرة جداً (أقل من الحد الأدنى للـ tokens)
- تم استخدام مفتاح API مختلف
هل يدعم BYOK التخزين المؤقت للمزود؟
هل يدعم BYOK التخزين المؤقت للمزود؟
نعم! عند استخدام مفاتيح API الخاصة بك (BYOK)، يعمل التخزين المؤقت للمزود بنفس الطريقة. يرتبط التخزين المؤقت بمفتاح API الخاص بك لدى المصدر.
كيف أزيد من توفير التخزين المؤقت؟
كيف أزيد من توفير التخزين المؤقت؟
- استخدم التخزين المؤقت الدلالي للمنصة للاستعلامات المتشابهة المتكررة
- نظّم المطالبات بحيث يكون المحتوى الثابت أولاً
- حافظ على اتساق مطالبات النظام عبر الطلبات
- أرسل الطلبات المتعلقة بشكل متتابع وسريع