الانتقال إلى المحتوى الرئيسي

نظرة عامة

بالإضافة إلى التخزين المؤقت الدلالي للمنصة الخاص بـ LemonData، يقدم العديد من مزودي الذكاء الاصطناعي ميزة التخزين المؤقت للمطالبات الخاصة بهم. هذه آلية تخزين مؤقت منفصلة تعمل على مستوى المزود (Anthropic، OpenAI، DeepSeek، إلخ).
نوعان من التخزين المؤقت
النوعالمكانآلية العملالتكلفة
التخزين المؤقت للمنصةLemonDataمطابقة التشابه الدلالي10% من السعر العادي
التخزين المؤقت للمزودالمصدر (Anthropic/OpenAI/إلخ)مطابقة البادئة الدقيقةأسعار مخفضة للـ tokens
هذان النوعان متنافيان: إذا حدثت إصابة في التخزين المؤقت للمنصة، فلن يتم إجراء استدعاء للمصدر، وبالتالي لا ينطبق التخزين المؤقت للمزود.

كيف يعمل التخزين المؤقت للمطالبات لدى المزود

يقوم التخزين المؤقت للمطالبات لدى المزود بتخزين التمثيل المعالج لبادئة مطالبتك على خوادم المزود. عندما ترسل طلباً بنفس البادئة، يمكن للمزود تخطي إعادة معالجة تلك الـ tokens.

الخصائص الرئيسية

  • يعتمد على البادئة: يمكن تخزين بداية مطالبتك فقط مؤقتاً
  • مطابقة دقيقة: يتطلب tokens متطابقة تماماً (وليس تشابهاً دلالياً)
  • محدد بوقت: تنتهي صلاحية مدخلات التخزين المؤقت (عادةً من 5 إلى 60 دقيقة)
  • تلقائي: لا يلزم إجراء تكوين خاص
الطلب 1: [System prompt + Context A + Question 1]
          ^^^^^^^^^^^^^^^^^^^^^^^^
          يتم تخزين هذه البادئة مؤقتاً

الطلب 2: [System prompt + Context A + Question 2]
          ^^^^^^^^^^^^^^^^^^^^^^^^
          إصابة التخزين المؤقت! تتم معالجة السؤال 2 فقط

المزودون المدعومون

المزودخصم قراءة التخزين المؤقتتكلفة كتابة التخزين المؤقتالحد الأدنى للـ Tokens
Anthropicخصم 90%علاوة 25%1024
OpenAIخصم 50%نفس تكلفة الإدخال1024
DeepSeekخصم 90%نفس تكلفة الإدخال64
Googleخصم 75%علاوة 25%32768
يتم تطبيق الخصومات تلقائياً. تقوم LemonData بتمرير أسعار التخزين المؤقت من المزود إليك مباشرة.

تحديد استخدام التخزين المؤقت

في سجلات الاستخدام

تعرض سجلات الاستخدام الخاصة بك تفصيلاً مفصلاً لـ tokens التخزين المؤقت:
الحقلالوصف
cacheReadTokensالـ tokens المقدمة من التخزين المؤقت للمزود (مخفضة)
cacheWriteTokensالـ tokens المكتوبة في التخزين المؤقت (للطلبات المستقبلية)
nonCachedPromptTokensالـ tokens المعالجة بدون تخزين مؤقت

في المعاملات

تعرض المعاملات علامة Provider Cache عند استخدام التخزين المؤقت من المصدر:
  • Cache (أزرق سماوي): إصابة التخزين المؤقت الدلالي للمنصة - خصم 90%
  • Provider Cache (أزرق مخضر): إصابة التخزين المؤقت للمزود - أسعار مخفضة

مثال على حساب التكلفة

لطلب يحتوي على 10,000 token إدخال إلى Claude (Anthropic): بدون تخزين مؤقت:
10,000 tokens × $3.00/1M = $0.030
مع التخزين المؤقت للمزود (8,000 مخزنة مؤقتاً + 2,000 جديدة):
قراءة التخزين المؤقت:  8,000 tokens × $0.30/1M = $0.0024  (خصم 90%)
كتابة التخزين المؤقت: 2,000 tokens × $3.75/1M = $0.0075  (علاوة 25%)
الإجمالي: $0.0099 (توفير 67%)

أفضل الممارسات

ضع مطالبة النظام والسياق الثابت في بداية رسائلك. هذا يزيد من احتمالية إصابة التخزين المؤقت.
أرسل الطلبات ذات البادئة المتماثلة بشكل متقارب زمنياً للاستفادة من التخزين المؤقت قبل انتهاء صلاحيته.
تأكد من أن البادئة القابلة للتخزين المؤقت تستوفي الحد الأدنى للمزود (مثلاً 1024 token لـ Anthropic/OpenAI).
تحقق من إحصائيات الاستخدام في لوحة التحكم لمعرفة معدلات إصابة التخزين المؤقت والتوفير.

التخزين المؤقت للمنصة مقابل التخزين المؤقت للمزود

الجانبالتخزين المؤقت للمنصةالتخزين المؤقت للمزود
المطابقةالتشابه الدلاليمطابقة البادئة الدقيقة
التكلفة10% من السعر العاديأسعار مخفضة
زمن الاستجابةفوري (~1 مللي ثانية)مخفض (تخطي المعالجة)
التحكمإعدادات لوحة التحكمتلقائي
النطاقعبر المستخدمين (اختياري)لكل مفتاح API

متى ينطبق كل نوع

وصول الطلب


┌──────────────────────────────────┐
│ إصابة التخزين المؤقت للمنصة؟   │
└──────────────────────────────────┘
    │ نعم                │ لا
    ▼                    ▼
┌──────────┐    ┌──────────────────────────┐
│ إرجاع   │    │ استدعاء API المصدر       │
│ المخزن  │    └──────────────────────────┘
│ (10%)    │            │
└──────────┘            ▼
               ┌──────────────────────────────┐
               │ إصابة التخزين المؤقت للمزود؟ │
               └──────────────────────────────┘
                   │ نعم          │ لا
                   ▼              ▼
               سعر مخفض       السعر الكامل
               للـ tokens      للـ tokens

التحقق من حالة التخزين المؤقت

رؤوس الاستجابة

X-Cache-Status: HIT           # إصابة التخزين المؤقت للمنصة
X-Cache-Status: MISS          # لا يوجد تخزين مؤقت للمنصة
X-Upstream-Cache-Read: 8000   # tokens قراءة التخزين المؤقت للمزود
X-Upstream-Cache-Write: 2000  # tokens كتابة التخزين المؤقت للمزود

واجهة برمجة تطبيقات الاستخدام

استعلم عن سجلات الاستخدام لرؤية تفصيل التخزين المؤقت:
curl https://api.lemondata.cc/v1/usage/logs \
  -H "Authorization: Bearer sk-your-key" \
  -H "Content-Type: application/json"
تتضمن الاستجابة:
{
  "promptTokens": 10000,
  "cacheReadTokens": 8000,
  "cacheWriteTokens": 2000,
  "nonCachedPromptTokens": 0,
  "completionTokens": 500,
  "cost": 0.0099
}

الأسئلة الشائعة

التخزين المؤقت للمزود تلقائي ولا يمكن تعطيله. ومع ذلك، فهو يفيدك فقط (تكاليف أقل)، لذا لا يوجد سبب لتعطيله.
الأسباب الشائعة:
  • تغيرت البادئة (حتى اختلاف token واحد)
  • انتهت صلاحية التخزين المؤقت (عادةً من 5 إلى 60 دقيقة)
  • البادئة قصيرة جداً (أقل من الحد الأدنى للـ tokens)
  • تم استخدام مفتاح API مختلف
نعم! عند استخدام مفاتيح API الخاصة بك (BYOK)، يعمل التخزين المؤقت للمزود بنفس الطريقة. يرتبط التخزين المؤقت بمفتاح API الخاص بك لدى المصدر.
  1. استخدم التخزين المؤقت الدلالي للمنصة للاستعلامات المتشابهة المتكررة
  2. نظّم المطالبات بحيث يكون المحتوى الثابت أولاً
  3. حافظ على اتساق مطالبات النظام عبر الطلبات
  4. أرسل الطلبات المتعلقة بشكل متتابع وسريع