Genel Bakış
LemonData’nın platform semantik önbelleğine ek olarak, birçok AI sağlayıcısı kendi prompt önbelleğe alma özelliğini sunar. Bu, sağlayıcı seviyesinde (Anthropic, OpenAI, DeepSeek vb.) çalışan ayrı bir önbellekleme mekanizmasıdır.İki Önbellek Türü
Bunlar birbirini dışlar: Eğer platform önbelleği isabet ederse, üst kaynağa çağrı yapılmaz, bu nedenle sağlayıcı önbelleği uygulanmaz.
| Tür | Nerede | Nasıl Çalışır | Maliyet |
|---|---|---|---|
| Platform Önbelleği | LemonData | Semantik benzerlik eşleşmesi | Normal fiyatın %10’u |
| Sağlayıcı Önbelleği | Üst Kaynak (Anthropic/OpenAI/vb) | Tam önek eşleşmesi | İndirimli token ücretleri |
Sağlayıcı Prompt Önbelleği Nasıl Çalışır?
Sağlayıcı prompt önbelleğe alma, prompt önekinizin işlenmiş temsilini sağlayıcının sunucularında saklar. Aynı öneke sahip bir istek gönderdiğinizde, sağlayıcı bu tokenları yeniden işlemeyi atlayabilir.Temel Özellikler
- Önek tabanlı: Yalnızca promptunuzun başlangıcı önbelleğe alınabilir
- Tam eşleşme: Semantik benzerlik değil, birebir aynı tokenları gerektirir
- Zaman sınırlı: Önbellek girişlerinin süresi dolar (genellikle 5-60 dakika)
- Otomatik: Özel bir yapılandırma gerektirmez
Desteklenen Sağlayıcılar
| Sağlayıcı | Önbellek Okuma İndirimi | Önbellek Yazma Maliyeti | Min Token |
|---|---|---|---|
| Anthropic | %90 indirim | %25 prim | 1024 |
| OpenAI | %50 indirim | Girdi ile aynı | 1024 |
| DeepSeek | %90 indirim | Girdi ile aynı | 64 |
| %75 indirim | %25 ek ücret | 32768 |
İndirimler otomatik olarak uygulanır. LemonData, sağlayıcının önbellek fiyatlandırmasını size olduğu gibi yansıtır.
Önbellek Kullanımını Belirleme
Kullanım Günlüklerinde
Kullanım günlükleriniz detaylı önbellek token dökümünü gösterir:| Alan | Açıklama |
|---|---|
cacheReadTokens | Sağlayıcı önbelleğinden sunulan tokenlar (indirimli) |
cacheWriteTokens | Önbelleğe yazılan tokenlar (gelecekteki istekler için) |
nonCachedPromptTokens | Önbellek olmadan işlenen tokenlar |
İşlemlerde
Üst kaynak önbelleği kullanıldığında işlemler bir Provider Cache etiketi gösterir:- Cache (gök mavisi): Platform semantik önbellek isabeti - %90 indirim
- Provider Cache (turkuaz): Üst kaynak prompt önbellek isabeti - indirimli ücretler
Maliyet Hesaplama Örneği
Claude (Anthropic) için 10.000 girdi tokenı içeren bir istek için: Önbelleksiz:En İyi Uygulamalar
Tutarlı sistem promptları kullanın
Tutarlı sistem promptları kullanın
Sistem promptunuzu ve statik bağlamınızı mesajlarınızın başına yerleştirin. Bu, önbellek isabet potansiyelini maksimize eder.
Benzer istekleri gruplandırın
Benzer istekleri gruplandırın
Aynı öneke sahip istekleri, önbellek süresi dolmadan yararlanmak için birbirine yakın zamanlarda gönderin.
Minimum token gereksinimlerini karşılayın
Minimum token gereksinimlerini karşılayın
Önbelleğe alınabilir önekinizin sağlayıcının minimum sınırını (örneğin, Anthropic/OpenAI için 1024 token) karşıladığından emin olun.
Önbellek metriklerini izleyin
Önbellek metriklerini izleyin
Önbellek isabet oranları ve tasarruflar için panelinizdeki kullanım istatistiklerini kontrol edin.
Platform Önbelleği vs Sağlayıcı Önbelleği
| Özellik | Platform Önbelleği | Sağlayıcı Önbelleği |
|---|---|---|
| Eşleşme | Semantik benzerlik | Tam önek eşleşmesi |
| Maliyet | Normal fiyatın %10’u | İndirimli ücretler |
| Gecikme | Anlık (~1ms) | Azaltılmış (işleme atlanır) |
| Kontrol | Panel ayarları | Otomatik |
| Kapsam | Kullanıcılar arası (isteğe bağlı) | API anahtarı başına |
Hangisinin Uygulanacağı Durumlar
Önbellek Durumunu Kontrol Etme
Yanıt Başlıkları
Kullanım API’si
Önbellek dökümünü görmek için kullanım günlüklerinizi sorgulayın:SSS
Sağlayıcı önbelleğe almayı devre dışı bırakabilir miyim?
Sağlayıcı önbelleğe almayı devre dışı bırakabilir miyim?
Sağlayıcı önbelleğe alma otomatiktir ve devre dışı bırakılamaz. Ancak, bu yalnızca size fayda sağlar (daha düşük maliyetler), bu nedenle devre dışı bırakmak için bir neden yoktur.
İsteğim neden sağlayıcı önbelleğine isabet etmedi?
İsteğim neden sağlayıcı önbelleğine isabet etmedi?
Yaygın nedenler:
- Önek değişti (tek bir token farkı bile olsa)
- Önbellek süresi doldu (genellikle 5-60 dakika)
- Önek çok kısa (minimum token sınırının altında)
- Farklı bir API anahtarı kullanıldı
BYOK, sağlayıcı önbelleğe almayı destekliyor mu?
BYOK, sağlayıcı önbelleğe almayı destekliyor mu?
Evet! Kendi API anahtarlarınızı (BYOK) kullanırken, sağlayıcı önbelleğe alma aynı şekilde çalışır. Önbellek, üst kaynak API anahtarınıza bağlıdır.
Önbellek tasarrufunu nasıl maksimize ederim?
Önbellek tasarrufunu nasıl maksimize ederim?
- Tekrarlanan benzer sorgular için platform semantik önbelleğini kullanın
- Promptları önce statik içerik gelecek şekilde yapılandırın
- İstekler arasında sistem promptlarını tutarlı tutun
- İlgili istekleri hızlı bir şekilde art arda gönderin