Genel Bakış
Akış, kısmi çıktıyı oluşturuldukça almanızı sağlar; bu da algılanan gecikmeyi ve kullanıcı deneyimini iyileştirir. Yeni OpenAI tarzı entegrasyonlar için önce Responses streaming tercih edin. Framework’ünüz hâlâ Chat Completions streaming kullanıyorsa, LemonData bu uyumluluk yolunu da destekler.Önerilen: Responses Streaming
Chat Completions Akışı
Framework’ünüz hâlâ/v1/chat/completions adresinden SSE parçaları bekliyorsa, bu da çalışır:
Akış Bitiş Koşulları
Tipik tamamlanma koşulları:- Responses API akışları için
response.completed - Chat Completions akışları için
finish_reason: "stop" - Bir token sınırına ulaşıldığında
finish_reason: "length" - Model araçları kullanmak istediğinde tool/function call olayları
Web Uygulaması Deseni
En İyi Uygulamalar
Yeni yapılar için Responses streaming tercih edin
Yeni yapılar için Responses streaming tercih edin
SDK’nız veya uygulamanız zaten destekliyorsa
/v1/responses kullanın. Uyumluluk odaklı entegrasyonlar için /v1/chat/completions akışını koruyun.Çıktıyı kademeli olarak flush edin
Çıktıyı kademeli olarak flush edin
Tam yanıtı beklemek yerine, delta parçalarını geldikçe UI’a veya terminale ekleyin.
Bağlantı kopmalarını ve yeniden denemeleri yönetin
Bağlantı kopmalarını ve yeniden denemeleri yönetin
Ağ düşmeleri ve upstream bağlantı kopmalarını normal hata durumları olarak ele alın ve uzun süreli oturumlar için dikkatli şekilde yeniden bağlanın.