Aperçu
Le streaming vous permet de recevoir des réponses partielles au fur et à mesure de leur génération, offrant ainsi une meilleure expérience utilisateur pour les applications de chat.Activer le streaming
Définissezstream: true dans votre requête :
Format de réponse du flux
Chaque fragment (chunk) du flux suit ce format :Gestion de la fin du flux
Le flux se termine par :finish_reason: "stop"- Complétion normalefinish_reason: "length"- Limitemax_tokensatteintefinish_reason: "tool_calls"- Le modèle souhaite appeler un outildata: [DONE]- Message final