Descripción general
El streaming permite recibir respuestas parciales a medida que se generan, proporcionando una mejor experiencia de usuario para aplicaciones de chat.Habilitar Streaming
Establecestream: true en tu solicitud:
Formato de respuesta de stream
Cada fragmento (chunk) en el stream sigue este formato:Manejo del fin del stream
El stream termina con:finish_reason: "stop"- Completado normalfinish_reason: "length"- Se alcanzó el límite demax_tokensfinish_reason: "tool_calls"- El modelo desea llamar a una herramientadata: [DONE]- Mensaje final