개요
스트리밍을 사용하면 응답이 생성되는 대로 부분적으로 수신할 수 있어, 채팅 애플리케이션에서 더 나은 사용자 경험을 제공할 수 있습니다.스트리밍 활성화
요청에서stream: true로 설정하세요:
스트림 응답 형식
스트림의 각 청크(chunk)는 다음 형식을 따릅니다:스트림 종료 처리
스트림은 다음과 같이 종료됩니다:finish_reason: "stop"- 정상 완료finish_reason: "length"-max_tokens제한 도달finish_reason: "tool_calls"- 모델이 도구 호출을 원하는 경우data: [DONE]- 최종 메시지