概要
ストリーミングを使用すると、レスポンスが生成されるたびに部分的に受け取ることができ、チャットアプリケーションにおいてより優れたユーザーエクスペリエンスを提供できます。ストリーミングの有効化
リクエストでstream: true を設定します:
ストリーミングレスポンスの形式
ストリーム内の各チャンクは以下の形式に従います:ストリーム終了の処理
ストリームは以下で終了します:finish_reason: "stop"- 通常の完了finish_reason: "length"-max_tokensの制限に到達finish_reason: "tool_calls"- モデルがツールを呼び出そうとしているdata: [DONE]- 最終メッセージ