POST /v1/chat/completions as the default OpenAI-compatible route unless you explicitly need Responses-specific behavior.
Request Body
由对话组成的输入项列表。每个项可以是:
message: 带有角色和内容的对话消息function_call: 一个函数调用请求function_call_output: 来自函数调用的输出
message.content 可以是普通字符串,也可以是内容块数组。对于支持图像的模型(例如 GPT-5.4 变体),请将图像作为 input_image 块传递,而不是将 URL 或 Base64 字符串直接嵌入普通文本中。示例内容块:{ "type": "input_text", "text": "Describe this image" }{ "type": "input_image", "image_url": "https://example.com/image.jpg" }{ "type": "input_image", "image_url": "data:image/png;base64,..." }
提供给模型的系统指令(等同于 system 消息)。
生成的最大 token 数量。
采样温度,范围在 0 到 2 之间。
模型可能调用的工具列表。
如果为 true,则返回事件流。
用于从某个先前响应继续对话的响应 ID。
是否存储响应以便后续检索。
附加到响应以用于跟踪的元数据。
文本生成的配置选项。
text.format 的行为取决于所选模型和路由路径;并不保证在每个模型上都一致。是否允许并行进行多个工具调用。
Nucleus 采样参数(0-1)。
针对具备推理能力的模型(例如 GPT-5 系列变体)的推理配置。
effort(string): 推理努力级别(low,medium,high)
Response
响应的唯一标识符。
始终为
response。响应创建时的 Unix 时间戳。
模型生成的输出项列表。
token 使用统计。