POST /v1/chat/completions làm đường dẫn mặc định tương thích với OpenAI trừ khi bạn rõ ràng cần các hành vi đặc thù của Responses.
Nội dung yêu cầu
Một danh sách các mục đầu vào tạo thành cuộc hội thoại.Mỗi mục có thể là:
message: Một tin nhắn hội thoại với role và contentfunction_call: Một yêu cầu gọi hàmfunction_call_output: Kết quả từ một cuộc gọi hàm
message.content có thể là một chuỗi văn bản thuần hoặc một mảng các khối nội dung. Đối với các mô hình có khả năng xử lý hình ảnh như các biến thể GPT-5.4, truyền hình ảnh dưới dạng các khối input_image thay vì nhúng URL hoặc chuỗi Base64 trực tiếp vào văn bản thuần.Ví dụ các khối nội dung:{ "type": "input_text", "text": "Describe this image" }{ "type": "input_image", "image_url": "https://example.com/image.jpg" }{ "type": "input_image", "image_url": "data:image/png;base64,..." }
Hướng dẫn hệ thống cho mô hình (tương đương với system message).
Số token tối đa để sinh.
Nhiệt độ sampling trong khoảng 0 đến 2.
Danh sách công cụ mà mô hình có thể gọi.
Nếu true, trả về một luồng sự kiện.
ID của một phản hồi trước để tiếp tục cuộc hội thoại từ đó.
Có lưu phản hồi để truy xuất sau hay không.
Metadata để đính kèm vào phản hồi cho mục đích theo dõi.
Các tuỳ chọn cấu hình sinh văn bản. Hành vi cho
text.format phụ thuộc vào mô hình được chọn và đường dẫn được định tuyến; không được đảm bảo đồng nhất trên mọi mô hình.Cho phép gọi nhiều công cụ song song hay không.
Tham số lấy mẫu Nucleus (0-1).
Cấu hình reasoning cho các mô hình có hỗ trợ reasoning như các biến thể thuộc họ GPT-5.
effort(string): Mức độ nỗ lực reasoning (low,medium,high)
Phản hồi
Định danh duy nhất cho phản hồi.
Luôn là
response.Dấu thời Unix khi phản hồi được tạo.
Danh sách các mục đầu ra do mô hình sinh ra.
Thống kê sử dụng token.