Chuyển đến nội dung chính
The Responses API là API hội thoại có trạng thái mới hơn của OpenAI. LemonData hỗ trợ định dạng này như một đường dẫn tùy chọn nâng cao cho các mô hình tương thích; sử dụng POST /v1/chat/completions làm đường dẫn mặc định tương thích với OpenAI trừ khi bạn rõ ràng cần các hành vi đặc thù của Responses.

Nội dung yêu cầu

model
string
bắt buộc
ID của mô hình để sử dụng. Xem Models để biết các lựa chọn có sẵn.
input
array
bắt buộc
Một danh sách các mục đầu vào tạo thành cuộc hội thoại.Mỗi mục có thể là:
  • message: Một tin nhắn hội thoại với role và content
  • function_call: Một yêu cầu gọi hàm
  • function_call_output: Kết quả từ một cuộc gọi hàm
Đối với đầu vào đa phương thức, message.content có thể là một chuỗi văn bản thuần hoặc một mảng các khối nội dung. Đối với các mô hình có khả năng xử lý hình ảnh như các biến thể GPT-5.4, truyền hình ảnh dưới dạng các khối input_image thay vì nhúng URL hoặc chuỗi Base64 trực tiếp vào văn bản thuần.Ví dụ các khối nội dung:
  • { "type": "input_text", "text": "Describe this image" }
  • { "type": "input_image", "image_url": "https://example.com/image.jpg" }
  • { "type": "input_image", "image_url": "data:image/png;base64,..." }
instructions
string
Hướng dẫn hệ thống cho mô hình (tương đương với system message).
max_output_tokens
integer
Số token tối đa để sinh.
temperature
number
mặc định:"1"
Nhiệt độ sampling trong khoảng 0 đến 2.
tools
array
Danh sách công cụ mà mô hình có thể gọi.
stream
boolean
mặc định:"false"
Nếu true, trả về một luồng sự kiện.
previous_response_id
string
ID của một phản hồi trước để tiếp tục cuộc hội thoại từ đó.
store
boolean
mặc định:"true"
Có lưu phản hồi để truy xuất sau hay không.
metadata
object
Metadata để đính kèm vào phản hồi cho mục đích theo dõi.
text
object
Các tuỳ chọn cấu hình sinh văn bản. Hành vi cho text.format phụ thuộc vào mô hình được chọn và đường dẫn được định tuyến; không được đảm bảo đồng nhất trên mọi mô hình.
parallel_tool_calls
boolean
mặc định:"true"
Cho phép gọi nhiều công cụ song song hay không.
top_p
number
Tham số lấy mẫu Nucleus (0-1).
reasoning
object
Cấu hình reasoning cho các mô hình có hỗ trợ reasoning như các biến thể thuộc họ GPT-5.
  • effort (string): Mức độ nỗ lực reasoning (low, medium, high)

Phản hồi

id
string
Định danh duy nhất cho phản hồi.
object
string
Luôn là response.
created
integer
Dấu thời Unix khi phản hồi được tạo.
output
array
Danh sách các mục đầu ra do mô hình sinh ra.
usage
object
Thống kê sử dụng token.
curl -X POST "https://api.lemondata.cc/v1/responses" \
  -H "Authorization: Bearer sk-your-api-key" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "gpt-4o",
    "input": [
      {"type": "message", "role": "user", "content": "Hello!"}
    ],
    "max_output_tokens": 1000
  }'
{
  "id": "resp_abc123",
  "object": "response",
  "created": 1706000000,
  "model": "gpt-4o",
  "output": [
    {
      "type": "message",
      "role": "assistant",
      "content": [
        {"type": "text", "text": "Hello! How can I help you today?"}
      ]
    }
  ],
  "usage": {
    "input_tokens": 10,
    "output_tokens": 12,
    "total_tokens": 22
  }
}