Chuyển đến nội dung chính
POST
/
v1
/
responses
curl -X POST "https://api.lemondata.cc/v1/responses" \
  -H "Authorization: Bearer sk-your-api-key" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "gpt-4o",
    "input": [
      {"type": "message", "role": "user", "content": "Hello!"}
    ],
    "max_output_tokens": 1000
  }'
{
  "id": "resp_abc123",
  "object": "response",
  "created_at": 1706000000,
  "model": "gpt-4o",
  "output": [
    {
      "type": "message",
      "role": "assistant",
      "content": [
        {"type": "text", "text": "Hello! How can I help you today?"}
      ]
    }
  ],
  "usage": {
    "input_tokens": 10,
    "output_tokens": 12,
    "total_tokens": 22
  }
}
Responses API là API hội thoại có trạng thái (stateful) mới hơn của OpenAI. LemonData hỗ trợ định dạng này cho các mô hình tương thích.

Request Body

model
string
bắt buộc
ID của mô hình cần sử dụng. Xem Models để biết các tùy chọn có sẵn.
input
array
bắt buộc
Một danh sách các mục đầu vào bao gồm cuộc hội thoại.Mỗi mục có thể là:
  • message: Một tin nhắn hội thoại với vai trò (role) và nội dung (content)
  • function_call: Một yêu cầu gọi hàm (function call)
  • function_call_output: Kết quả đầu ra từ một cuộc gọi hàm
instructions
string
Các chỉ dẫn hệ thống cho mô hình (tương đương với tin nhắn hệ thống).
max_output_tokens
integer
Số lượng token tối đa được tạo ra.
temperature
number
mặc định:"1"
Nhiệt độ lấy mẫu (sampling temperature) trong khoảng từ 0 đến 2.
tools
array
Danh sách các công cụ mà mô hình có thể gọi.
stream
boolean
mặc định:"false"
Nếu là true, trả về một luồng (stream) các sự kiện.
previous_response_id
string
ID của một response trước đó để tiếp tục cuộc hội thoại.
store
boolean
mặc định:"true"
Có lưu trữ response để truy xuất sau này hay không.
metadata
object
Metadata để đính kèm vào response cho mục đích theo dõi.
text
object
Các tùy chọn cấu hình tạo văn bản.
parallel_tool_calls
boolean
mặc định:"true"
Có cho phép nhiều cuộc gọi công cụ song song hay không.
top_p
number
Tham số lấy mẫu hạt nhân (nucleus sampling) (0-1).
reasoning
object
Cấu hình suy luận (reasoning) cho các mô hình o1/o3.
  • effort (string): Mức độ nỗ lực suy luận (low, medium, high)

Response

id
string
Định danh duy nhất cho response.
object
string
Luôn là response.
created_at
integer
Dấu thời gian Unix (Unix timestamp) khi response được tạo.
output
array
Danh sách các mục đầu ra được tạo bởi mô hình.
usage
object
Thống kê sử dụng token.
curl -X POST "https://api.lemondata.cc/v1/responses" \
  -H "Authorization: Bearer sk-your-api-key" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "gpt-4o",
    "input": [
      {"type": "message", "role": "user", "content": "Hello!"}
    ],
    "max_output_tokens": 1000
  }'
{
  "id": "resp_abc123",
  "object": "response",
  "created_at": 1706000000,
  "model": "gpt-4o",
  "output": [
    {
      "type": "message",
      "role": "assistant",
      "content": [
        {"type": "text", "text": "Hello! How can I help you today?"}
      ]
    }
  ],
  "usage": {
    "input_tokens": 10,
    "output_tokens": 12,
    "total_tokens": 22
  }
}