Responses API là API hội thoại có trạng thái (stateful) mới hơn của OpenAI. LemonData hỗ trợ định dạng này cho các mô hình tương thích.
Request Body
ID của mô hình cần sử dụng. Xem Models để biết các tùy chọn có sẵn.
Một danh sách các mục đầu vào bao gồm cuộc hội thoại.Mỗi mục có thể là:
message: Một tin nhắn hội thoại với vai trò (role) và nội dung (content)
function_call: Một yêu cầu gọi hàm (function call)
function_call_output: Kết quả đầu ra từ một cuộc gọi hàm
Các chỉ dẫn hệ thống cho mô hình (tương đương với tin nhắn hệ thống).
Số lượng token tối đa được tạo ra.
Nhiệt độ lấy mẫu (sampling temperature) trong khoảng từ 0 đến 2.
Danh sách các công cụ mà mô hình có thể gọi.
Nếu là true, trả về một luồng (stream) các sự kiện.
ID của một response trước đó để tiếp tục cuộc hội thoại.
Có lưu trữ response để truy xuất sau này hay không.
Metadata để đính kèm vào response cho mục đích theo dõi.
Các tùy chọn cấu hình tạo văn bản.
Có cho phép nhiều cuộc gọi công cụ song song hay không.
Tham số lấy mẫu hạt nhân (nucleus sampling) (0-1).
Cấu hình suy luận (reasoning) cho các mô hình o1/o3.
effort (string): Mức độ nỗ lực suy luận (low, medium, high)
Response
Định danh duy nhất cho response.
Dấu thời gian Unix (Unix timestamp) khi response được tạo.
Danh sách các mục đầu ra được tạo bởi mô hình.
curl -X POST "https://api.lemondata.cc/v1/responses" \
-H "Authorization: Bearer sk-your-api-key" \
-H "Content-Type: application/json" \
-d '{
"model": "gpt-4o",
"input": [
{"type": "message", "role": "user", "content": "Hello!"}
],
"max_output_tokens": 1000
}'
{
"id": "resp_abc123",
"object": "response",
"created_at": 1706000000,
"model": "gpt-4o",
"output": [
{
"type": "message",
"role": "assistant",
"content": [
{"type": "text", "text": "Hello! How can I help you today?"}
]
}
],
"usage": {
"input_tokens": 10,
"output_tokens": 12,
"total_tokens": 22
}
}