Thân yêu cầu
Danh sách các tin nhắn tạo thành cuộc trò chuyện.Mỗi đối tượng tin nhắn chứa:
role(string):system,user, hoặcassistantcontent(string | array): Nội dung tin nhắn
content là một mảng, LemonData hỗ trợ các khối đa phương tiện có cấu trúc cho các mô hình tương thích:- text:
{ "type": "text", "text": "..." } - image:
{ "type": "image_url", "image_url": { "url": "https://..." } } - video:
{ "type": "video_url", "video_url": { "url": "https://..." } } - audio:
{ "type": "audio_url", "audio_url": { "url": "https://..." } }
https. LemonData sẽ chuyển đổi các khối media này thành dạng yêu cầu cụ thể của nhà cung cấp cần thiết cho mô hình vật lý được chuyển hướng.Tham số nhiệt độ sampling trong khoảng 0 đến 2. Giá trị cao hơn làm đầu ra ngẫu nhiên hơn.
Số token tối đa được sinh.
Nếu true, các delta tin nhắn từng phần sẽ được gửi dưới dạng sự kiện SSE.
Các tùy chọn cho streaming. Đặt
include_usage: true để nhận thông tin sử dụng token trong các đoạn stream.Tham số Nucleus sampling. Chúng tôi khuyến nghị điều chỉnh tham số này hoặc temperature, không cả hai.
Số trong khoảng -2.0 đến 2.0. Giá trị dương phạt các token lặp lại.
Số trong khoảng -2.0 đến 2.0. Giá trị dương phạt các token đã xuất hiện trong văn bản.
Tối đa 4 chuỗi mà tại đó API sẽ ngừng sinh token.
Danh sách các công cụ mà mô hình có thể gọi (gọi hàm).
Điều khiển cách mô hình sử dụng công cụ. Tùy chọn:
auto, none, required, hoặc một đối tượng công cụ cụ thể.Có bật gọi hàm song song hay không. Đặt thành false để gọi hàm tuần tự.
Số token tối đa cho phần completion. Thay thế cho
max_tokens, hữu ích cho các họ mô hình mới hỗ trợ reasoning.Mức độ nỗ lực suy luận cho các mô hình hỗ trợ reasoning. Tùy chọn:
low, medium, high.Giá trị seed ngẫu nhiên cho sampling mang tính xác định.
Số completions cần sinh (1-128).
Có trả về log probabilities hay không.
Số log probabilities hàng đầu cần trả về (0-20). Yêu cầu
logprobs: true.Tham số Top-K sampling (dành cho mô hình Anthropic/Gemini).
Đặc tả định dạng phản hồi. Sử dụng
{"type": "json_object"} cho chế độ JSON. Xem {"type": "json_schema", "json_schema": {...}} như một cách tiếp cận cố gắng tốt nhất phụ thuộc vào mô hình được chọn và hành vi chuyển hướng.Thay đổi khả năng xuất hiện của các token được chỉ định. Map token IDs (dưới dạng chuỗi) tới giá trị bias từ -100 đến 100.
Một định danh duy nhất đại diện cho người dùng cuối của bạn để giám sát lạm dụng.
Tùy chọn điều khiển cache của LemonData.
type(string): Chiến lược cache -default,no_cache,no_store,response_only,semantic_onlymax_age(integer): TTL cache tính bằng giây (tối đa 86400)
Phản hồi
Định danh duy nhất cho kết quả hoàn thiện.
Luôn là
chat.completion.Unix timestamp khi kết quả hoàn thiện được tạo.
Mô hình được sử dụng cho completion.
Danh sách các lựa chọn completion.Mỗi lựa chọn chứa:
index(integer): Chỉ số của lựa chọnmessage(object): Tin nhắn được sinh rafinish_reason(string): Lý do mô hình dừng (stop,length,tool_calls)
Thống kê sử dụng token.
prompt_tokens(integer): Số token trong promptcompletion_tokens(integer): Số token trong completiontotal_tokens(integer): Tổng số token đã sử dụng