Request Body
組成對話的一系列訊息。每個訊息物件包含:
role(string):system,user, 或assistantcontent(string | array): 訊息內容
content 為陣列時,LemonData 支援相容模型的結構化多模態區塊:- text:
{ "type": "text", "text": "..." } - image:
{ "type": "image_url", "image_url": { "url": "https://..." } } - video:
{ "type": "video_url", "video_url": { "url": "https://..." } } - audio:
{ "type": "audio_url", "audio_url": { "url": "https://..." } }
https URL。LemonData 會將這些媒體區塊轉換為路由至實體模型所需的供應商專屬請求格式。介於 0 到 2 的取樣溫度。較高的值會使輸出更具隨機性。
要生成的最大 token 數量。
若為 true,部分訊息差異將會以 SSE 事件發送。
串流選項。設定
include_usage: true 以在串流分片中接收 token 使用資訊。Nucleus 取樣參數。建議調整此參數或
temperature,而非兩者同時調整。數值介於 -2.0 到 2.0。正值會懲罰重複出現的 token。
數值介於 -2.0 到 2.0。正值會懲罰已出現在文字中的 token。
最多 4 個序列,API 在遇到這些序列時會停止生成 token。
模型可能會呼叫的一組工具(函式呼叫)。
控制模型如何使用工具。選項:
auto、none、required,或指定的工具物件。是否啟用平行函式呼叫。設為 false 則依序呼叫函式。
補全的最大 token 數量。為
max_tokens 的替代方案,對於較新的具推理能力的模型族群較有用。針對具推理能力模型的推理努力等級。選項:
low、medium、high。用於確定性取樣的隨機種子。
要生成的補全數量(1-128)。
是否回傳對數機率(log probabilities)。
要回傳的前 N 個對數機率(0-20)。需要
logprobs: true。Top-K 取樣參數(適用於 Anthropic/Gemini 模型)。
回應格式規格。使用
{"type": "json_object"} 以啟用 JSON 模式。將 {"type": "json_schema", "json_schema": {...}} 視為依據所選模型與路由行為的最佳努力路徑。修改指定 token 出現機率的偏好。將 token ID(以字串)對映到 -100 到 100 的偏差值。
代表終端使用者的唯一識別碼,用於濫用監控。
LemonData 的快取控制選項。
type(string): 快取策略 -default、no_cache、no_store、response_only、semantic_onlymax_age(integer): 快取 TTL(秒)(最大 86400)
Response
此補全的唯一識別碼。
永遠為
chat.completion。補全建立的 Unix 時間戳記。
用於補全的模型。
補全選項清單。每個選項包含:
index(integer): 選項的索引message(object): 生成的訊息finish_reason(string): 模型停止的原因(stop、length、tool_calls)
token 使用統計。
prompt_tokens(integer): prompt 中的 token 數completion_tokens(integer): 補全中的 token 數total_tokens(integer): 使用的總 token 數