建立聊天補全

Request Body

model

string

必填

要使用的模型 ID。可用選項請參閱 Models。

messages

array

必填

組成對話的一系列訊息。每個訊息物件包含：

role (string): system, user, 或 assistant
content (string | array): 訊息內容

當 content 為陣列時，LemonData 支援相容模型的結構化多模態區塊：

text: { "type": "text", "text": "..." }
image: { "type": "image_url", "image_url": { "url": "https://..." } }
video: { "type": "video_url", "video_url": { "url": "https://..." } }
audio: { "type": "audio_url", "audio_url": { "url": "https://..." } }

對於多模態生產流量，建議使用公開的 https URL。LemonData 會將這些媒體區塊轉換為路由至實體模型所需的供應商專屬請求格式。

temperature

number

預設值:"1"

介於 0 到 2 的取樣溫度。較高的值會使輸出更具隨機性。

max_tokens

integer

要生成的最大 token 數量。

stream

boolean

預設值:"false"

若為 true，部分訊息差異將會以 SSE 事件發送。

stream_options

object

串流選項。設定 include_usage: true 以在串流分片中接收 token 使用資訊。

top_p

number

預設值:"1"

Nucleus 取樣參數。建議調整此參數或 temperature，而非兩者同時調整。

frequency_penalty

number

預設值:"0"

數值介於 -2.0 到 2.0。正值會懲罰重複出現的 token。

presence_penalty

number

預設值:"0"

數值介於 -2.0 到 2.0。正值會懲罰已出現在文字中的 token。

stop

string | array

最多 4 個序列，API 在遇到這些序列時會停止生成 token。

tools

array

模型可能會呼叫的一組工具（函式呼叫）。

tool_choice

string | object

控制模型如何使用工具。選項：auto、none、required，或指定的工具物件。

parallel_tool_calls

boolean

預設值:"true"

是否啟用平行函式呼叫。設為 false 則依序呼叫函式。

max_completion_tokens

integer

補全的最大 token 數量。為 max_tokens 的替代方案，對於較新的具推理能力的模型族群較有用。

reasoning_effort

string

針對具推理能力模型的推理努力等級。選項：low、medium、high。

seed

integer

用於確定性取樣的隨機種子。

integer

預設值:"1"

要生成的補全數量（1-128）。

logprobs

boolean

是否回傳對數機率（log probabilities）。

top_logprobs

integer

要回傳的前 N 個對數機率（0-20）。需要 logprobs: true。

top_k

integer

Top-K 取樣參數（適用於 Anthropic/Gemini 模型）。

response_format

object

回應格式規格。使用 {"type": "json_object"} 以啟用 JSON 模式。將 {"type": "json_schema", "json_schema": {...}} 視為依據所選模型與路由行為的最佳努力路徑。

logit_bias

object

修改指定 token 出現機率的偏好。將 token ID（以字串）對映到 -100 到 100 的偏差值。

user

string

代表終端使用者的唯一識別碼，用於濫用監控。

cache_control

object

LemonData 的快取控制選項。

type (string): 快取策略 - default、no_cache、no_store、response_only、semantic_only
max_age (integer): 快取 TTL（秒）（最大 86400）

Response

string

此補全的唯一識別碼。

object

string

永遠為 chat.completion。

created

integer

補全建立的 Unix 時間戳記。

model

string

用於補全的模型。

choices

array

補全選項清單。每個選項包含：

index (integer): 選項的索引
message (object): 生成的訊息
finish_reason (string): 模型停止的原因（stop、length、tool_calls）

usage

object

token 使用統計。

prompt_tokens (integer): prompt 中的 token 數
completion_tokens (integer): 補全中的 token 數
total_tokens (integer): 使用的總 token 數

curl -X POST "https://api.lemondata.cc/v1/chat/completions" \
  -H "Authorization: Bearer sk-your-api-key" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "gpt-4o",
    "messages": [
      {"role": "system", "content": "You are a helpful assistant."},
      {"role": "user", "content": "Hello!"}
    ],
    "temperature": 0.7,
    "max_tokens": 1000
  }'

Multimodal Example

{
  "model": "gemini-2.5-pro",
  "messages": [
    {
      "role": "user",
      "content": [
        { "type": "text", "text": "Describe this video briefly." },
        { "type": "video_url", "video_url": { "url": "https://example.com/demo.mp4" } }
      ]
    }
  ],
  "max_tokens": 64
}

{
  "id": "chatcmpl-abc123",
  "object": "chat.completion",
  "created": 1706000000,
  "model": "gpt-4o",
  "choices": [
    {
      "index": 0,
      "message": {
        "role": "assistant",
        "content": "Hello! How can I help you today?"
      },
      "finish_reason": "stop"
    }
  ],
  "usage": {
    "prompt_tokens": 20,
    "completion_tokens": 9,
    "total_tokens": 29
  }
}

核心

文字

檔案與批次

圖像與媒體

非同步任務

Gemini 原生

管理

建立聊天補全

Request Body

Response

Multimodal Example

核心

文字

檔案與批次

圖像與媒體

非同步任務

Gemini 原生

管理

​Request Body

​Response

​Multimodal Example

Request Body

Response

Multimodal Example