跳轉到主要內容

請求主體

model
string
必填
要使用的 embedding 模型 ID(例如:text-embedding-3-small)。
input
string | array
必填
要進行 embedding 的輸入文字。可以是字串或字串陣列。
encoding_format
string
預設值:"float"
embeddings 的格式:floatbase64
dimensions
integer
輸出的維度數量(依模型而定)。
user
string
代表終端使用者的唯一識別碼,用於濫用監控。

可用模型

模型維度說明
text-embedding-3-large3072最佳品質
text-embedding-3-small1536平衡
text-embedding-ada-0021536舊版

回應

object
string
一律為 list
data
array
embedding 物件的陣列。每個物件包含:
  • object (string):embedding
  • index (integer):輸入陣列中的索引
  • embedding (array):embedding 向量
model
string
使用的模型。
usage
object
Token 使用量,包含 prompt_tokenstotal_tokens
curl -X POST "https://api.lemondata.cc/v1/embeddings" \
  -H "Authorization: Bearer sk-your-api-key" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "text-embedding-3-small",
    "input": "The quick brown fox jumps over the lazy dog"
  }'
{
  "object": "list",
  "data": [
    {
      "object": "embedding",
      "index": 0,
      "embedding": [0.0023, -0.0194, 0.0081, ...]
    }
  ],
  "model": "text-embedding-3-small",
  "usage": {
    "prompt_tokens": 9,
    "total_tokens": 9
  }
}

批次 Embeddings

# Embed multiple texts at once
response = client.embeddings.create(
    model="text-embedding-3-small",
    input=[
        "First document text",
        "Second document text",
        "Third document text"
    ]
)

for i, data in enumerate(response.data):
    print(f"Document {i}: {len(data.embedding)} dimensions")