Chuyển đến nội dung chính

Nội dung Request

model
string
bắt buộc
ID của model embedding sẽ sử dụng (ví dụ: text-embedding-3-small).
input
string | array
bắt buộc
Văn bản đầu vào để tạo embedding. Có thể là một chuỗi hoặc một mảng các chuỗi.
encoding_format
string
mặc định:"float"
Định dạng cho embeddings: float hoặc base64.
dimensions
integer
Số chiều cho đầu ra (phụ thuộc vào model).
user
string
Một mã định danh duy nhất đại diện cho end-user của bạn để giám sát lạm dụng.

Các Model Khả Dụng

ModelDimensionsDescription
text-embedding-3-large3072Chất lượng tốt nhất
text-embedding-3-small1536Cân bằng
text-embedding-ada-0021536Phiên bản cũ

Response

object
string
Luôn là list.
data
array
Mảng các đối tượng embedding.Mỗi đối tượng bao gồm:
  • object (string): embedding
  • index (integer): Chỉ mục trong mảng đầu vào
  • embedding (array): Vector embedding
model
string
Model được sử dụng.
usage
object
Mức sử dụng token với prompt_tokenstotal_tokens.
curl -X POST "https://api.lemondata.cc/v1/embeddings" \
  -H "Authorization: Bearer sk-your-api-key" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "text-embedding-3-small",
    "input": "The quick brown fox jumps over the lazy dog"
  }'
{
  "object": "list",
  "data": [
    {
      "object": "embedding",
      "index": 0,
      "embedding": [0.0023, -0.0194, 0.0081, ...]
    }
  ],
  "model": "text-embedding-3-small",
  "usage": {
    "prompt_tokens": 9,
    "total_tokens": 9
  }
}

Batch Embeddings

# Embed multiple texts at once
response = client.embeddings.create(
    model="text-embedding-3-small",
    input=[
        "First document text",
        "Second document text",
        "Third document text"
    ]
)

for i, data in enumerate(response.data):
    print(f"Document {i}: {len(data.embedding)} dimensions")