跳转到主要内容

请求体

model
string
必填
要使用的 embedding 模型的 ID(例如:text-embedding-3-small)。
input
string | array
必填
要进行 embedding 的输入文本。可以是字符串或字符串数组。
encoding_format
string
默认值:"float"
embeddings 的格式:floatbase64
dimensions
integer
输出的维度数量(取决于具体模型)。
user
string
表示你的终端用户的唯一标识符,用于滥用监控。

可用模型

模型维度描述
text-embedding-3-large3072最佳质量
text-embedding-3-small1536平衡
text-embedding-ada-0021536旧版

响应

object
string
始终为 list
data
array
embedding 对象数组。每个对象包含:
  • object(string):embedding
  • index(integer):在输入数组中的索引
  • embedding(array):embedding 向量
model
string
使用的模型。
usage
object
Token 用量,包含 prompt_tokenstotal_tokens
curl -X POST "https://api.lemondata.cc/v1/embeddings" \
  -H "Authorization: Bearer sk-your-api-key" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "text-embedding-3-small",
    "input": "The quick brown fox jumps over the lazy dog"
  }'
{
  "object": "list",
  "data": [
    {
      "object": "embedding",
      "index": 0,
      "embedding": [0.0023, -0.0194, 0.0081, ...]
    }
  ],
  "model": "text-embedding-3-small",
  "usage": {
    "prompt_tokens": 9,
    "total_tokens": 9
  }
}

批量 Embeddings

# Embed multiple texts at once
response = client.embeddings.create(
    model="text-embedding-3-small",
    input=[
        "First document text",
        "Second document text",
        "Third document text"
    ]
)

for i, data in enumerate(response.data):
    print(f"Document {i}: {len(data.embedding)} dimensions")