LlamaIndex

Visão geral

Tipo: Framework ou plataformaCaminho principal: OpenAI-compatible via OpenAILikeNível de suporte: Compatível via OpenAILike

Para o LemonData, a configuração mais robusta do LlamaIndex é usar integrações compatíveis com OpenAI em vez das classes OpenAI integradas. A documentação atual do LlamaIndex recomenda explicitamente OpenAILike para endpoints OpenAI compatíveis de terceiros, porque as classes OpenAI integradas inferem metadados a partir dos nomes oficiais dos modelos. Em outras palavras: aqui você deve tratar OpenAILike como o caminho suportado para LemonData, e não as classes OpenAI embutidas.

Instalação

pip install llama-index-core \
  llama-index-readers-file \
  llama-index-llms-openai-like \
  llama-index-embeddings-openai-like

Configuração básica

from llama_index.core import Settings
from llama_index.llms.openai_like import OpenAILike
from llama_index.embeddings.openai_like import OpenAILikeEmbedding

llm = OpenAILike(
    model="gpt-5.4",
    api_base="https://api.lemondata.cc/v1",
    api_key="sk-your-lemondata-key",
    is_chat_model=True,
)

embed_model = OpenAILikeEmbedding(
    model_name="text-embedding-3-small",
    api_base="https://api.lemondata.cc/v1",
    api_key="sk-your-lemondata-key",
)

Settings.llm = llm
Settings.embed_model = embed_model

Uso básico

response = llm.complete("Explain LemonData in one sentence.")
print(response.text)

Chat

from llama_index.core.llms import ChatMessage

messages = [
    ChatMessage(role="system", content="You are a helpful assistant."),
    ChatMessage(role="user", content="What is the capital of France?")
]

response = llm.chat(messages)
print(response.message.content)

Streaming

for chunk in llm.stream_complete("Write a short poem about AI."):
    print(chunk.delta, end="", flush=True)

Embeddings

vector = embed_model.get_text_embedding("Hello, world!")
print(vector[:5])

RAG com documentos

from llama_index.core import SimpleDirectoryReader, VectorStoreIndex

documents = SimpleDirectoryReader("./data").load_data()
index = VectorStoreIndex.from_documents(documents)

query_engine = index.as_query_engine()
response = query_engine.query("What is in my documents?")
print(response)

Motor de chat

chat_engine = index.as_chat_engine(chat_mode="condense_question")

response = chat_engine.chat("What is LemonData?")
print(response)

response = chat_engine.chat("How many models does it support?")
print(response)

Uso assíncrono

import asyncio

async def main():
    response = await llm.acomplete("Hello!")
    print(response.text)

asyncio.run(main())

Boas práticas

Use OpenAILike para LemonData

Prefira llama_index.llms.openai_like.OpenAILike e llama_index.embeddings.openai_like.OpenAILikeEmbedding para LemonData e outros gateways OpenAI compatíveis de terceiros.

Defina api_base explicitamente

Passe api_base="https://api.lemondata.cc/v1" diretamente no código em vez de depender de nomes antigos de variáveis de ambiente da OpenAI.

Mantenha os papéis dos modelos separados

Use modelos de chat/raciocínio para síntese e text-embedding-3-small ou text-embedding-3-large para recuperação.

Matriz de compatibilidade

Ferramentas de código

SDKs nativos

Frameworks e plataformas

Apps de chat

Visão geral

Instalação

Configuração básica

Uso básico

Chat

Streaming

Embeddings

RAG com documentos

Motor de chat

Uso assíncrono

Boas práticas

Matriz de compatibilidade

Ferramentas de código

SDKs nativos

Frameworks e plataformas

Apps de chat

​Visão geral

​Instalação

​Configuração básica

​Uso básico

​Chat

​Streaming

​Embeddings

​RAG com documentos

​Motor de chat

​Uso assíncrono

​Boas práticas

Visão geral

Instalação

Configuração básica

Uso básico

Chat

Streaming

Embeddings

RAG com documentos

Motor de chat

Uso assíncrono

Boas práticas