Saltar al contenido principal
La Responses API es la API de conversación con estado más reciente de OpenAI. LemonData admite este formato como una vía opcional avanzada para modelos compatibles; use POST /v1/chat/completions como la ruta predeterminada compatible con OpenAI a menos que necesite explícitamente el comportamiento específico de Responses.

Request Body

model
string
requerido
ID del modelo a usar. Vea Modelos para las opciones disponibles.
input
array
requerido
Una lista de elementos de entrada que componen la conversación.Cada elemento puede ser:
  • message: Un mensaje de la conversación con role y content
  • function_call: Una solicitud de llamada a función
  • function_call_output: Salida de una llamada a función
Para entrada multimodal, message.content puede ser una cadena de texto simple o un arreglo de bloques de contenido. Para modelos con capacidad de imágenes, como las variantes GPT-5.4, pase las imágenes como bloques input_image en lugar de incrustar URLs o cadenas Base64 directamente en texto plano.Ejemplos de bloques de contenido:
  • { "type": "input_text", "text": "Describe this image" }
  • { "type": "input_image", "image_url": "https://example.com/image.jpg" }
  • { "type": "input_image", "image_url": "data:image/png;base64,..." }
instructions
string
Instrucciones del sistema para el modelo (equivalente al mensaje del sistema).
max_output_tokens
integer
Número máximo de tokens a generar.
temperature
number
predeterminado:"1"
Temperatura de muestreo entre 0 y 2.
tools
array
Una lista de herramientas que el modelo puede invocar.
stream
boolean
predeterminado:"false"
Si es true, devuelve un flujo de eventos.
previous_response_id
string
ID de una respuesta previa desde la cual continuar la conversación.
store
boolean
predeterminado:"true"
Si se debe almacenar la respuesta para recuperación posterior.
metadata
object
Metadatos para adjuntar a la respuesta con fines de seguimiento.
text
object
Opciones de configuración de generación de texto. El comportamiento de text.format depende del modelo seleccionado y de la ruta enrutada; no está garantizado de forma uniforme en todos los modelos.
parallel_tool_calls
boolean
predeterminado:"true"
Si se permiten múltiples llamadas a herramientas en paralelo.
top_p
number
Parámetro de muestreo por núcleo (nucleus sampling) (0-1).
reasoning
object
Configuración de razonamiento para modelos con capacidades de razonamiento, como las variantes de la familia GPT-5.
  • effort (string): Nivel de esfuerzo de razonamiento (low, medium, high)

Response

id
string
Identificador único de la respuesta.
object
string
Siempre response.
created
integer
Marca de tiempo Unix de cuando se creó la respuesta.
output
array
Lista de elementos de salida generados por el modelo.
usage
object
Estadísticas de uso de tokens.
curl -X POST "https://api.lemondata.cc/v1/responses" \
  -H "Authorization: Bearer sk-your-api-key" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "gpt-4o",
    "input": [
      {"type": "message", "role": "user", "content": "Hello!"}
    ],
    "max_output_tokens": 1000
  }'
{
  "id": "resp_abc123",
  "object": "response",
  "created": 1706000000,
  "model": "gpt-4o",
  "output": [
    {
      "type": "message",
      "role": "assistant",
      "content": [
        {"type": "text", "text": "Hello! How can I help you today?"}
      ]
    }
  ],
  "usage": {
    "input_tokens": 10,
    "output_tokens": 12,
    "total_tokens": 22
  }
}