请求体
要使用的模型(例如:
dall-e-3、flux-pro、midjourney)。所需图像的文本描述。
要生成的图像数量(1-4,取决于模型)。
图像尺寸。选项因模型而异:
- DALL-E 3:
1024x1024、1792x1024、1024x1792 - 其他模型:
512x512、1024x1024等。
图像质量(
standard 或 hd)。仅限 DALL-E 3。响应格式:
url 或 b64_json。DALL-E 3 的风格:
vivid 或 natural。终端用户的唯一标识符。
响应
内联响应
创建时的 Unix 时间戳。
生成的图像数组。每个对象包含:
url(string):生成的图像 URLb64_json(string):Base64 编码的图像(如果请求)revised_prompt(string):使用的提示词(DALL-E 3)
异步任务响应
某些图像模型会立即返回异步任务,而某些模型可能会根据路由的提供商路径表现为内联或基于任务。当响应包含status: "pending" 时,请将其视为异步任务响应:
在提供
poll_url 时,请准确使用它。将 task_id 视为后续轮询的异步任务标识。创建时的 Unix 时间戳。
用于轮询的唯一任务标识符。
初始状态:
pending。用于轮询结果的相对 URL(例如:
/v1/tasks/{id})。包含占位符数据的数组。在完成之前,
url 将为空。当您收到
status: "pending" 时,请使用 获取图像状态 接口来轮询结果。可用模型
| 模型 | 类型 | 特性 |
|---|---|---|
dall-e-3 | 通常为内联 | 最佳质量,提示词增强 |
dall-e-2 | 通常为内联 | 更快速,更经济 |
flux-pro | 通常基于任务 | 照片级真实感,高质量 |
flux-schnell | 通常为内联 | 非常快速 |
midjourney | 通常基于任务 | 艺术风格 |
ideogram-v3 | 通常基于任务 | 最佳文本渲染 |
stable-diffusion-3 | 通常为内联 | 开源,可定制 |
处理基于任务的响应
对于图像模型,请始终检查响应是否包含status: "pending":