Nội dung yêu cầu
Model sẽ sử dụng (ví dụ:
dall-e-3, flux-pro, midjourney).Mô tả văn bản của ảnh mong muốn.
Số lượng ảnh cần tạo (1-4, phụ thuộc vào model).
Kích thước ảnh. Các tùy chọn thay đổi theo model:
- DALL-E 3:
1024x1024,1792x1024,1024x1792 - Các model khác:
512x512,1024x1024, v.v.
Chất lượng ảnh (
standard hoặc hd). Chỉ dành cho DALL-E 3.Định dạng phản hồi:
url hoặc b64_json.Phong cách cho DALL-E 3:
vivid hoặc natural.Một mã định danh duy nhất cho end-user.
Phản hồi
Phản hồi đồng bộ (DALL-E, Flux Schnell, v.v.)
Unix timestamp của thời điểm tạo.
Mảng các ảnh đã được tạo.Mỗi đối tượng bao gồm:
url(string): URL của ảnh đã tạob64_json(string): Ảnh được mã hóa Base64 (nếu được yêu cầu)revised_prompt(string): Prompt được sử dụng (DALL-E 3)
Phản hồi bất đồng bộ (Midjourney, Flux Pro, Ideogram, v.v.)
Một số model cần thời gian xử lý lâu hơn và trả về phản hồi async:Unix timestamp của thời điểm tạo.
Mã định danh tác vụ duy nhất để polling.
Trạng thái ban đầu:
pending.URL tương đối để polling kết quả (ví dụ:
/v1/tasks/{id}).Mảng chứa dữ liệu giữ chỗ.
url sẽ trống cho đến khi hoàn tất.Khi bạn nhận được
status: "pending", hãy sử dụng endpoint Get Image Status để polling kết quả.Các model khả dụng
| Model | Loại | Tính năng |
|---|---|---|
dall-e-3 | Đồng bộ | Chất lượng tốt nhất, cải thiện prompt |
dall-e-2 | Đồng bộ | Nhanh hơn, tiết kiệm chi phí hơn |
flux-pro | Bất đồng bộ | Siêu thực, chất lượng cao |
flux-schnell | Đồng bộ | Rất nhanh |
midjourney | Bất đồng bộ | Phong cách nghệ thuật |
ideogram-v3 | Bất đồng bộ | Kết xuất văn bản tốt nhất |
stable-diffusion-3 | Đồng bộ | Mã nguồn mở, có thể tùy chỉnh |
Xử lý phản hồi async
Đối với các model async, hãy kiểm tra xem phản hồi có chứastatus: "pending" hay không: