リクエストボディ
使用するモデル(例:
dall-e-3、flux-pro、midjourney)。生成したい画像の説明テキスト。
生成する画像の数(1〜4、モデルに依存)。
画像サイズ。オプションはモデルによって異なります:
- DALL-E 3:
1024x1024、1792x1024、1024x1792 - その他のモデル:
512x512、1024x1024など。
画質(
standard または hd)。DALL-E 3のみ。レスポンス形式:
url または b64_json。DALL-E 3のスタイル:
vivid または natural。エンドユーザーの一意識別子。
レスポンス
インラインレスポンス
作成時のUnixタイムスタンプ。
生成された画像の配列。各オブジェクトに含まれるもの:
url(string): 生成された画像のURLb64_json(string): Base64エンコードされた画像(リクエストされた場合)revised_prompt(string): 使用されたプロンプト(DALL-E 3)
非同期タスクレスポンス
一部の画像モデルは即座に非同期タスクを返し、ルーティングされたプロバイダーのパスに応じてインラインまたはタスクベースのいずれかとして動作する場合があります。レスポンスにstatus: "pending" が含まれている場合は、非同期タスクレスポンスとして扱ってください:
poll_url が提供されている場合は、そのまま使用してください。後続のポーリングには task_id を非同期タスクの識別子として使用します。作成時のUnixタイムスタンプ。
ポーリング用の一意のタスク識別子。
初期ステータス:
pending。結果をポーリングするための相対URL(例:
/v1/tasks/{id})。プレースホルダーデータを含む配列。完了するまで
url は空になります。status: "pending" を受け取った場合は、Get Image Status エンドポイントを使用して結果をポーリングしてください。利用可能なモデル
| モデル | タイプ | 特徴 |
|---|---|---|
dall-e-3 | 通常はインライン | 最高品質、プロンプト補正 |
dall-e-2 | 通常はインライン | 高速、より手頃な価格 |
flux-pro | 多くの場合タスクベース | フォトリアル、高品質 |
flux-schnell | 通常はインライン | 非常に高速 |
midjourney | 多くの場合タスクベース | 芸術的なスタイル |
ideogram-v3 | 多くの場合タスクベース | 最高のテキストレンダリング |
stable-diffusion-3 | 通常はインライン | オープンソース、カスタマイズ可能 |
タスクベースのレスポンスの処理
画像モデルの場合、レスポンスにstatus: "pending" が含まれているかどうかを常に確認してください: