Documentation Index
Fetch the complete documentation index at: https://docs.lemondata.cc/llms.txt
Use this file to discover all available pages before exploring further.
リクエストボディ
同期リクエストのタイムアウト: この非チャットエンドポイントは、ルーティング先モデルの処理完了を待ちます。大きな入力、長い音声、大きなバッチは一般的な 30s のクライアント既定値を超えることがあるため、HTTP クライアントのタイムアウトは少なくとも120s に設定してください。
文字起こしする音声ファイル。対応形式: flac, mp3, mp4, mpeg, mpga, m4a, ogg, wav, webm。
使用するモデル。現在は
whisper-1 のみサポートされています。ISO-639-1 形式の音声言語(例:
en, zh, ja)。モデルのスタイルを誘導したり、前のセグメントの続きを生成したりするための任意のテキスト。
出力形式:
json, text, srt, verbose_json, vtt。サンプリング温度(0 から 1)。
タイムスタンプの粒度:
word および/または segment。verbose_json が必要です。レスポンス
文字起こしされたテキスト。
verbose_json の場合:
常に
transcribe。検出された言語。
音声の長さ(秒)。
タイムスタンプ付きの文字起こしセグメント。
単語レベルのタイムスタンプ(要求された場合)。