Visão geral
Traduz áudio em qualquer idioma suportado para texto em inglês. Diferentemente da transcrição, este endpoint sempre retorna texto em inglês, independentemente do idioma de entrada.Corpo da requisição
O arquivo de áudio a ser traduzido. Formatos suportados:
flac, mp3, mp4, mpeg, mpga, m4a, ogg, wav, webm. O tamanho máximo do arquivo é 25 MB.O model a ser usado. Atualmente, apenas
whisper-1 é suportado.Um texto opcional para orientar o estilo do model ou continuar um segmento anterior. Deve estar em inglês.
O formato da saída. Opções:
json, text, srt, verbose_json, vtt.A temperatura de sampling, entre 0 e 1. Valores mais altos, como 0.8, produzem uma saída mais aleatória, enquanto valores mais baixos, como 0.2, tornam a saída mais focada e determinística.
Resposta
O texto traduzido em inglês.
verbose_json, a resposta também inclui:
O idioma detectado do áudio de entrada.
A duração do áudio de entrada em segundos.
Segmentos do texto traduzido com timestamps.
Tradução vs Transcrição
| Recurso | Tradução | Transcrição |
|---|---|---|
| Idioma de saída | Sempre inglês | Igual ao de entrada |
| Caso de uso | Converter áudio estrangeiro para inglês | Preservar o idioma original |
Parâmetro language | Não se aplica | Dica opcional |
O endpoint de tradução detecta automaticamente o idioma de origem e traduz para inglês. O parâmetro
language da transcrição é ignorado.