Saltar para o conteúdo principal

Visão geral

Traduz áudio em qualquer idioma suportado para texto em inglês. Diferentemente da transcrição, este endpoint sempre retorna texto em inglês, independentemente do idioma de entrada.

Corpo da requisição

file
file
obrigatório
O arquivo de áudio a ser traduzido. Formatos suportados: flac, mp3, mp4, mpeg, mpga, m4a, ogg, wav, webm. O tamanho máximo do arquivo é 25 MB.
model
string
padrão:"whisper-1"
O model a ser usado. Atualmente, apenas whisper-1 é suportado.
prompt
string
Um texto opcional para orientar o estilo do model ou continuar um segmento anterior. Deve estar em inglês.
response_format
string
padrão:"json"
O formato da saída. Opções: json, text, srt, verbose_json, vtt.
temperature
number
A temperatura de sampling, entre 0 e 1. Valores mais altos, como 0.8, produzem uma saída mais aleatória, enquanto valores mais baixos, como 0.2, tornam a saída mais focada e determinística.

Resposta

text
string
O texto traduzido em inglês.
Para o formato verbose_json, a resposta também inclui:
language
string
O idioma detectado do áudio de entrada.
duration
number
A duração do áudio de entrada em segundos.
segments
array
Segmentos do texto traduzido com timestamps.
curl -X POST "https://api.lemondata.cc/v1/audio/translations" \
  -H "Authorization: Bearer sk-your-api-key" \
  -F "file=@german_audio.mp3" \
  -F "model=whisper-1"
{
  "text": "Hello, my name is Wolfgang and I come from Germany. Where are you from?"
}

Tradução vs Transcrição

RecursoTraduçãoTranscrição
Idioma de saídaSempre inglêsIgual ao de entrada
Caso de usoConverter áudio estrangeiro para inglêsPreservar o idioma original
Parâmetro languageNão se aplicaDica opcional
O endpoint de tradução detecta automaticamente o idioma de origem e traduz para inglês. O parâmetro language da transcrição é ignorado.