الانتقال إلى المحتوى الرئيسي

نظرة عامة

يترجم الصوت بأي لغة مدعومة إلى نص باللغة الإنجليزية. بخلاف النسخ، تقوم نقطة النهاية هذه دائمًا بإخراج نص باللغة الإنجليزية بغض النظر عن لغة الإدخال.

نص الطلب

file
file
مطلوب
ملف الصوت المراد ترجمته. التنسيقات المدعومة: flac, mp3, mp4, mpeg, mpga, m4a, ogg, wav, webm. الحد الأقصى لحجم الملف هو 25 MB.
model
string
افتراضي:"whisper-1"
النموذج المراد استخدامه. حاليًا، النموذج المدعوم الوحيد هو whisper-1.
prompt
string
نص اختياري لتوجيه أسلوب النموذج أو لمتابعة مقطع سابق. يجب أن يكون باللغة الإنجليزية.
response_format
string
افتراضي:"json"
تنسيق المخرجات. الخيارات: json, text, srt, verbose_json, vtt.
temperature
number
درجة حرارة أخذ العينات، بين 0 و1. القيم الأعلى مثل 0.8 تنتج مخرجات أكثر عشوائية، بينما القيم الأقل مثل 0.2 تجعل المخرجات أكثر تركيزًا وحتمية.

الاستجابة

text
string
النص المترجم باللغة الإنجليزية.
بالنسبة إلى تنسيق verbose_json، تتضمن الاستجابة أيضًا:
language
string
اللغة المكتشفة للصوت المُدخل.
duration
number
مدة الصوت المُدخل بالثواني.
segments
array
مقاطع من النص المترجم مع الطوابع الزمنية.
curl -X POST "https://api.lemondata.cc/v1/audio/translations" \
  -H "Authorization: Bearer sk-your-api-key" \
  -F "file=@german_audio.mp3" \
  -F "model=whisper-1"
{
  "text": "Hello, my name is Wolfgang and I come from Germany. Where are you from?"
}

الترجمة مقابل النسخ

الميزةالترجمةالنسخ
لغة المخرجاتالإنجليزية دائمًانفس لغة الإدخال
حالة الاستخدامتحويل الصوت الأجنبي إلى الإنجليزيةالحفاظ على اللغة الأصلية
معلمة اللغةغير قابلة للتطبيقتلميح اختياري
تقوم نقطة نهاية الترجمة تلقائيًا باكتشاف لغة المصدر وترجمتها إلى الإنجليزية. يتم تجاهل المعلمة language الخاصة بالنسخ.