نظرة عامة
يقوم بترجمة الصوت من أي لغة مدعومة إلى نص باللغة الإنجليزية. على عكس عملية التفريغ الصوتي (transcription)، يقوم هذا المسار (endpoint) دائمًا بإخراج نص باللغة الإنجليزية بغض النظر عن لغة الإدخال.
جسم الطلب (Request Body)
ملف الصوت المراد ترجمته. التنسيقات المدعومة: flac، mp3، mp4، mpeg، mpga، m4a، ogg، wav، webm. الحد الأقصى لحجم الملف هو 25 ميجابايت.
model
string
افتراضي: "whisper-1"
النموذج المستخدم. حاليًا، يتم دعم whisper-1 فقط.
نص اختياري لتوجيه أسلوب النموذج أو إكمال مقطع سابق. يجب أن يكون باللغة الإنجليزية.
تنسيق المخرجات. الخيارات: json، text، srt، verbose_json، vtt.
درجة حرارة العينات (sampling temperature)، بين 0 و 1. القيم الأعلى مثل 0.8 تؤدي إلى مخرجات أكثر عشوائية، بينما القيم الأقل مثل 0.2 تجعل المخرجات أكثر تركيزًا وحتمية.
الاستجابة (Response)
النص المترجم باللغة الإنجليزية.
بالنسبة لتنسيق verbose_json، تتضمن الاستجابة أيضًا:
اللغة المكتشفة للصوت المدخل.
مدة الصوت المدخل بالثواني.
مقاطع من النص المترجم مع طوابع زمنية.
cURL
Python
JavaScript
Go
PHP
curl -X POST "https://api.lemondata.cc/v1/audio/translations" \
-H "Authorization: Bearer sk-your-api-key" \
-F "file=@german_audio.mp3" \
-F "model=whisper-1"
{
"text" : "Hello, my name is Wolfgang and I come from Germany. Where are you from?"
}
الترجمة مقابل التفريغ الصوتي (Translation vs Transcription)
الميزة الترجمة (Translation) التفريغ الصوتي (Transcription) لغة المخرجات دائمًا الإنجليزية نفس لغة الإدخال حالة الاستخدام تحويل الصوت الأجنبي إلى الإنجليزية الحفاظ على اللغة الأصلية معلمة اللغة (language) غير قابلة للتطبيق تلميح اختياري
يقوم مسار الترجمة (translation endpoint) تلقائيًا باكتشاف لغة المصدر والترجمة إلى الإنجليزية. يتم تجاهل معلمة language المستخدمة في التفريغ الصوتي.