أخبار الآن |  dailymail

تختبر شركة غوغل خدمة جديدة، وهي خدمة “ترانسلاتوترون” Translatotron لترجمة الكلام الشفاهي مباشرةً، ما يلغي الحاجة للنص.
وفي هذا الصدد، قالت عملاقة التقنية الأمريكية أن “Translatotron هو أول نموذج قائم على طرفين يستطيع مباشرةً ترجمة الكلام من لغة إلى أخرى مشافهةً”
وأضافت غوغل أنه هناك ثلاث مراحل لأنظمة الترجمة في الوقت الراهن، وهي: التعرف التلقائي على الكلام، الذي يحول الكلام إلى نص، والترجمة الآلية، التي تترجم النص إلى لغة أخرى، ومرحلة تحويل النص إلى كلام.

 

وأوضحت غوغل أن Translatotron يستخدم الصور الطيفية، ويولد صوراً طيفية أخرى، ويعتمد أيضاً على مشفر صوتي عصبي، ومشفر لإخراج الصوت، ما يحفظ الخصائص الصوتية للمتحدث عند الترجمة.
وأشارت الشركة إلى أن تنظيم هذه الخطوات المتتالية أدى إلى تطوير خدمات، مثل “مترجم غوغل”، والآن تنوي الشركة استخدام نموذج واحد يتجنب تقسيم المهمة إلى مراحل منفصلة، والاستغناء عن النص في الترجمة، ما يعني سرعة أعلى وأخطاءً أقل.

مصدر الصورة: Storyblocks

للمزيد:

تعاون مشترك بين سوني ومايكروسوفت في مجال ألعاب الفيديو

لأول مرة.. شاحنة بدون سائق على طرقات السويد (فيديو)