HONOR تكشف عن Magic V5 مزودًا بأحدث تقنيات الذكاء الاصطناعي للتعرف الصوتي
تمكنت HONOR من إطلاق أول نموذج لغوي صوتي كبير يعمل على الأجهزة مباشرة، محققًا طفرة غير مسبوقة في تقنيات التعرف على الكلام المتعدد اللغات والترجمة الفورية على الجهاز، ضمن الإصدارات الدولية لهاتف HONOR Magic V5، ما يفتح آفاقًا جديدة في مجال الذكاء الاصطناعي المحلي مع ضمان خصوصية المستخدم.
أفضل تقنيات التعرف على الكلام وزمن الاستجابة المنخفض على الجهاز
واجهت HONOR تحديات كبيرة في تطوير نموذج التعرف على الكلام متعدد اللغات بزمن استجابة منخفض، حيث تعتمد معظم حلول الترجمة الحالية على السحابة، مما يثير مخاوف تتعلق بالخصوصية، خصوصًا في المكالمات الحساسة؛ كما أن الحلول المحلية المتوفرة حاليًا غالبًا ما تعاني من تنازلات في الأداء والسرعة وكفاءة الذاكرة بسبب قيود الأجهزة المحمولة. لكن النموذج الجديد لهاتف HONOR Magic V5 قد تمكن من التغلب على هذه المعوقات بشكل حاسم، حيث يعمل بكفاءة تنافس السحابة، مع الحفاظ على خصوصية عالية، ما يتيح تجربة استخدام سلسة وقوية مباشرة على الجهاز نفسه.
فوائد تقنية الترجمة الفورية متعددة اللغات على أجهزة HONOR
تقدم تقنية HONOR الحديثة استهلاكًا منخفضًا جدًا للذاكرة، إذ انخفضت متطلبات الذاكرة من 3-4 جيجابايت إلى 800 ميجابايت فقط، بنسبة توفير تقارب 75% من المساحة، وذلك بفضل دمج ست حزم لغوية في حزمة واحدة تشمل العربية، الصينية، الإنجليزية، الألمانية، الفرنسية، الإسبانية، والإيطالية، مما يلغي الحاجة إلى تحميل كل لغة بشكل منفصل وحجم كل حزمة يصل إلى 500 ميجابايت؛ وبالتالي تتوفر مساحة إضافية تبلغ حوالي 2.78 جيجابايت. بالإضافة إلى ذلك، تتيح التقنية الترجمة الفورية “أثناء التحدث” دون الحاجة إلى انتظار انتهاء الجملة، مما زاد من سرعة الاستنتاج بنسبة 38% وحسن دقة الترجمة بنسبة 16%، محققًا تفاعلًا أكثر طبيعية وسلاسة.
أبحاث متقدمة معتمدة في مؤتمر INTERSPEECH 2025 تُبرز ابتكارات HONOR
تم اعتماد ورقتين بحثيتين من HONOR في مؤتمر INTERSPEECH 2025، الأول بعنوان “MFLA: Monotonic Finite Look-ahead Attention for Streaming Speech Recognition”، ناقش فيه الفريق تحديات تحقيق التعرف على الكلام بزمن استجابة منخفض على الأجهزة، من خلال دمج متنبئ يعتمد آلية التكامل والإطلاق المستمر (CIF) مع استراتيجية Wait-k، والتي تتطلب معالجة مستمرة للإشارات الصوتية بطريقة تقليل التكلفة الحسابية، حيث حول المتنبئ الإشارات الصوتية المستمرة إلى قرارات حدية مما سمح بنقل هذه الاستراتيجية بنجاح من مجال النصوص إلى الصوت. الورقة الثانية، “Novel Parasitic Dual-Scale Modeling for Efficient and Accurate Multilingual Speech Translation”، بالتعاون مع جامعة شنغهاي جياو تونغ، طرحت نموذج تسريع مبتكر للاستخدام على الأجهزة ذات الموارد المحدودة عبر تقنية الطفيلي المزدوج المقياس والعينة التخمينية، مما أدى إلى زيادة سرعة الاستنتاج بنسبة 38% دون التأثير على دقة النموذج، مؤكدة قدرة HONOR على تقديم حلول ذكاء اصطناعي عالية الأداء مباشرة على الإنترنت.
تعكس هذه الإنجازات التزام HONOR العميق بدفع حدود تكنولوجيا الذكاء الاصطناعي على الأجهزة، وتحقيق توازن مثالي بين الأداء العالي والخصوصية، ما يمنح المستخدمين تجارب تكنولوجية متقدمة وأكثر ذكاءً دون الحاجة للاعتماد على البنية السحابية.