أطلقت Alibaba نموذج الذكاء الاصطناعي Qwen3-Next الأكثر كفاءة
أفادت Jinse Finance أن Tongyi Qianwen، التابعة لشركة Alibaba، أطلقت الجيل التالي من بنية النماذج الأساسية Qwen3-Next، وقامت بإتاحة سلسلة النماذج Qwen3-Next-80B-A3B المبنية على هذه البنية كمصدر مفتوح. بالمقارنة مع بنية نموذج MoE في Qwen3، تم إجراء التحسينات الأساسية التالية: آلية انتباه هجينة، بنية MoE عالية التفرع، سلسلة من التحسينات التي تعزز استقرار التدريب، وآلية التنبؤ بعدة رموز لتحسين كفاءة الاستدلال. استنادًا إلى بنية نموذج Qwen3-Next، قامت Alibaba بتدريب نموذج Qwen3-Next-80B-A3B-Base، الذي يحتوي على 80 مليار معلمة مع تفعيل 3 مليارات فقط منها. يحقق هذا النموذج الأساسي أداءً مماثلاً أو حتى أفضل قليلاً من نموذج Qwen3-32B dense، بينما تبلغ تكلفة تدريبه (ساعات GPU) أقل من عُشر تكلفة Qwen3-32B، ويحقق معدل استدلال أعلى بأكثر من عشرة أضعاف في سياقات تتجاوز 32k، مما يوفر فعالية قصوى من حيث التكلفة في التدريب والاستدلال.
إخلاء المسؤولية: يعكس محتوى هذه المقالة رأي المؤلف فقط ولا يمثل المنصة بأي صفة. لا يُقصد من هذه المقالة أن تكون بمثابة مرجع لاتخاذ قرارات الاستثمار.
You may also like
قام عنوان معين ببيع 57.38 WBTC على السلسلة، بقيمة تقارب 6.517 مليون دولار أمريكي
Trending news
المزيدأسعار العملات المشفرة
المزيد








