اخبار تقنية
  • وضع قراءة
  • وضع كامل
  • المقال فقط
  • اعجبنى
نموذج-deepseekv3-مفتوح-المصدر-للذكاء-الاصطناعي-يتفوق-على-llama

نموذج DeepSeek-V3 مفتوح المصدر للذكاء الاصطناعي يتفوق على Llama

  • 0 إعجاب

◾يطلق DeepSeek نموذجًا ضخمًا يحتوي على 671 مليار معلمة وكفاءة معالجة عالية

◾يتفوق هذا النموذج على المنافسين مفتوحة المصدر ويقترب من أداء النماذج المغلقة

تكاليف التدريب منخفضة نسبيًا حيث تبلغ 5.57 مليون دولار مقارنة بمئات الملايين من الدولارات للنماذج المنافسة

أعلنت شركة DeepSeek الصينية الناشئة عن إطلاق نموذج جديد للذكاء الاصطناعي، DeepSeek-V3، متاح عبر منصة Hugging Face. يعتمد النموذج بنية “هجينة متخصصة” ويقوم فقط بتنشيط معلمات محددة من بين 671 مليار معلمة لضمان معالجة المهام بدقة وكفاءة.

الميزات التقنية الرئيسية:

  • استراتيجيات موازنة التحميل المتقدمة لتوزيع العمل بين وحدات المعالجة
  • تتيح تقنية التنبؤ بالرموز المتعددة (MTP) سرعات معالجة تصل إلى 60 رمزًا في الثانية
  • قادر على التعامل مع سياقات نصية تصل إلى 128000 حرف

يتم تدريب النموذج باستخدام 14.8 تريليون قطعة من التعليمات البرمجية المتنوعة وعالية الجودة، ومن خلال استخدام تحسينات البرامج والأجهزة المتقدمة، يتم تقليل تكلفة التدريب إلى 5.57 مليون دولار، مقارنة بتكلفة التدريب البالغة 500 مليون دولار لنموذج Llama-3.1.

الأداء والمقارنة:

  • يتفوق على النماذج مفتوحة المصدر مثل Llama-3.1-405B وQwen 2.5-72B
  • أداء ممتاز في امتحانات اللغة الصينية والرياضيات، حيث حصل على درجة 90.2 في Math-500
  • وهو يقترب من أداء النماذج المغلقة، على سبيل المثال.
    GPT-4
    وكلود 3.5

هذا النموذج متاح حاليا من خلال:

  • يحتوي GitHub على كود مصدر مرخص من معهد ماساتشوستس للتكنولوجيا (MIT).
  • منصة اختبار DeepSeek Chat
  • واجهات برمجة التطبيقات لاستخدام المؤسسات بأسعار تنافسية

ويمثل هذا التطور خطوة مهمة في سد الفجوة بين النماذج مفتوحة المصدر ومغلقة المصدر، مما يوفر للمؤسسات خيارات متعددة ويمنع احتكار تقنيات الذكاء الاصطناعي.

نموذجلنموذجالنموذجالنماذجمعالجةتدريبDeepSeekدولار

اخبار تقنية
  • اخبار تقنية
  • نموذج
  • لنموذج
  • النموذج
  • النماذج
  • مقالات مشابهة
  • مقالات عشوائية
  • شائعة
  • مقالات أقدم