
تستعد الشركة الصينية ، Deepseek ، لإجراء تحول جديد في مجال الذكاء الاصطناعي من خلال تطوير نماذج يمكنها تحسين أدائها ، من أجل تقليل الاعتماد على الموارد الضخمة المطلوبة للنماذج التقليدية.
وفقًا لورقة بحثية نُشرت مؤخرًا بالتعاون مع الجامعة الصينية في Tsinghua ، طور باحثو Deepseek مقاربة جديدة تعرف باسم “SPC” ، والتي تعد جزءًا من تقنية أوسع تسمى “GRM). ويستند هذا النهج إلى مبدأ حلقي ، حيث يطلق على الخوارزمية الداخلية التي تسمى” القاضي “تسمى الإجابات الناتجة عن النما النموذج 在隨後的重複中。
وقال ديبسيك إن هذا النهج يمكن أن يسمح بتدريب أكثر كفاءة دون توسيع حجم النموذج بشكل كبير أو الاعتماد القوي على التعليقات البشرية. تظهر نتائج الأداء الأولية أن تفوق النموذج الجديد في بعض النماذج الرائدة في السوق يسمى Deepseek-GRM ، على سبيل المثال
Gemini
و
Llama
و
GPT-4o
، وفقا للاختبار القياسي المذكور في الورقة.
على الرغم من الطبيعة المفتوحة للنموذج ، فإن فكرة “يمكن أن تحسن ذكائها الاصطناعي” أثارت مناقشة واسعة النطاق في مجتمع التكنولوجيا. قال إريك شميدت ، الرئيس التنفيذي السابق لشركة Google ، إن هذا النوع من النظام قد يتطلب “زر إيقاف” ، محذراً من أن قدرة اللوائح “على ضبط أدائها دون إشراف بشري مباشر ، يمثل تحديات أخلاقية وأمنية.
إن مفهوم التحسين الذاتي هو فكرة قديمة نسبيًا اقترحها الرياضي البريطاني I. G. Goud في الستينيات وتوسيع خبراء آدان (مثل Eser Yudkovsky) لاحقًا. اليوم ، تتطلع الشركات الكبرى مثل MITA و Google و IBM إلى تطوير تقنيات مماثلة ، بما في ذلك النماذج التي توفر أنفسهم مكافآت أثناء التدريب ، أو الخوارزميات التي تقيم إجاباتها الخاصة.
على الرغم من تسارع التقدم ، يحذر الباحثون من أن ظاهرة تسمى “تحطم النموذج” والتي تحدث عند تدريب نفس النموذج على البيانات الاصطناعية التي قد تكون غير دقيقة أو غير كافية ، والتي يمكن أن تؤدي إلى تدهور الأداء بمرور الوقت.