آخر الأخبار

DeepSeek تطلق تحديثًا جديدًا لنموذج الذكاء الاصطناعي الصيني


 أعلنت الشركة الصينية الناشئة DeepSeek عن إطلاق تحديث جديد لنموذجها التجريبي DeepSeek-V3.1-Exp، واصفةً هذه الخطوة بأنها تمهيد لجيل جديد من تقنيات الذكاء الاصطناعي.

وقالت الشركة التي تتخذ من هانغتشو مقرًا لها عبر صفحتها على منصة Hugging Face إن الإصدار الجديد يعتمد تقنية مبتكرة أطلقت عليها اسم DeepSeek Sparse Attention، مشيرةً إلى أن هذا التحديث يمثل مرحلة وسيطة في تطوير بنيتها المعمارية القادمة. وأضافت أنها تتعاون مع شركات تصنيع الرقائق الصينية لدعم هذا المشروع وتعزيز قدراته التقنية.

ويأتي هذا التحديث بعد نجاح نموذجها السابق R1 الذي جذب اهتمام وادي السيليكون بقدراته المتقدمة مطلع هذا العام، ويهدف الإصدار الجديد إلى تحسين كفاءة التدريب وتشغيل النماذج عند معالجة النصوص الطويلة، من خلال آلية جديدة تسرّع الاستجابة وتقلل استهلاك الموارد بشكل ملحوظ.

وفي إطار خطط زيادة انتشار أدواتها، أعلنت DeepSeek خفض أسعار واجهات برمجة التطبيقات API الخاصة بها بنسبة تتجاوز خمسين في المئة، لتصبح أكثر جاذبية للمستخدمين، مع الحفاظ على نسخة V3.1-Terminus متاحة للتجربة عبر واجهة مؤقتة حتى منتصف أكتوبر القادم.

وأشارت شركة هواوي الصينية الرائدة في رقائق الذكاء الاصطناعي إلى أن منتجاتها ستدعم التحديث الجديد من DeepSeek، ما يعكس تعزيز التكامل بين الشركات الصينية في هذا القطاع الاستراتيجي.

ويعمل أحدث إصدار من نماذج DeepSeek على دعم معمارية FP8 التي توفر سرعة وكفاءة أعلى في استهلاك الذاكرة، ما يجعله مناسبًا لتشغيل النماذج الكبيرة على عتاد محدود، بينما تدعم المنصة أيضًا صيغة BF16 التي تمنح دقة أعلى في تدريب النماذج، ما يعكس تركيز DeepSeek على توفير أدوات مرنة وفعالة لتطوير تقنيات الذكاء الاصطناعي الحديثة.

التعليقات

أحدث أقدم

نستخدم ملفات تعريف الارتباط لضمان حصولك على أفضل تجربة.