اقتحم مختبر الذكاء الاصطناعي الصيني DeepSeek الوعي السائد هذا الأسبوع بعد أن ارتفع تطبيق chatbot الخاص به إلى قمة مخططات Apple App Store (و Google Play أيضا).
أدت نماذج الذكاء الاصطناعي الخاصة ب DeepSeek ، والتي تم تدريبها باستخدام تقنيات فعالة في الحوسبة ، إلى تساؤل محللي وول ستريت – والتقنيين – عما إذا كان بإمكان الولايات المتحدة الحفاظ على ريادتها في سباق الذكاء الاصطناعي وما إذا كان الطلب على رقائق الذكاء الاصطناعي سيستمر.
ولكن من أين أتت DeepSeek ، وكيف ارتفعت إلى الشهرة الدولية بهذه السرعة؟
أصول متداول DeepSeek
DeepSeek مدعوم من قبل High-Flyer Capital Management ، وهو صندوق تحوط كمي صيني يستخدم الذكاء الاصطناعي لإبلاغ قرارات التداول الخاصة به.
شارك ليانغ وينفنغ ، المتحمس لمهارات الذكاء الاصطناعي ، في تأسيس High-Flyer في عام 2015.
أطلق Wenfeng ، الذي ورد أنه بدأ الانخراط في التداول عندما كان طالبا في جامعة Zhejiang ، High-Flyer Capital Management كصندوق تحوط في عام 2019 يركز على تطوير ونشر خوارزميات الذكاء الاصطناعي.
في عام 2023 ، بدأت High-Flyer DeepSeek كمختبر مخصص للبحث عن أدوات الذكاء الاصطناعي المنفصلة عن أعمالها المالية. مع High-Flyer كأحد مستثمريها ، انفصل المختبر إلى شركته الخاصة ، والتي تسمى أيضا DeepSeek.
منذ اليوم الأول ، قامت DeepSeek ببناء مجموعات مراكز البيانات الخاصة بها للتدريب على النماذج. ولكن مثل شركات الذكاء الاصطناعي الأخرى في الصين ، تأثرت DeepSeek بحظر التصدير الأمريكي على الأجهزة.
لتدريب أحد أحدث طرازاتها ، اضطرت الشركة إلى استخدام رقائق Nvidia H800 ، وهي نسخة أقل قوة من شريحة ، H100 ، متاحة للشركات الأمريكية.
يقال إن الفريق الفني ل DeepSeek يميل إلى الشباب. وبحسب ما ورد تقوم الشركة بتوظيف باحثي الدكتوراه في الذكاء الاصطناعي من أفضل الجامعات الصينية.
توظف DeepSeek أيضا أشخاصا ليس لديهم أي خلفية في علوم الكمبيوتر لمساعدة تقنيتها على فهم مجموعة واسعة من الموضوعات بشكل أفضل ، وفقا لصحيفة نيويورك تايمز.
نماذج DeepSeek القوية
كشفت DeepSeek النقاب عن مجموعتها الأولى من النماذج – DeepSeek Coder و DeepSeek LLM و DeepSeek Chat – في نوفمبر 2023.
لكن لم تبدأ صناعة الذكاء الاصطناعي في الانتباه إلا في الربيع الماضي ، عندما أصدرت الشركة الناشئة الجيل التالي من عائلة طرازات DeepSeek-V2.
كان أداء DeepSeek-V2 ، وهو نظام لتحليل النصوص والصور للأغراض العامة ، جيدا في العديد من معايير الذكاء الاصطناعي – وكان أرخص بكثير في التشغيل من النماذج المماثلة في ذلك الوقت.
أجبرت منافسة DeepSeek المحلية ، بما في ذلك ByteDance و Alibaba ، على خفض أسعار الاستخدام لبعض طرازاتها ، وجعل البعض الآخر مجانيا تماما.
DeepSeek-V3 ، الذي تم إطلاقه في ديسمبر 2024 ، أضاف فقط إلى سمعة DeepSeek.
وفقا لاختبار المعيار الداخلي ل DeepSeek ، يتفوق DeepSeek V3 على كل من النماذج القابلة للتنزيل والمتوفرة بشكل مفتوح مثل Meta’s Llama والنماذج “المغلقة” التي لا يمكن الوصول إليها إلا من خلال واجهة برمجة التطبيقات ، مثل GPT-4o من OpenAI.
مثير للإعجاب بنفس القدر هو نموذج “التفكير” R1 من DeepSeek. تم إصدار DeepSeek في يناير ، وتدعي أن R1 يعمل بالإضافة إلى نموذج OpenAI o1 على المعايير الرئيسية.
نظرا لكونه نموذجا منطقيا ، فإن R1 يتحقق من الحقائق بشكل فعال ، مما يساعده على تجنب بعض المزالق التي عادة ما تتعثر في النماذج.
تستغرق نماذج التفكير وقتا أطول قليلا – عادة من ثوان إلى دقائق أطول – للوصول إلى حلول مقارنة بنموذج نموذجي غير منطقي. الجانب الإيجابي هو أنها تميل إلى أن تكون أكثر موثوقية في مجالات مثل الفيزياء والعلوم والرياضيات.
ومع ذلك ، هناك جانب سلبي لطرازات R1 و DeepSeek V3 و DeepSeek الأخرى. نظرا لكونها الذكاء الاصطناعي المطورة في الصين ، فإنها تخضع لمعايير من قبل منظم الإنترنت في الصين للتأكد من أن استجاباتها “تجسد القيم الاشتراكية الأساسية”.
في تطبيق روبوت الدردشة الخاص ب DeepSeek ، على سبيل المثال ، لن يجيب R1 على أسئلة حول ميدان تيانانمين أو استقلالية تايوان.
نهج تخريبي
إذا كان لدى DeepSeek نموذج عمل ، فليس من الواضح ما هو هذا النموذج بالضبط. تقوم الشركة بأسعار منتجاتها وخدماتها بأقل بكثير من القيمة السوقية – وتعطي الآخرين مجانا.
بالطريقة التي تخبرها بها DeepSeek ، مكنتها اختراقات الكفاءة من الحفاظ على القدرة التنافسية القصوى من حيث التكلفة. ومع ذلك ، يشكك بعض الخبراء في الأرقام التي قدمتها الشركة.
مهما كانت الحالة ، فقد انتقل المطورون إلى نماذج DeepSeek ، وهي ليست مفتوحة المصدر حيث يتم فهم العبارة بشكل شائع ولكنها متاحة بموجب تراخيص متساهلة تسمح بالاستخدام التجاري.
وفقا ل Clem Delangue ، الرئيس التنفيذي لشركة Hugging Face ، إحدى المنصات التي تستضيف نماذج DeepSeek ، أنشأ المطورون على Hugging Face أكثر من 500 نموذج “مشتق” من R1 حصدت 2.5 مليون عملية تنزيل مجتمعة.
تم وصف نجاح DeepSeek ضد المنافسين الأكبر والأكثر رسوخا بأنه “قلب الذكاء الاصطناعي” و “المبالغة فيه”. كان نجاح الشركة مسؤولا جزئيا على الأقل عن التسبب في انخفاض سعر سهم Nvidia بنسبة 18٪ في يناير ، وإثارة استجابة عامة من الرئيس التنفيذي لشركة OpenAI Sam Altman.
أعلنت Microsoft أن DeepSeek متاح على خدمة Azure الذكاء الاصطناعي Foundry ، وهي منصة Microsoft التي تجمع خدمات الذكاء الاصطناعي للمؤسسات تحت شعار واحد.
عندما سئل عن تأثير DeepSeek على إنفاق Meta على الذكاء الاصطناعي خلال مكالمة أرباح الربع الأول ، قال الرئيس التنفيذي مارك زوكربيرج إن الإنفاق على البنية التحتية الذكاء الاصطناعي سيظل “ميزة استراتيجية” لشركة Meta.
خلال مكالمة أرباح Nvidia في الربع الرابع ، أكد الرئيس التنفيذي جنسن هوانغ على “الابتكار الممتاز” لشركة DeepSeek ، قائلا إنها ونماذج “المنطق” الأخرى رائعة ل Nvidia لأنها تحتاج إلى المزيد من الحوسبة.
في الوقت نفسه ، تحظر بعض الشركات DeepSeek ، وكذلك دول وحكومات بأكملها ، بما في ذلك كوريا الجنوبية. كما حظرت ولاية نيويورك استخدام DeepSeek على الأجهزة الحكومية.
أما بالنسبة لما قد يخبئه مستقبل DeepSeek ، فليس من الواضح. النماذج المحسنة أمر مفروغ منه. لكن يبدو أن الحكومة الأمريكية تشعر بالقلق مما تعتبره تأثيرا أجنبيا ضارا. في مارس ، ذكرت صحيفة وول ستريت جورنال أن الولايات المتحدة ستحظر على الأرجح DeepSeek على الأجهزة الحكومية.
المصدر: techcrunch