تتحدى MosaicML OpenAI بنموذجها اللغوي الجديد مفتوح المصدر

أعلنت شركة MosaicML ، وهي شركة ناشئة في مجال الذكاء الاصطناعي (AI) مقرها في سان فرانسيسكو، اليوم عن إطلاق نموذجها اللغوي الرائد، MPT-30B.
يعد النموذج الجديد، الذي تم تدريبه بجزء بسيط من تكلفة منافسيه، بإحداث ثورة في مجال الذكاء الاصطناعي في تطبيقات المؤسسة.
قال نافين راو، الرئيس التنفيذي والشريك المؤسس لشركة MosaicML ، في مقابلة مع VentureBeat ، إن MPT-30B تم تدريبه بتكلفة 700000 دولار، أي أقل بكثير من عشرات الملايين من الدولارات المطلوبة لتدريب GPT-3.
يمكن أن تجعل التكلفة المنخفضة والحجم الأصغر لـ MPT-30B أكثر جاذبية للمؤسسات التي تتطلع إلى نشر نماذج معالجة اللغة الطبيعية (NLP) في تطبيقات مثل أنظمة الحوار وإكمال التعليمات البرمجية وتلخيص النص.
قال راو: “تضيف MPT-30B قدرات أفضل للتلخيص ووضع المزيد من البيانات في الموجه ووجود سبب [النموذج] على تلك البيانات”.
“لذا، إذا كان هذا مطلبًا بالنسبة لك، فأنت لا تهتم كثيرًا باقتصاديات الخدمة، فربما يكون 30B أكثر ملاءمة [من نموذج 7B الخاص بنا].”
قال راو إن MosaicML استخدم تقنيات مختلفة لتحسين النموذج، مثل آليات Alibi و FlashAttention التي تتيح أطوال السياق الطويلة والاستخدام العالي لحسابات GPU.
وقال أيضًا إن MosaicML كان أحد المختبرات القليلة التي لديها إمكانية الوصول إلى وحدات معالجة الرسومات Nvidia H100، مما أدى إلى زيادة الإنتاجية لكل وحدة معالجة رسومات بما يزيد عن 2.4 مرة وأدى إلى وقت إنهاء أسرع.
قال راو: “نريد أن نجعل أكبر عدد ممكن من الناس على التكنولوجيا”. “هذا هدفنا. لا يجب أن تكون حصرية. لا يجب أن تكون نخبويًا. إنها لجعل المزيد من الناس يستخدمون هذا “.
تمكين الشركات من بناء نماذج مخصصة بسعر أرخص
يسمح MosaicML للشركات بتدريب النماذج على بياناتها الخاصة باستخدام هياكل نموذج الشركة ثم نشر النماذج من خلال واجهة برمجة تطبيقات الاستدلال الخاصة بها.
قال راو إنه بينما لم يستطع الكشف عن العديد من أمثلة العملاء بسبب السرية، استخدمت الشركات الناشئة نماذج وأدوات MosaicML لبناء واجهات لغة طبيعية وأنظمة بحث.
يسلط إصدار MosaicML لـ MPT-30B وأدوات نشر النموذج الخاصة به الضوء على هدف الشركة المتمثل في جعل الوصول إلى الذكاء الاصطناعي المتقدم أكثر سهولة، وفقًا لـ Rao.
“أعتقد أن المشكلة الكبرى هي في الحقيقة مجرد تمكين المزيد من الناس بالتكنولوجيا. وكان هذا هدفنا منذ البداية: أن نكون شفافين حقًا بشأن التكاليف والوقت والصعوبة “.
يؤدي توفر MPT-30B كنموذج مفتوح المصدر وخدمات ضبط ونشر نموذج MosaicML إلى وضع بدء التشغيل لتحدي OpenAI للهيمنة في السوق لتقنيات نموذج اللغة الكبيرة (LLM).
مع المزيد من النماذج والأدوات الأكثر تقدمًا المقرر إطلاقها في الأشهر المقبلة وفقًا لـ Rao ، فإن السباق على القيادة في الجيل القادم من الذكاء الاصطناعي.
يتضمن مستقبل الذكاء الاصطناعي العديد من LLMs المخصصة
تتمثل رؤية الشركة لمستقبل الذكاء الاصطناعي التوليدي في إنشاء أداة يمكنها مساعدة الخبراء في مختلف الصناعات، وتسريع عملهم دون استبدالهم.
وأوضح راو: “أعتقد أن المستقبل، على الأقل للسنوات الخمس المقبلة، سيكون حول اتخاذ هذه التقنيات وجعل كل شخص خبير بالفعل أفضل”.
بالإضافة إلى جعل تقنية الذكاء الاصطناعي أكثر سهولة، تركز MosaicML على تحسين جودة البيانات لتحسين أداء النموذج.
إنه يطور أدوات لمساعدة المستخدمين على طبقة البيانات الخاصة بالمجال أثناء عملية ما قبل التدريب. يضمن ذلك مزيجًا متنوعًا وعالي الجودة من البيانات، وهو أمر ضروري لبناء نماذج فعالة للذكاء الاصطناعي.
مع إصدار MPT-30B، تستعد MosaicML لإحداث تقدم كبير في صناعة الذكاء الاصطناعي، مما يوفر خيارًا أكثر قوة وبأسعار معقولة للمؤسسات.
إن تفانيها في التكنولوجيا مفتوحة المصدر وتمكين المزيد من الأشخاص باستخدام أدوات الذكاء الاصطناعي لديه القدرة على إطلاق ثروة من الابتكارات غير المستغلة، مما يجعل الذكاء الاصطناعي أحد الأصول القيمة للشركات في جميع أنحاء العالم.
مع استمرار الشركات في تبني تكنولوجيا الذكاء الاصطناعي والاستثمار فيها، يمكن أن يكون MPT-30B من MosaicML العامل الحفاز الذي يقود حقبة جديدة من حلول الذكاء الاصطناعي التي يسهل الوصول إليها والأكثر تأثيرًا في عالم الأعمال.
المصدر: venturebeat
شاهد ايضا: