تجلب Databricks نماذج لغة كبيرة (LLMs) إلى SQL و MLflow 2.3

تواصل Databricks توسيع جهودها لإضفاء الطابع الديمقراطي على الذكاء الاصطناعي (AI) اليوم، حيث أعلنت عن زوج من التحديثات التكنولوجية المصممة للمساعدة في تسهيل استفادة المؤسسات من SQL واستخدامها لإجراء تحليل البيانات على نماذج اللغات الكبيرة (LLMs ) .
تتضمن التحديثات المصدر المفتوح MLflow 2.3 الذي سيجعل من السهل على المؤسسات إدارة ونشر نماذج التعلم الآلي (ML)، لا سيما النماذج القائمة على المحولات الاستضافة على Hugging Face
. MLflow هو جهد تقني يستخدم على نطاق واسع بقيادة Databricks الذي يبسط إدارة دورة حياة ML، من التجريب إلى النشر، من خلال توفير أدوات لتتبع النماذج والتعبئة والمشاركة.
تفتح Databricks أيضًا LLMs لمحللي البيانات من خلال تمكين دعم استعلامات SQL (لغة الاستعلام المهيكلة). يستخدم SQL بشكل شائع للاستعلام عن قواعد البيانات وإجراء تحليلات البيانات.
التحديثات الجديدة هي الأحدث في سلسلة جهود الذكاء الاصطناعي من Databricks في الأسابيع الأخيرة حيث تتطلع الشركة للمساعدة في تسهيل استفادة المؤسسات من الذكاء الاصطناعي.
في وقت سابق، في 24 مارس، أعلنت Databricks عن الإصدار الأولي لمشروعها المفتوح المصدر Dolly ChatGPT، والذي تمت متابعته بسرعة بعد بضعة أسابيع في 12 أبريل مع Dolly 2.0.
ستساعد تحديثات MLflow وSQL الجديدة التي تم الإعلان عنها اليوم في تعزيز Dolly، بالإضافة إلى استخدام LLMs الأخرى، من خلال تسهيل قيام المستخدمين بتنفيذ وتشغيل التكنولوجيا لمساعدة الشركات على اكتساب فوائد تجارية حقيقية من بياناتهم.
Databricks ليس فقط حول الذكاء الاصطناعي. في جوهرها، تدور الشركة حول البيانات، بعد أن صاغت مصطلح بحيرة البيانات وقدمت منصة بحيرة بيانات قائمة على السحابة استنادًا إلى تقنية دلتا ليك مفتوحة المصدر.
وفقًا لمؤسس Databricks ونائب رئيس قسم الهندسة، باتريك ويندل، تلجأ المؤسسات إلى شركته للقيام “بأشياء مثيرة للاهتمام” باستخدام البيانات.
قال ويندل لـ VentureBeat: “هناك فئتان كبيرتان من الأشياء التي يستخدمها الأشخاص بالبيانات: الأولى هي أنهم يطرحون أسئلة حول ما حدث في الماضي، لذا فهم يقومون ببعض المعالجة التحليلية”.
“الآخر هو أنهم يبنون نماذج للتنبؤ بالمستقبل، كما تعلمون، نسمي ذلك التعلم الآلي.”
الذهاب مع MLflow إلى Hugging Face
قال Wendell إن المشكلة الشائعة التي سمعتها شركته من المستخدمين حول LLMs في الماضي هي أنه على الرغم من أن النماذج قد تكون قوية، فإن كل ما يريد المستخدمون فعله حقًا هو إنشاء تطبيق ببياناتهم الخاصة.
ما يبحث عنه المستخدمون، في أغلب الأحيان، هو وسيلة للربط بين بيانات مؤسستهم وLLM بطريقة مفيدة للأعمال. هذا جزء من السبب وراء قيام Databricks ببناء Dolly وهو أيضًا أساس ما يدور حوله MLflow 2.3.
هناك مجموعة كاملة من الأشياء التي يحتاج المستخدم إلى القيام بها للبدء في تعلم الآلة لحل حالة استخدام الأعمال، بما في ذلك تجربة أنواع مختلفة من النماذج والتكوينات.
يعد اكتشاف كيفية نشر نموذج ثم التكرار بمرور الوقت جزءًا من عملية يشار إليها عادةً بسير عمل التعلم الآلي، وهو ما يوفره MLflow.
مع MLflow 2.3، قال Wendell أنه يوجد الآن دعم أصلي لتعبئة وتجميع نماذج Hugging Face بتنسيق MLflow القياسي لتسهيل نشر وبناء التطبيقات على الأشخاص.
برز Hugging Face في السنوات الأخيرة كواحد من أكثر المستودعات شيوعًا لنماذج Open-ML. وفقًا لـ Wendell، سيقلل MLflow 2.3 الآن بشكل كبير الحاجز أمام دخول المنظمات التي تتطلع إلى تشغيل LLMs، بما في ذلك نموذج Dolly الخاص بـ Databricks.
قال ويندل: “هذا [تحديث MLflow 2.3] يجعله يشير إلى حد كبير وينقر لأي شخص يريد التفكير في استخدام نماذج اللغة الكبيرة هذه كجزء من نشر MLflow”، مضيفًا أن معظم المستفيدين “يميلون إلى أن يكونوا شركات تنشر البنية التحتية لتعلم الآلة الخاصة بهم.”
يأتي SQL إلى LLMs
تُستخدم لغة استعلام SQL بشكل شائع لتحليلات البيانات، ولكن حتى الآن، لم يكن استخدام SQL بهذه السهولة جنبًا إلى جنب مع تطبيقات ML ومجموعات البيانات.
هذا هو الوضع الذي تبحث Databricks الآن عن حله.
قال ويندل: “نحن نبني بشكل أساسي القدرة في SQL للاتصال المباشر بنماذج اللغة الكبيرة هذه”.
على سبيل المثال، سيتمكن محللو البيانات من استخدام SQL مع ML لتنفيذ المهام الشائعة مثل تحليل المشاعر في مجموعة بيانات أو عمود معين ضمن مجموعة بيانات.
يمكن للمحللين أيضًا استخدام ML لتلخيص نص من مجموعة بيانات باستخدام استعلام SQL.
المصدر: venturebeat
قد يهمك: