لماذا يعتبر مستقبل الذكاء الاصطناعي نماذج أساس مرنة وقابلة لإعادة الاستخدام

من خلال ارتكاب الأخطاء وتصحيحها، يبدأ دماغك (الذي يتفق اللغويون على أنه متصل بتعلم اللغة) في اكتشاف أنماط في القواعد والمفردات وتسلسل الكلمات – والتي لا يمكن تطبيقها فقط لملء الفراغات، ولكن أيضًا لنقل المعنى إلى البشر الآخرين (أو أجهزة الكمبيوتر، والكلاب، وما إلى ذلك).
هذا الجزء الأخير مهم عند الحديث عما يسمى بـ “نماذج الأساس”، وهي واحدة من أهم الموضوعات (ولكن لم يتم الإبلاغ عنها) في الذكاء الاصطناعي في الوقت الحالي.
وفقًا لورقة مراجعة من عام 2021، فإن نماذج الأساس “مدربة على بيانات واسعة (تستخدم عمومًا الإشراف الذاتي على نطاق واسع) التي يمكن تكييفها مع مجموعة واسعة من المهام النهائية.”
في اللغة غير الأكاديمية، مثل الدراسة في تمارين ملء الفراغات، تتعلم النماذج الأساسية الأشياء بطريقة يمكن تطبيقها لاحقًا على مهام أخرى، مما يجعلها أكثر مرونة من نماذج الذكاء الاصطناعي الحالية.
لماذا نماذج الأساس مختلفة؟
الطريقة التي يتم بها تدريب نماذج الأساس تحل واحدة من أكبر الاختناقات في الذكاء الاصطناعي: وضع العلامات على البيانات.
عندما (لإثبات أنك لست روبوتًا)، يطلب منك موقع ويب تحديد “جميع الصور التي تحتوي على قارب”، فأنت تقوم بشكل أساسي بوضع العلامات.
يمكن بعد ذلك استخدام هذا الملصق لتغذية خوارزمية بصور القوارب حتى تتمكن، في مرحلة ما، من التعرف على القوارب بشكل موثوق من تلقاء نفسها.
هذه هي الطريقة التقليدية لتدريب نماذج الذكاء الاصطناعي؛ باستخدام البيانات المصنفة من قبل البشر. إنها عملية تستغرق وقتًا طويلاً وتتطلب من العديد من البشر تسمية البيانات.
لا تحتاج نماذج الأساس إلى هذا النوع من الملصقات. بدلاً من الاعتماد على التعليقات التوضيحية البشرية، يستخدمون طريقة ملء الفراغات والتعليقات التي يتم إنشاؤها ذاتيًا للتعلم المستمر وتحسين الأداء، دون الحاجة إلى إشراف بشري.
هذا يجعل نماذج الأساس أكثر سهولة للصناعات التي ليس لديها بالفعل مجموعة واسعة من البيانات المتاحة.
في الواقع، وفقًا لـ Dakshi Agrawal، زميل IBM وCTO في IBM AI، اعتمادًا على المجال الذي تدرب فيه نموذجًا أساسيًا، يمكن أن يكفي بضعة غيغابايت من البيانات.
قد تبدو هذه النماذج المعقدة بعيدة كل البعد عن مستخدم مثلك، لكن من شبه المؤكد أنك رأيت نموذجًا أساسيًا يعمل في وقت ما عبر الإنترنت.
ومن أشهر تلك النماذج نموذج اللغة GPT-3، والذي يمكن أن ينتج تقليدًا رائعًا، أو DALL-E، بعد تغذيته بأعمال كتّاب مشهورين، والذي ينتج صورًا مذهلة بناءً على مطالبات المستخدمين.
لكن النماذج الأساسية لا تقتصر على لغة الإنسان.
بالإضافة إلى إنشاء وسائل ترفيه جديدة، يمكن أن تساعد المرونة التي توفرها نماذج الأساس في تسريع البحث الطبي الرائد والتقدم العلمي والهندسة والعمارة وحتى البرمجة.
الخصائص الناشئة
تتميز نماذج الأساس بخاصيتين مهمتين للغاية: الظهور والتجانس.
النشوء يعني خصائص جديدة غير متوقعة تظهرها النماذج والتي لم تكن متوفرة في الأجيال السابقة. يحدث هذا عادةً عندما تنمو أحجام النموذج.
نموذج اللغة الذي يقوم بالتفكير الحسابي الأساسي هو مثال على خاصية ناشئة لنموذج غير متوقع إلى حد ما.
التجانس مصطلح معقد لنموذج يتم تدريبه على فهم اللغة الإنجليزية واستخدامها لأداء مهام مختلفة.
يمكن أن يشمل ذلك تلخيص جزء من النص، أو إخراج قصيدة بأسلوب كاتب مشهور أو تفسير أمر قدمه إنسان (نموذج اللغة GPT-3 هو مثال جيد على ذلك).
لكن النماذج الأساسية لا تقتصر على لغة الإنسان. في الجوهر، ما نقوم بتعليم الكمبيوتر القيام به هو العثور على أنماط في العمليات أو الظواهر التي يمكن تكرارها بعد ذلك في حالة معينة.
دعونا نفك ذلك بمثال. خذ الجزيئات. تملي الفيزياء والكيمياء أن الجزيئات لا يمكن أن توجد إلا في تكوينات معينة.
ستكون الخطوة التالية هي تحديد استخدام الجزيئات، مثل الأدوية. يمكن بعد ذلك تدريب النموذج الأساسي، باستخدام رزم من البيانات الطبية، لفهم كيفية تفاعل الجزيئات المختلفة (مثل الأدوية) مع جسم الإنسان عند علاج الأمراض.
بالطبع، يمكن لنماذج مثل هذه أن تثير الجدل أيضًا.
يمكن بعد ذلك استخدام هذا الفهم “لضبط” نموذج الأساس حتى يتمكن من تقديم اقتراحات بشأن الجزيء الذي قد يعمل في موقف معين.
يمكن أن يؤدي ذلك إلى تسريع البحث الطبي بشكل كبير، مما يسمح للمهنيين ببساطة أن يطلبوا من النموذج ابتكار جزيئات قد يكون لها خصائص معينة مضادة للبكتيريا، أو قد تعمل كدواء ضد فيروس معين.
ومع ذلك، كما ذكرنا، يمكن أن يؤدي هذا في بعض الأحيان إلى نتائج غير متوقعة.
في الآونة الأخيرة، وجدت مجموعة من العلماء الذين يستخدمون نموذجًا أساسيًا للذكاء الاصطناعي لاكتشاف علاجات للأمراض النادرة أنه يمكن أيضًا استخدام النموذج نفسه لاكتشاف أقوى الأسلحة الكيميائية المعروفة للبشرية.
مخاوف تأسيسية
أحد المؤشرات الصغيرة على ما يمكن أن تحققه هذه النماذج من تغيير جذري هو ظهور الشركات التي تقدم “ مولدات سريعة ‘‘، والتي تستخدم البشر للتوصل إلى مطالبات لنماذج مثل Midjourney أو DALL-E التي تنتج صورًا مثيرة للاهتمام أو دقيقة بشكل موثوق.
بالطبع، تثير مثل هذه النماذج الجدل. في الآونة الأخيرة، تحدث عدد من الفنانين ضد استخدام أعمالهم الفنية لتدريب نماذج توليد الصور.
هناك أيضًا قضية يجب طرحها حول استخدام الطاقة اللازم لتدريب نموذج واسع النطاق.
أضف إلى ذلك حقيقة أن موارد الحوسبة الكبيرة اللازمة لإنشاء نموذج أساسي تعني أن أكبر شركات التكنولوجيا في العالم فقط هي التي يمكنها تحمل تكاليف تدريبها.
ثم مرة أخرى، كما أوضح Agrawal، فإن زيادة الكفاءة في التدريب واستخدام هذه النماذج يعني أنها أصبحت في متناول المزيد من الأشخاص بوتيرة متزايدة باستمرار – مما يقلل من استهلاك الطاقة والتكاليف.
هناك مشكلة أخرى (آسف) أكثر تأسيسية في هذه النماذج وهي أن أي تحيزات أو أخطاء في النموذج الأصلي يمكن نقلها إلى أدوات مبنية عليها.
لذلك إذا تم استخدام لغة عنصرية كبيانات تدريب لنموذج لغوي، فقد يؤدي ذلك إلى بعض النتائج المسيئة وحتى دعاوى قضائية ضد الشركة المعنية.
تتمثل إحدى طرق تجنب ذلك في التخلص يدويًا من بيانات التدريب غير المرغوب فيها، ولكن هناك طريقة أخرى أكثر مستقبلية تتمثل في استخدام ما يسمى بالبيانات التركيبية.
البيانات الاصطناعية هي بيانات وهمية أساسية يتم إنشاؤها بواسطة نموذج ذكاء اصطناعي لتقليد الشيء الحقيقي، ولكن بطريقة أكثر تحكمًا.
يمكن أن يكون هذا مفيدًا لضمان أن نموذج الأساس لا يستوعب أي بيانات مسيئة أو حساسة للخصوصية أثناء عملية التعلم.
هل ستأخذ نماذج الذكاء الاصطناعي الأكثر تقدمًا وظائفنا؟
حسنًا، نعم ولا.
الطريقة التي يرى بها معظم باحثي الذكاء الاصطناعي هذه النماذج هي كأداة. تمامًا مثل المفك الكهربائي الذي يعني أن هناك حاجة لساعات أقل لتجميع هيكل خشبي، لا يزال الشخص بحاجة إلى استخدام مفك البراغي الكهربائي.
خذ نموذج مؤسسة IBM Ansible Wisdom. في محاولة لاكتشاف ما إذا كان يمكن تعليم أجهزة الكمبيوتر لبرمجة أجهزة الكمبيوتر، قام الباحثون بضبط نموذج لتوليد قصاصات التعليمات البرمجية Ansible التي كان يجب كتابتها يدويًا في السابق.
باستخدامه، يمكن للمطورين استخدام اللغة الطبيعية لمطالبة النموذج، على سبيل المثال، باقتراح التشغيل الآلي المعقول لنشر خادم ويب جديد.
يعتقد Agrawal أن هذا سيحدث ثورة كاملة في وظائف المبرمج.
سوف تتسارع دورة الابتكار بأكملها بفضل الذكاء الاصطناعي. على سبيل المثال، إذا نظرت إلى الكود، باستخدام نماذج الأساس، يصبح الترميز أسرع بكثير باستخدام الجيل الأول من نماذج الأساس.
أنا متأكد من أنها ستضاعف الإنتاجية في غضون سنوات قليلة.
أطلقت الشركة النموذج كمشروع مفتوح المصدر بالتعاون مع Red Hat، الأكثر شهرة في توزيع وصيانة نظام التشغيل مفتوح المصدر Linux.
هذا الاستخدام مشابه لمفك البراغي الكهربائي. يتطلب الأمر مهمة دنيوية ويستخدم أداة لأتمتة أجزاء منها حتى يتم تنفيذ المهمة بشكل أكثر كفاءة، مما يوفر الوقت للمطورين الذي يمكنهم استخدامه بعد ذلك لمزيد من المساعي الإبداعية.
“يمكن أن يتولى الأنشطة التي يقوم بها البشر اليوم، وسوف ينتقل البشر فقط إلى نشاط آخر.
أعتقد أن 80٪ من سكان الولايات المتحدة كانوا يعملون في الزراعة. أقل من 2٪ الآن (وفقًا لـ USDA ERS – قطاعات الزراعة والأغذية والاقتصاد) – انتقل البشر إلى أنشطة أخرى، وإلى جانب ذلك، تحسنت جودة معيشتنا، “قال أغراوال.
نماذج الأساس لديها القدرة على تغيير العديد من العمليات التي هي الآن مملة أو متكررة للبشر.
كما أنها توفر إمكانية إنشاء حلول جذرية وغير متوقعة لبعض أصعب المشكلات التي نواجهها. في الواقع، يمكن أن تعني نماذج الأساس نقلة نوعية كاملة في كيفية إنشاء المعرفة وتطبيقها.
سيكون المفتاح هو ضمان إتاحة هذه النماذج للجمهور على نطاق أوسع، مع تطبيق الضمانات الصحيحة.
المصدر: thenextweb
قد يهمك:
قالب ووردبريس GoodNews الاخباري
خطوات إنشاء موقع ويب strikingly