تم تدريب نموذج Galactica AI على المعرفة العلمية، وبصق هراء معقول بشكل مثير للقلق

في وقت سابق من هذا الشهر، أعلنت Meta عن برنامج جديد للذكاء الاصطناعي يسمى Galactica : “نموذج لغوي كبير يمكنه تخزين المعرفة العلمية والجمع بينها وتفسيرها”.

تم إطلاق Galactica مع عرض توضيحي عام عبر الإنترنت، ولم يستمر سوى ثلاثة أيام قبل أن يسير في طريق ذكاء اصطناعي آخر مثل روبوت الدردشة العنصري السيئ السمعة من Microsoft .

تم تعطيل العرض التوضيحي عبر الإنترنت (على الرغم من أن رمز النموذج لا يزال متاحًا لأي شخص لاستخدامه) ، واشتكى كبير علماء الذكاء الاصطناعي الصريح في Meta من الاستجابة العامة السلبية.

إذن ما هو كل شيء عن Galactica ، وما الخطأ الذي حدث؟

ما الذي يميز Galactica؟

Galactica هو نموذج لغوي، وهو نوع من الذكاء الاصطناعي يتم تدريبه على الاستجابة للغة الطبيعية من خلال اللعب المتكرر للعبة ملء الفراغ لتخمين الكلمات.

تتعلم معظم نماذج اللغة الحديثة من النصوص المأخوذة من الإنترنت. استخدم Galactica أيضًا نصًا من الأوراق العلمية التي تم تحميلها على موقع PapersWithCode (التابع لميتا). 

سلط المصممون الضوء على المعلومات العلمية المتخصصة مثل الاستشهادات والرياضيات والكود والهياكل الكيميائية وخطوات التمرين لحل المشكلات العلمية.

تقدم ورقة ما قبل الطباعة المرتبطة بالمشروع (والتي لم تخضع بعد لمراجعة الأقران) بعض الادعاءات المثيرة للإعجاب. 

يبدو أن Galactica يتفوق على النماذج الأخرى في مشاكل مثل سرد المعادلات الشهيرة (“س: ما هي صيغة ألبرت أينشتاين الشهيرة لمعادلة الكتلة والطاقة؟ ج: E = mc²”))، أو توقع نواتج التفاعلات الكيميائية (“س: عندما يتفاعل حمض الكبريتيك مع كلوريد الصوديوم، ماذا ينتج؟ ج: NaHSO₄ + حمض الهيدروكلوريك “).

ومع ذلك، بمجرد فتح Galactica للتجارب العامة، تبع ذلك طوفان من النقد. لم يقتصر الأمر على إعادة إنتاج Galactica للعديد من مشكلات التحيز والسمية التي رأيناها في نماذج اللغة الأخرى، بل تخصصت أيضًا في إنتاج هراء علمي يبدو موثوقًا.

موثوق، ولكن خاطئ بشكل خاطئ مولد المعلومات الخاطئة

عزز البيان الصحفي لشركة Galactica قدرتها على شرح الأوراق العلمية التقنية باستخدام لغة عامة. 

ومع ذلك، سرعان ما لاحظ المستخدمون أنه على الرغم من أن التفسيرات التي يولدها تبدو موثوقة، إلا أنها غالبًا ما تكون غير صحيحة أو منحازة أو خاطئة تمامًا.

طلبنا أيضًا من Galactica شرح المفاهيم التقنية من مجالات البحث الخاصة بنا. وجدنا أنه سيستخدم جميع الكلمات الطنانة الصحيحة، ولكن أخطأ في التفاصيل الفعلية – على سبيل المثال، خلط تفاصيل الخوارزميات ذات الصلة ولكن المختلفة.

في الممارسة العملية، كان نظام Galactica يمكّن من توليد معلومات مضللة – وهذا أمر خطير على وجه التحديد لأنه ينشر لهجة وهيكل المعلومات العلمية الموثوقة. 

إذا كان المستخدم يحتاج بالفعل إلى أن يكون خبيرًا في الموضوع من أجل التحقق من دقة “ملخصات” Galactica ، فلن يكون له أي فائدة كأداة توضيحية.

في أحسن الأحوال، يمكن أن يوفر إكمالًا تلقائيًا خياليًا للأشخاص الذين لديهم بالفعل كفاءة كاملة في المجال الذي يكتبون عنه. في أسوأ الأحوال، فإنه يهدد بمزيد من تآكل ثقة الجمهور في البحث العلمي.

مجرة من (العلم) العميقة المزيفة

يمكن لـ Galactica أن تسهل على الجهات الفاعلة السيئة إنتاج أوراق علمية مزيفة أو احتيالية أو مسروقة على نطاق واسع. هذا لا يعني تفاقم المخاوف الحالية بشأن الطلاب الذين يستخدمون أنظمة الذكاء الاصطناعي في الانتحال.

الأوراق العلمية المزيفة ليست شيئًا جديدًا. ومع ذلك، فإن المراجعين الأقران في المجلات والمؤتمرات الأكاديمية يفتقرون إلى الوقت بالفعل،وهذا قد يجعل من الصعب أكثر من أي وقت مضى التخلص من العلوم المزيفة.

التحيز الأساسي والسمية

أفاد نقاد آخرون أن Galactica ، مثل نماذج اللغات الأخرى المدربة على البيانات من الإنترنت، تميل إلى إلقاء خطاب الكراهية السام بينما تفرض رقابة غير عاكسة على الاستفسارات السياسية. 

يعكس هذا التحيزات الكامنة في بيانات التدريب الخاصة بالنموذج، وفشل Meta الواضح في تطبيق الفحوصات المناسبة حول أبحاث الذكاء الاصطناعي المسؤولة.

إن المخاطر المرتبطة بنماذج اللغة الكبيرة مفهومة جيدًا. في الواقع، دفعت ورقة بحثية مؤثرة تسلط الضوء على هذه المخاطر Google إلى طرد أحد مؤلفي الورقة في عام 2020، وفي النهاية حل فريق أخلاقيات الذكاء الاصطناعي تمامًا.

تؤدي أنظمة التعلم الآلي إلى تفاقم التحيزات المجتمعية القائمة بشكل سيئ، ولا يُعد نظام Galactica استثناءً. على سبيل المثال، يمكن لمجلة Galactica أن توصي بالاستشهادات الممكنة للمفاهيم العلمية عن طريق محاكاة أنماط الاقتباس الحالية (“س: هل هناك أي بحث حول تأثير تغير المناخ على الحاجز المرجاني العظيم؟ ج: جرب مقالة” الاحتباس الحراري يحول تجمعات الشعاب المرجانية  بواسطة هيوز وآخرون في Nature 556 (2018) “).

للأفضل أو للأسوأ، الاستشهادات هي عملة العلم – ومن خلال إعادة إنتاج اتجاهات الاقتباس الحالية في توصياتها، تخاطر Galactica بتعزيز الأنماط الحالية لعدم المساواة والحرمان. (أقر مطورو Galactica بهذا الخطر في ورقتهم).

يعد تحيز الاستشهاد بالفعل قضية معروفة في المجالات الأكاديمية التي تتراوح من المنح النسوية إلى الفيزياء. ومع ذذلك،يمكن لأدوات مثل Galactica أن تزيد المشكلة سوءًا ما لم يتم استخدامها مع حواجز حماية دقيقة في مكانها.

المشكلة الأكثر دقة هي أن المقالات العلمية التي يتم تدريب Galactica عليها متحيزة بالفعل نحو اليقين والنتائج الإيجابية. (يؤدي هذا إلى ما يسمى بـ “أزمة النسخ المتماثل” و “القرصنة الإلكترونية”، حيث يختار العلماء البيانات وتقنيات التحليل لجعل النتائج تبدو مهمة.)

يأخذ Galactica هذا التحيز نحو اليقين، ويجمعه مع الإجابات الخاطئة ويقدم ردودًا مع الثقة المفرطة المطلقة: بالكاد وصفة للثقة في خدمة المعلومات العلمية.

تتفاقم هذه المشاكل بشكل كبير عندما يحاول Galactica التعامل مع القضايا الاجتماعية المثيرة للجدل أو الضارة.

المصدر: techxplore

قد يهمك:

إنشاء حساب فيس بوك

إنشاء حساب جيميل ثاني

إنشاء Yahoo

إنشاء حساب سكريل

إنشاء محفظة Trust

إنشاء حساب تيك توك

أنت تستخدم إضافة Adblock

يعتمد موقع انشاء على الاعلانات كمصدر لدعم الموقع، يجب عليك ايقاف تشغيل حاجب الاعلانات لمشاهدة المحتوي