ماذا يعني نهج أوروبا تجاه خصوصية البيانات بالنسبة إلى GPT وDALL-E؟

أدى الانفجار العالمي للذكاء الاصطناعي إلى زيادة الحاجة إلى الفطرة السليمة، ومنهجية محورها الإنسان للتعامل مع خصوصية البيانات وملكيتها. 

يقود الطريق اللائحة العامة لحماية البيانات في أوروبا (GDPR)، ولكن هناك أكثر من مجرد معلومات تعريف شخصية (PII) على المحك في السوق الحديثة.

ماذا عن البيانات التي ننتجها كمحتوى وفن؟ بالتأكيد ليس من القانوني نسخ عمل شخص آخر ثم تقديمه على أنه عملك. 

ولكن هناك أنظمة ذكاء اصطناعي تحاول التخلص من أكبر قدر ممكن من المحتوى الذي ينشئه الإنسان من الويب من أجل إنشاء محتوى مشابه. 

هل يمكن أن تحمي اللائحة العامة لحماية البيانات أو أي سياسات أخرى تركز على الاتحاد الأوروبي هذا النوع من المحتوى؟ كما اتضح، مثل معظم الأشياء في عالم التعلم الآلي، فإنه يعتمد على البيانات. 

الخصوصية مقابل الملكية

الغرض الأساسي من اللائحة العامة لحماية البيانات هو حماية المواطنين الأوروبيين من الإجراءات والعواقب الضارة المتعلقة بإساءة استخدام معلوماتهم الخاصة أو إساءة استخدامها أو استغلالها. 

لا يفيد المواطنين (أو المنظمات) كثيرًا عندما يتعلق الأمر بحماية الملكية الفكرية (IP). 

لسوء الحظ، فإن السياسات واللوائح الموضوعة لحماية الملكية الفكرية، على حد علمنا، ليست مجهزة لتغطية تجريف البيانات وإخفاء الهوية. 

هذا يجعل من الصعب فهم المكان الذي تنطبق عليه اللوائح بالضبط عندما يتعلق الأمر بكشط الويب بحثًا عن محتوى. 

تُستخدم هذه التقنيات والبيانات التي تحصل عليها لإنشاء قواعد بيانات ضخمة لاستخدامها في تدريب نماذج الذكاء الاصطناعي الكبيرة مثل أنظمة OpenAI’s GPT-3 وDALL-E 2.

الطريقة الوحيدة لتعليم الذكاء الاصطناعي لتقليد البشر هي تعريضه لبيانات من صنع الإنسان. وكلما زاد عدد البيانات التي تدفعها في نظام الذكاء الاصطناعي، زادت قوة مخرجاته. 

إنه يعمل على النحو التالي: تخيل أنك ترسم صورة زهرة وتنشرها على منتدى عبر الإنترنت للفنانين. 

باستخدام تقنيات الكشط، يمتص الزي التقني صورتك مع مليارات الآخرين حتى يتمكن من إنشاء مجموعة بيانات ضخمة من الأعمال الفنية. 

في المرة القادمة التي يطلب فيها شخص ما من الذكاء الاصطناعي إنشاء صورة “زهرة”، هناك احتمال أكبر من الصفر أن يظهر عملك في تفسير الذكاء الاصطناعي للموجه. 

ويبقى سؤال مفتوح حول ما إذا كان هذا الاستخدام أخلاقيًا. 

البيانات العامة مقابل معلومات تحديد الهوية الشخصية

في حين يمكن وصف الإشراف التنظيمي للائحة العامة لحماية البيانات (GDPR) بأنه بعيد المدى عندما يتعلق الأمر بحماية المعلومات الخاصة وإعطاء الأوروبيين الحق في محوها، إلا أنه يبدو أنه لا يفعل الكثير لحماية المحتوى من الكشط. 

مع ذلك، هذا لا يعني أن اللوائح العامة لحماية البيانات (GDPR) وغيرها من لوائح الاتحاد الأوروبي غير فاعلة تمامًا في هذا الصدد. 

يتعين على الأفراد والمنظمات اتباع قواعد محددة للغاية لإلغاء معلومات التعريف الشخصية، حتى لا تتعارض مع القانون – وهو أمر يمكن أن يصبح مكلفًا للغاية. 

على سبيل المثال، أصبح من المستحيل تقريبًا بالنسبة لشركة Clearview AI، وهي شركة تبني قواعد بيانات التعرف على الوجه للاستخدام الحكومي عن طريق إلغاء بيانات الوسائط الاجتماعية، لممارسة الأعمال التجارية في أوروبا. 

أصدرت هيئات رقابة في الاتحاد الأوروبي من سبع دول على الأقل غرامات ضخمة بالفعل أو أوصت بغرامات بسبب رفض الشركة الامتثال للقانون العام لحماية البيانات (GDPR) واللوائح المماثلة.

على الجانب الآخر تمامًا من الطيف، تستخدم شركات مثل Google وOpenAI وMeta ممارسات تجريد بيانات مماثلة إما بشكل مباشر أو عن طريق شراء أو استخدام مجموعات البيانات المكسورة للعديد من نماذج الذكاء الاصطناعي الخاصة بهم دون أي تداعيات. 

على الرغم من أن شركات التكنولوجيا الكبيرة واجهت نصيبها العادل من الغرامات في أوروبا، فإن عددًا قليلاً جدًا من المخالفات تضمنت تجريف البيانات.

لماذا لا تحظر القشط؟ 

قد يبدو القشط، ظاهريًا، وكأنه ممارسة تنطوي على احتمالية كبيرة لإساءة الاستخدام حتى لا تحظرها تمامًا. 

ومع ذلك، بالنسبة للعديد من المؤسسات التي تعتمد على الكشط، فإن البيانات التي يتم الحصول عليها ليست بالضرورة “محتوى” أو “معلومات تحديد الهوية الشخصية”، ولكنها معلومات يمكن أن تخدم الجمهور. 

لقد تواصلنا مع وكالة المملكة المتحدة للتعامل مع خصوصية البيانات، مكتب مفوض المعلومات (ICO)، لمعرفة كيفية تنظيم تقنيات الكشط ومجموعات البيانات على نطاق الإنترنت وفهم سبب أهمية عدم المبالغة في التنظيم.

قال متحدث باسم ICO لـ TNW:

يمكن أن يجلب استخدام المعلومات المتاحة للجمهور العديد من الفوائد، من البحث إلى تطوير منتجات وخدمات وابتكارات جديدة – بما في ذلك في مجال الذكاء الاصطناعي. 

ومع ذلك، عندما تكون هذه المعلومات بيانات شخصية، فمن المهم أن نفهم أن قانون حماية البيانات ينطبق. هذا هو الحال سواء كانت التقنيات المستخدمة لجمع البيانات تتضمن كشط أو أي شيء آخر.

بمعنى آخر، يتعلق الأمر بنوع البيانات المستخدمة أكثر من كيفية جمعها. 

سواء قمت بنسخ لصق الصور من ملفات تعريف Facebook أو استخدام التعلم الآلي لكشط الويب بحثًا عن الصور المصنفة، فمن المحتمل أن تتعارض مع القانون العام لحماية البيانات (GDPR) ولوائح الخصوصية الأوروبية الأخرى إذا قمت بإنشاء محرك للتعرف على الوجه دون موافقة الأشخاص الذين توجد وجوههم. قاعدة البيانات الخاصة به.

ولكن من المقبول عمومًا التخلص من الإنترنت للحصول على كميات هائلة من البيانات طالما أنك إما تخفي هويتها أو تتأكد من عدم وجود معلومات PII في مجموعة البيانات.

مزيد من المناطق الرمادية

ومع ذلك، حتى ضمن حالات الاستخدام المسموح بها، لا تزال هناك بعض المناطق الرمادية التي تتعلق بالمعلومات الخاصة. 

من المعروف أن GPT-2 وGPT-3، على سبيل المثال، ينتجان أحيانًا معلومات تحديد الهوية الشخصية (PII) في شكل عناوين وأرقام هواتف ومعلومات أخرى يتم تخزينها على ما يبدو في مجموعة بياناتها عبر مجموعات بيانات تدريبية واسعة النطاق.

هنا، حيث من الواضح أن الشركة التي تقف وراء GPT-2 وGPT-3 تتخذ خطوات للتخفيف من ذلك، فإن اللوائح العامة لحماية البيانات (GDPR) واللوائح المماثلة تقوم بعملها. 

ببساطة، يمكننا إما اختيار عدم تدريب نماذج كبيرة للذكاء الاصطناعي أو السماح للشركات بتدريبهم على فرصة استكشاف الحالات المتطورة ومحاولة التخفيف من المخاوف.

ما قد يكون مطلوبًا هو GDUR، وهو تنظيم عام لاستخدام البيانات، وهو شيء يمكن أن يقدم إرشادات واضحة حول كيفية استخدام المحتوى الذي ينشئه الإنسان بشكل قانوني في مجموعات البيانات الكبيرة.

على الأقل، يبدو أن الأمر يستحق إجراء محادثة حول ما إذا كان يجب أن يتمتع المواطنون الأوروبيون بنفس القدر من الحق في إزالة المحتوى الذي ينشئونه من مجموعات البيانات مثل صورهم الشخصية وصور ملفاتهم الشخصية. 

في الوقت الحالي، في المملكة المتحدة وفي جميع أنحاء أوروبا، يبدو أن الحق في المسح لا يمتد إلا إلى معلومات تحديد الهوية الشخصية الخاصة بنا. 

من المحتمل أن ينتهي الأمر بأي شيء نضعه على الإنترنت في مجموعة بيانات التدريب الخاصة بالذكاء الاصطناعي. 

المصدر: thenextweb

قد يهمك:

شراء قالب Divi مدفوع

شراء قالب Jannah مدفوع

قوالب WordPress

قالب Flatsome

قالب ادفورست

شراء قالب Digiqole

قالب Foxiz الإخباري

شراء قالب ووردبريس WoodMart

أنت تستخدم إضافة Adblock

يعتمد موقع انشاء على الاعلانات كمصدر لدعم الموقع، يجب عليك ايقاف تشغيل حاجب الاعلانات لمشاهدة المحتوي