فهم قيمة البيانات من أجل تحسين التعلم الآلي

يمكن أن تكشف البيانات عن أنماط وتقدم رؤى حول سلوكنا اليومي. 

على سبيل المثال، يمكن للعاملين في مجال الرعاية الصحية استخدام البيانات للإبلاغ عن معدل الإصابة بالأنفلونزا في دولة معينة، ويمكن للشركات المصنعة استخدام البيانات لفهم متوسط ​​أوقات الإنتاج بشكل أفضل، وهي العوامل التي تسلط الضوء على قيمة البيانات في مجتمع اليوم.

بالإضافة إلى ذلك، تلعب البيانات دورًا كبيرًا في اتخاذ قرارات الذكاء الاصطناعي (AI). 

من خلال فهم كيفية مساهمة مصادر البيانات الفردية في عمليات صنع القرار القائمة على التكنولوجيا، يمكن لمستخدمي الذكاء الاصطناعي توقع تجربة أكثر فعالية وأفضل.

يمكّننا قياس قيمة البيانات من استبعاد المدخلات التي قد تساهم في النماذج المتحيزة. علاوة على ذلك، يتيح لنا فهم قيمة البيانات تحديد أسعار مناسبة لمصادر البيانات، وبالتالي تسهيل مشاركة البيانات. 

هذا مهم بشكل خاص للصناعات التي يصعب فيها الحصول على بيانات محددة أو للشركات الصغيرة التي تتصارع مع الوصول المحدود إلى البيانات.

زيادة المعرفة حول قيمة البيانات

حصل الأستاذ المساعد Ruoxi Jia في قسم برادلي للهندسة الكهربائية وهندسة الحاسبات في Virginia Tech على جائزة National Science Foundation (NSF) للتطوير الوظيفي المبكر لأعضاء هيئة التدريس (CAREER) للتحقيق في النظريات الأساسية والأدوات الحسابية اللازمة لقياس قيمة البيانات.

ستسمح المنحة التي تبلغ قيمتها 500000 دولار، والتي مُنحت على مدى خمس سنوات، لجيا وفريقها بتطوير تقنيات تقييم بيانات قابلة للتطوير وموثوق بها تدعم الحصول على البيانات الاستراتيجية وتحسن تحليلات البيانات القائمة على التعلم الآلي.

قال جيا: “في الوقت الحالي، هناك الكثير من الإثارة حول التعلم الآلي والذكاء الاصطناعي، خاصة بعد ظهور ChatGPT”. 

“لكن ما هو تحت الغطاء هو الكثير من البيانات. هذا ما يمكّن هذا النوع من الآلات، ولهذا السبب نهدف إلى زيادة الوعي حول قيمة البيانات “.

جعل أدوات البيانات القائمة على الجودة أكثر سهولة

تم إطلاق ChatGPT ، وهو روبوت محادثة بتقنية الذكاء الاصطناعي، تم إطلاقه هذا الخريف، ويسمح للمستخدمين بطلب المساعدة في أشياء مثل كتابة المقالات، وصياغة خطط العمل، وإنشاء الكود، وحتى تأليف الموسيقى. 

اعتبارًا من ديسمبر 2022، كان لدى ChatGPT بالفعل أكثر من مليون مستخدم.

تحسين التعلم الآلي

أشار جيا إلى أهمية جودة البيانات وكيف يمكن أن تؤثر على نتائج التعلم الآلي. وأوضحت: “إذا تم تغذية البيانات السيئة في التعلم الآلي، فستحصل على نتائج سيئة. نريد أن نفهم، لا سيما الفهم الكمي، لقيمة البيانات لاختيار البيانات “.

لاحظ مطورو ChatGPT أهمية المزيد من البيانات القائمة على الجودة حيث أعلنوا للتو عن إصدار GPT-4. تعد أحدث التقنيات متعددة الوسائط، مما يعني أن كل من الصور والمطالبات النصية يمكن أن تحفزها على إنشاء محتوى.

كيف يمكننا الحصول على البيانات الخاصة حاليًا؟

مطلوب قدر كبير من البيانات لتطوير هذا النوع من الذكاء الآلي، ولكن ليست كل البيانات مفتوحة المصدر أو عامة. تمتلك الكيانات الخاصة بعض مجموعات البيانات، وهناك خصوصية متضمنة.

يأمل جيا أنه في المستقبل، يمكن تقديم حوافز مالية للمساعدة في الحصول على هذه الأنواع من مجموعات البيانات وتحسين خوارزميات التعلم الآلي اللازمة في جميع الصناعات.

أجرى خريج جامعة كاليفورنيا – بيركلي محادثات مع Google Research و Sony AI Research ، من بين آخرين، ممن يهتمون بقيمة البيانات وفوائدها البحثية.

ستفيد مشاركة البيانات واعتماد خوارزميات التعلم الآلي المحسّنة بشكل كبير كلاً من الصناعات والمستهلكين الأفراد.

المصدر: innovationnewsnetwork

إقراء ايضا:

إنشاء حساب موقع PayPal

إنشاء حساب موقع Payeer

إنشاء حساب موقع خمسات

انشاء حساب موقع صراحة

انواع الجرائم الالكترونية

إنشاء حساب فيس بوك

انشاء حساب انستقرام

دليل سيو SEO | تحسين محركات البحث 2023

أنت تستخدم إضافة Adblock

يعتمد موقع انشاء على الاعلانات كمصدر لدعم الموقع، يجب عليك ايقاف تشغيل حاجب الاعلانات لمشاهدة المحتوي