كيفية تحقيق أقصى استفادة من استثماراتك في الذكاء الاصطناعي

ساعد عصر البيانات الضخمة في إضفاء الطابع الديمقراطي على المعلومات، وإنشاء ثروة من البيانات وزيادة الإيرادات في الشركات القائمة على التكنولوجيا.
ولكن على الرغم من كل هذا الذكاء، فإننا لا نحصل على مستوى البصيرة من مجال التعلم الآلي الذي قد يتوقعه المرء، حيث تكافح العديد من الشركات لجعل مشاريع التعلم الآلي (ML) قابلة للتنفيذ ومفيدة.
لا يبدأ برنامج AI / ML الناجح بفريق كبير من علماء البيانات. يبدأ ببنية تحتية قوية للبيانات.
يجب أن تكون البيانات متاحة عبر الأنظمة وجاهزة للتحليل حتى يتمكن علماء البيانات من إجراء مقارنات بسرعة وتقديم نتائج الأعمال، ويجب أن تكون البيانات موثوقة، مما يشير إلى التحدي الذي تواجهه العديد من الشركات عند بدء برنامج علم البيانات.
تكمن المشكلة في أن العديد من الشركات تقفز أولاً إلى علم البيانات، وتوظف علماء بيانات باهظي التكلفة، ثم تكتشف أنها لا تمتلك الأدوات أو بيانات البنية التحتية التي يحتاجها العلماء للنجاح.
ينتهي الأمر بالباحثين ذوي الأجور المرتفعة إلى قضاء الوقت في تصنيف البيانات والتحقق منها وإعدادها – بدلاً من البحث عن الأفكار.
يعد عمل البنية التحتية هذا مهمًا، ولكنه يفوت أيضًا فرصة علماء البيانات لاستخدام مهاراتهم الأكثر فائدة بطريقة تضيف أكبر قيمة.
التحديات مع إدارة البيانات
عندما يقوم القادة بتقييم أسباب نجاح أو فشل مشروع علم البيانات (و87٪ من المشاريع لا تصل إلى مرحلة الإنتاج أبدًا)، فإنهم غالبًا ما يكتشفون أن شركتهم حاولت المضي قدمًا في تحقيق النتائج دون بناء أساس من البيانات الموثوقة.
إذا لم يكن لديهم هذا الأساس المتين، فيمكن لمهندسي البيانات قضاء ما يصل إلى 44٪ من وقتهم في صيانة خطوط أنابيب البيانات مع التغييرات في واجهات برمجة التطبيقات أو هياكل البيانات.
يمكن أن يؤدي إنشاء عملية آلية لدمج البيانات إلى إرجاع المهندسين إلى وقت طويل، وضمان حصول الشركات على جميع البيانات التي يحتاجونها للتعلم الآلي الدقيق.
يساعد هذا أيضًا في خفض التكاليف وزيادة الكفاءة إلى أقصى حد حيث تبني الشركات قدراتها في مجال علوم البيانات.
البيانات الضيقة تنتج رؤى ضيقة
يعد التعلم الآلي صعبًا – إذا كانت هناك فجوات في البيانات، أو لم يتم تنسيقها بشكل صحيح، فإن التعلم الآلي إما يفشل في العمل، أو ما هو أسوأ من ذلك، يعطي نتائج غير دقيقة.
عندما تدخل الشركات في موقف عدم اليقين بشأن بياناتها، تطلب معظم المؤسسات من فريق علوم البيانات تسمية مجموعة البيانات يدويًا كجزء من التعلم الآلي الخاضع للإشراف، ولكن هذه عملية تستغرق وقتًا طويلاً وتؤدي إلى مخاطر إضافية للمشروع.
والأسوأ من ذلك، عندما يتم قطع أمثلة التدريب بشكل كبير جدًا بسبب مشكلات البيانات، فهناك احتمال أن النطاق الضيق سيعني أن نموذج ML يمكنه فقط إخبارنا بما نعرفه بالفعل.
الحل هو التأكد من أن الفريق يمكنه الاستفادة من مخزن شامل ومركزي للبيانات، يشمل مجموعة متنوعة من المصادر ويوفر فهمًا مشتركًا للبيانات.
يعمل هذا على تحسين عائد الاستثمار المحتمل من نماذج ML من خلال توفير بيانات أكثر اتساقًا للعمل معها. لا يمكن أن يتطور برنامج علم البيانات إلا إذا كان يعتمد على بيانات موثوقة ومتسقة وفهم شريط الثقة للنتائج.
النماذج الكبيرة مقابل البيانات القيمة
يتمثل أحد أكبر التحديات التي تواجه برنامج علم البيانات الناجح في موازنة حجم وقيمة البيانات عند إجراء التنبؤ
يمكن لشركة الوسائط الاجتماعية التي تحلل مليارات التفاعلات كل يوم استخدام الحجم الكبير من الإجراءات منخفضة القيمة نسبيًا (على سبيل المثال، قيام شخص ما بالتمرير لأعلى أو مشاركة مقال) لعمل تنبؤات موثوقة.
إذا كانت إحدى المؤسسات تحاول تحديد العملاء الذين من المحتمل أن يجددوا العقد في نهاية العام، فمن المحتمل أن تعمل مع مجموعات بيانات أصغر ذات عواقب كبيرة.
نظرًا لأن الأمر قد يستغرق عامًا لمعرفة ما إذا كانت الإجراءات الموصى بها قد أدت إلى النجاح، فإن هذا يخلق قيودًا هائلة على برنامج علوم البيانات.
في هذه المواقف، تحتاج الشركات إلى تفكيك صوامع البيانات الداخلية لدمج جميع البيانات التي لديها لتقديم أفضل التوصيات.
قد يشمل ذلك معلومات الطرف الصفري التي تم التقاطها بمحتوى مغلق، وبيانات موقع ويب الطرف الأول، وبيانات من تفاعلات العملاء مع المنتج، إلى جانب النتائج الناجحة، وتذاكر الدعم، واستطلاعات رضا العملاء، وحتى البيانات غير المنظمة مثل تعليقات المستخدم.
تحتوي كل مصادر البيانات هذه على أدلة حول ما إذا كان العميل سوف يجدد عقده. من خلال الجمع بين صوامع البيانات عبر مجموعات الأعمال، يمكن توحيد المقاييس، وهناك ما يكفي من العمق والاتساع لإنشاء تنبؤات واثقة.
لتجنب الوقوع في فخ تضاؤل الثقة والعوائد من برنامج ML / AI، يمكن للشركات اتخاذ الخطوات التالية.
- تعرف على مكانك – هل لدى عملك فهم واضح لكيفية مساهمة ML في العمل؟ هل تمتلك شركتك البنية التحتية جاهزة؟ لا تحاول إضافة التذهيب الرائع فوق البيانات الغامضة – كن واضحًا بشأن المكان الذي تبدأ منه، حتى لا تقفز للأمام كثيرًا.
- احصل على جميع بياناتك في مكان واحد – تأكد من أن لديك خدمة سحابية مركزية أو بحيرة بيانات محددة ومتكاملة. بمجرد أن يصبح كل شيء مركزيًا، يمكنك البدء في العمل على البيانات والعثور على أي تناقضات في الموثوقية.
- Crawl-Walk-Run – ابدأ بالترتيب الصحيح للعمليات أثناء إنشاء برنامج علوم البيانات الخاص بك. ركز أولاً على تحليلات البيانات وذكاء الأعمال، ثم قم ببناء هندسة البيانات، وأخيراً، فريق علوم البيانات.
- لا تنس الأساسيات – بمجرد تجميع جميع البيانات وتنظيفها والتحقق من صحتها، فأنت جاهز للقيام بعلوم البيانات. لكن لا تنس عمل “التدبير المنزلي” الضروري للحفاظ على الأساس الذي سيحقق نتائج مهمة. تتضمن هذه المهام الأساسية الاستثمار في الفهرسة وصحة البيانات، والتأكد من استهداف المقاييس الصحيحة التي من شأنها تحسين تجربة العميل، والحفاظ يدويًا على اتصالات البيانات بين الأنظمة أو استخدام خدمة البنية التحتية.
من خلال بناء البنية التحتية المناسبة لعلوم البيانات، يمكن للشركات أن ترى ما هو مهم للأعمال التجارية، وأين توجد النقاط العمياء.
يمكن أن يؤدي القيام بالأعمال الأساسية أولاً إلى تحقيق عائد استثمار قوي، ولكن الأهم من ذلك، أنه سيعمل على إعداد فريق علوم البيانات لإحداث تأثير كبير.
يعد الحصول على ميزانية لبرنامج علم بيانات مبهرج أمرًا سهلاً نسبيًا، ولكن تذكر أن غالبية هذه المشاريع تفشل.
ليس من السهل الحصول على ميزانية لمهام البنية التحتية “المملة”، ولكن إدارة البيانات تخلق الأساس لعلماء البيانات لتقديم التأثير الأكثر أهمية على الأعمال.
المصدر: venturebeat
شاهد المزيد: