ما هو اكتشاف الحالات الشاذة، وكيف يمكن أن يفيد شركتك؟
نشرت: 2023-08-24يمكن أن يساعدك اكتشاف الحالات الشاذة في تحديد الاتجاهات القادمة قبل منافسيك. يمكنه الإبلاغ عن المعاملات الاحتيالية من خلال مراقبة حركة مرور المتجر عبر الإنترنت، واكتشاف العنف في الأماكن العامة، مما يمنح فريق الأمان الخاص بك الفرصة للتدخل قبل أن يتأذى الأشخاص.
مهتم؟ هناك شركات متخصصة في الكشف عن الحالات الشاذة يمكنها مساعدتك في إنشاء ودمج برامج مخصصة مصممة خصيصًا لاكتشاف الانحراف السلوكي في قطاع عملياتك.
إذًا، ما هو كشف الشذوذ؟ كيف يعمل؟ وكيف يمكنك دمجها في عمليات شركتك وسير العمل؟
نظرة عامة على المحتوى
- ما هو كشف الشذوذ؟
- كيف يعمل الكشف عن الشذوذ؟
- حالات الاستخدام الرئيسية للكشف عن الشذوذ
- البدء في الكشف عن الشذوذ
- كيف يمكن أن تساعد ITRex في الكشف عن الحالات الشاذة
ما هو كشف الشذوذ؟
اكتشاف الحالات الشاذة هو نوع من استخراج البيانات الذي يحلل بيانات الشركة لاكتشاف نقاط البيانات التي تنحرف عن خط الأساس المحدد (على سبيل المثال، السلوك القياسي لمجموعة البيانات). وتشير هذه القيم المتطرفة عادة إلى حوادث، مثل مواطن الخلل الفنية في المعدات، والتغيرات في تفضيلات العملاء، وأنواع أخرى من التشوهات، مما يمكّن الشركات من التصرف قبل وقوع الضرر.
ما هو الشذوذ؟
الشذوذ هو نقطة بيانات غير متناسقة تنحرف عن النمط المألوف. على الرغم من أن الأمر لا يمثل دائمًا مصدر قلق كبير، إلا أنه يستحق التحقيق لمنع التصعيد المحتمل. على سبيل المثال، يمكن أن يكون الارتفاع في مبيعات المنتجات نتيجة لحملة تسويقية ناجحة، أو يمكن أن يشير إلى تغيير في الاتجاهات وسلوك العملاء، والذي يتعين على الشركات التكيف معه.
تنقسم حالات الشذوذ في بيانات الأعمال إلى ثلاث فئات خارجية:
- القيمة الخارجية العالمية هي نقطة بيانات تقع بعيدًا بشكل غير طبيعي عن بقية البيانات. لنفترض أنك تتلقى 7000 دولار في حسابك المصرفي كل شهر. إذا حصلت فجأة على تحويل بقيمة 50 ألف دولار، فسيكون ذلك بمثابة قيمة متطرفة على مستوى العالم.
- تنحرف القيمة السياقية المتطرفة عن بقية البيانات ضمن نفس السياق. على سبيل المثال، إذا كنت تعيش في بلد تتساقط فيه الثلوج عادة في الشتاء ويكون الطقس دافئًا في الصيف، فإن تساقط الثلوج بغزارة في الشتاء أمر طبيعي. لكن تجربة تساقط الثلوج خلال فصل الصيف ستكون أمرًا شاذًا عن السياق.
- تحدث القيمة المتطرفة الجماعية عندما تنحرف مجموعة فرعية من نقاط البيانات عن مجموعة البيانات بأكملها. على سبيل المثال، إذا لاحظت انخفاضًا غير عادي في مبيعات العديد من المنتجات التي تبدو غير مرتبطة ببعضها البعض، ولكنك أدركت بعد ذلك أن هذا مرتبط بطريقة أو بأخرى، فسيتم دمج ملاحظاتك في قيمة متطرفة جماعية واحدة.
لماذا نحتاج إلى الذكاء الاصطناعي في اكتشاف الحالات الشاذة؟
تتعامل معظم الشركات مع كميات كبيرة من البيانات المنظمة وغير المنظمة، حيث تشكل الأخيرة ما يصل إلى 90% من المعلومات التي يتم إنشاؤها داخل جدران الشركة. من المستحيل معالجة كل هذه المعلومات يدويًا وإنشاء رؤى ذات معنى - خاصة إذا كنا نتحدث عن البيانات غير المنظمة، والتي تتكون من صور ومعاملات ونصوص حرة الشكل وما إلى ذلك.
تظهر الأبحاث أن تقنيات التعلم الآلي (ML) هي الخيار الأفضل لمعالجة مجموعات البيانات الكبيرة غير المنظمة. يحتوي هذا الحقل على عدد كبير من الخوارزميات، ويمكنك اختيار ما يناسبك. يمكنك أيضًا الجمع بين العديد من تقنيات التعلم الآلي للحصول على أفضل النتائج.
كيف يعمل الكشف عن الشذوذ؟
هناك ثلاثة أنواع رئيسية من تقنيات الكشف عن الحالات الشاذة القائمة على الذكاء الاصطناعي والتعلم الآلي.
- الكشف عن الشذوذ تحت الإشراف . هنا، يتم تدريب نماذج تعلم الآلة واختبارها باستخدام مجموعة بيانات مصنفة بالكامل تحتوي على السلوك الطبيعي والشاذ. يعمل هذا النهج بشكل جيد عند اكتشاف الانحرافات التي كانت جزءًا من مجموعة بيانات التدريب، لكن التكنولوجيا تتعثر عندما تواجه شذوذًا جديدًا لم تشهده في التدريب. تتطلب التقنيات الخاضعة للإشراف جهدًا يدويًا وخبرة في المجال حيث يحتاج شخص ما إلى تصنيف البيانات.
- كشف الشذوذ غير الخاضع للرقابة . لا تحتاج هذه الطريقة إلى تصنيف البيانات يدويًا. تفترض النماذج أن نسبة صغيرة فقط من نقاط البيانات التي تختلف بشكل كبير عن بقية البيانات تشكل حالات شاذة. لا يزال بإمكان التقنيات غير الخاضعة للرقابة أن تتفوق في تحديد الحالات الشاذة الجديدة التي لم تشهدها أثناء التدريب لأنها تكتشف القيم المتطرفة بناءً على خصائصها بدلاً من ما تعلمته أثناء التدريب. ومع ذلك، فإن هذه الخوارزميات معقدة إلى حد ما وبنيتها عبارة عن صندوق أسود، مما يعني أن المستخدمين لن يتلقوا شرحًا لكيفية اتخاذ الأداة لقراراتها.
- كشف الشذوذ شبه الخاضع للإشراف . تتضمن هذه التقنيات بيانات مصنفة وغير مصنفة، مما يقلل من تكاليف التعليقات التوضيحية اليدوية. بالإضافة إلى ذلك، لا يزال بإمكان نموذج الكشف عن الحالات الشاذة شبه الخاضع للإشراف التعلم بعد النشر واكتشاف الحالات الشاذة التي لم يشاهدها في التدريب. كما هو الحال مع التقنيات غير الخاضعة للرقابة، يمكن لهذه النماذج أيضًا العمل مع البيانات غير المنظمة.
طرق الكشف عن الشذوذ القائمة على الذكاء الاصطناعي
يعتمد اكتشاف الحالات الشاذة على الذكاء الاصطناعي (AI) وأنواعه الفرعية، بما في ذلك التعلم الآلي. فيما يلي خمس تقنيات تعلم الآلة التي يتم نشرها بشكل متكرر في هذا السياق.
أجهزة الترميز التلقائي
أجهزة التشفير التلقائي عبارة عن شبكات عصبية اصطناعية غير خاضعة للرقابة تعمل على ضغط البيانات ثم إعادة بنائها لتشبه النموذج الأصلي قدر الإمكان. يمكن لهذه الخوارزميات أن تتجاهل الضوضاء بشكل فعال وتعيد بناء النصوص والصور وأنواع البيانات الأخرى. يتكون جهاز التشفير التلقائي من جزأين:
- التشفير، الذي يضغط البيانات المدخلة
- وحدة فك التشفير، التي تعمل على فك ضغط البيانات بالقرب من شكلها الأصلي
عند استخدام أداة التشفير التلقائي، انتبه إلى حجم الكود، لأنه سيحدد معدل الضغط. معلمة أخرى مهمة هي عدد الطبقات. مع عدد أقل من الطبقات، ستكون الخوارزمية أسرع، لكنها يمكن أن تعمل على ميزات أقل.
الشبكات البايزية
هذه التقنية هي نوع من النماذج القائمة على الرسم البياني الاحتمالي والتي تحسب الاحتمالية بناءً على الاستدلال البايزي. تتوافق العقد في الرسم البياني مع متغيرات عشوائية، بينما تمثل الحواف تبعيات مشروطة تسمح للنموذج بإجراء استنتاجات.
تُستخدم الشبكات الافتراضية في التشخيص والنمذجة السببية والاستدلال والمزيد. في الكشف عن الحالات الشاذة، تكون هذه الطريقة مفيدة بشكل خاص للكشف عن الانحرافات الدقيقة التي يصعب اكتشافها باستخدام تقنيات أخرى. يمكن لهذه الطريقة أيضًا أن تتحمل البيانات المفقودة أثناء التدريب وستظل تتمتع بأداء قوي إذا تم تدريبها على مجموعات بيانات صغيرة.
النماذج المعتمدة على الكثافة
هذه تقنية تجميع ML غير خاضعة للرقابة تكتشف الأنماط التي تعتمد بشكل كامل على الموقع المكاني والمسافات بين الجيران. يقارن قيمة كثافة نقطة البيانات بكثافة نقاط البيانات المجاورة لها. سيكون للقيمة الخارجية (الشذوذ) قيمة كثافة أقل من مجموعات البيانات الأخرى.
آلة ناقل الدعم (SVM)
هذه خوارزمية ML خاضعة للإشراف تُستخدم بشكل شائع للتصنيف. ومع ذلك، يمكن أن تعمل ملحقات SVM أيضًا في بيئة غير خاضعة للإشراف. تستخدم هذه التقنية الطائرات التشعبية لتقسيم نقاط البيانات إلى فئات.
على الرغم من أن SVM يعمل عادةً مع فئتين أو أكثر، إلا أنه في الكشف عن الحالات الشاذة، يمكنه تحليل مشكلات الفئة الواحدة. إنه يتعلم "المعيار" لهذه الفئة ويحدد ما إذا كانت نقطة البيانات يمكن أن تنتمي إلى هذه الفئة أو ما إذا كانت غريبة.
نماذج الخليط الغوسي (GMM)
GMM هي تقنية التجميع الاحتمالية. تقوم هذه التقنية بتصنيف البيانات إلى مجموعات مختلفة بناءً على التوزيع الاحتمالي. ويفترض أن نقاط البيانات تنتمي إلى مزيج من التوزيعات الغوسية ذات المعلمات غير المعروفة، ويكتشف الحالات الشاذة عن طريق اكتشاف البيانات في المناطق منخفضة الكثافة.
حالات الاستخدام الرئيسية للكشف عن الشذوذ
الآن بعد أن عرفت كيفية عمل اكتشاف الحالات الشاذة خلف الكواليس وتقنيات الذكاء الاصطناعي التي يعتمد عليها، فقد حان الوقت لدراسة بعض أمثلة اكتشاف الحالات الشاذة في صناعات مختلفة.
الكشف عن الشذوذ في الرعاية الصحية
يمكن أن يفيد اكتشاف الحالات الشاذة القطاع الطبي من خلال مساعدة الأطباء على تحديد أي مشاكل تتعلق بصحة المرضى، واكتشاف حالات التصعيد لدى المرضى الداخليين، وإخطار الطاقم الطبي قبل فوات الأوان، والمساعدة في التشخيص واختيار العلاج. كل هذا يقلل من العمل اليدوي والعبء المعرفي الذي يواجهه الأطباء.
ومع ذلك، فإن اكتشاف الحالات الشاذة له تحدياته الفريدة في مجال الرعاية الصحية.
إحدى المشكلات هي أنه قد يكون من الصعب تحديد خط الأساس (أي السلوك الطبيعي) عندما يتعلق الأمر بالمخططات الطبية المختلفة. على سبيل المثال، يختلف مخطط كهربية الدماغ للشخص السليم بناءً على الخصائص الفردية. وحدد الباحثون اختلافات كبيرة لدى الأطفال، كما أن هناك اختلافات لدى البالغين حسب الفئة العمرية والجنس.
جانب آخر هو أن نماذج التعلم الآلي يجب أن تكون دقيقة للغاية، حيث أن حياة الناس ستعتمد على أدائهم.
يمكن لخوارزميات الكشف عن الشذوذات الطبية تحليل المعلومات التالية:
- العلامات الحيوية والمعلمات الأخرى التي يتم قياسها بواسطة أجهزة إنترنت الأشياء الطبية
- الصور الطبية، مثل الأشعة السينية والأشعة المقطعية، التي تحمل علامات الأورام الحميدة والخبيثة، والالتهابات، وغيرها من الحالات الصحية
- مطالبات التأمين الصحي، مما يساعد على تحديد ومنع أي نشاط احتيالي. قد يؤدي هذا إلى تغيير قواعد اللعبة في مجال التأمين الطبي نظرًا لأن ما يصل إلى 10% من نفقات الرعاية الطبية والمساعدات الطبية السنوية تذهب حاليًا نحو مطالبات احتيالية
أحد الأمثلة على اكتشاف الحالات الشاذة يأتي من فريق بحث في جنوب أفريقيا. لقد نجحوا في الجمع بين تقنيات التشفير التلقائي وتعزيز التدرج الشديد لرصد المتغيرات الفسيولوجية لمرضى كوفيد-19 واكتشاف أي حالات شاذة قد تشير إلى تدهور الصحة.
ولم يركز فريق آخر على اكتشاف الحالات الشاذة فحسب، بل أيضًا على شرح سبب تمييز الأداة لها على هذا النحو. لذلك، استخدموا أولاً تقنيات الكشف عن الشذوذ لاكتشاف الانحرافات ثم نشروا خوارزميات التعدين الجانبي لتحديد مجموعة من الميزات التي تعتبر فيها نقطة بيانات معينة غريبة.
كشف الشذوذ في مجال الترفيه
تعتمد البيئات الرياضية والترفيهية على المراقبة الأمنية الشاملة المعتمدة على الفيديو باستخدام مئات الكاميرات. ولذلك، لن يكون من الممكن لفرق الأمن اكتشاف الحوادث والتعامل معها في الوقت المناسب إذا تمت مراجعة اللقطات يدويًا. بفضل التعلم الآلي، يمكن للخوارزميات تحليل مقاطع الفيديو المتدفقة من كل كاميرا في المنشأة واكتشاف الانتهاكات الأمنية.
مع استمرار نماذج تعلم الآلة في التعلم أثناء العمل، يمكنها اكتشاف التهديدات والانتهاكات التي لم يكن بإمكان المشغلين البشريين لديك ملاحظتها. يمكن لهذه الخوارزميات اكتشاف أعمال التخريب، والاضطرابات بين المتفرجين، والدخان، والأشياء المشبوهة، وغير ذلك الكثير، وتنبيه موظفي الأمن حتى يكون لديهم الوقت للتصرف ومنع المسؤوليات والإضرار بالسمعة.
أحد هذه المشاريع يأتي مباشرة من محفظتنا. لجأت شركة ترفيه مقرها الولايات المتحدة ولديها غرف ألعاب منتشرة في جميع أنحاء البلاد إلى ITRex لبناء حل للكشف عن الحالات الشاذة يعتمد على التعلم الآلي والذي من شأنه أن يتكامل مع نظام المراقبة بالفيديو القائم على السحابة. يمكن لهذا التطبيق اكتشاف أي سلوك خطير أو عنيف، مثل كسر ماكينات القمار. كما أنه من شأنه أيضًا تبسيط العملية الإدارية من خلال اكتشاف العناصر المنسية والآلات التي أصبحت معطلة.
قام فريقنا ببناء نموذج ML مخصص باستخدام أداة التشفير التلقائي المتغيرة. قمنا بتجميع مجموعة بيانات تدريبية مكونة من 150 مقطع فيديو تصور العنف الجسدي والإضرار بالممتلكات وقمنا بمعالجة مقاطع الفيديو هذه مسبقًا باستخدام إطار عمل OpenCV. بعد ذلك، اعتمدنا على مكتبة torchvision لتطبيع البيانات وزيادتها واستخدمناها لتدريب خوارزمية ML.
اعتمد الحل الناتج على التحقق المتبادل لاكتشاف الحالات الشاذة. على سبيل المثال، يمكنه التعرف على ماكينات القمار المعطلة عن طريق "قراءة" رسالة الخطأ التي تظهر على الشاشة والتحقق من صحتها مقابل قوالب الشاشة المتاحة. تم دمج الحل النهائي بسلاسة في نظام الأمان السحابي الخاص بالعميل، ومراقبة ماكينات القمار على مدار الساعة طوال أيام الأسبوع، وإبلاغ موظفي الأمن كلما اكتشف أي شيء غير طبيعي.
كشف الشذوذ في التصنيع
مع تزايد أتمتة عمليات التصنيع، تصبح الآلات أكثر تعقيدًا وتنمو المرافق بشكل أكبر. ونتيجة لذلك، فإن أساليب الرصد التقليدية لم تعد كافية.
يمكن أن تصور تقنيات الكشف عن الحالات الشاذة انحرافات مختلفة عن القاعدة في منشأتك وتخطرك قبل أن تتفاقم، بل وتتعلم كيفية التمييز بين المشكلات البسيطة والمخاوف الملحة.
هناك العديد من فوائد الكشف عن الشذوذ للتصنيع. يمكن لهذه الأدوات اكتشاف المشكلات التالية:
- خلل في المعدات . وبالتعاون مع أجهزة استشعار إنترنت الأشياء (IoT)، يمكن لخوارزميات الذكاء الاصطناعي مراقبة معلمات الجهاز المختلفة، مثل الاهتزاز ودرجة الحرارة وما إلى ذلك، والتقاط أي انحرافات عن القاعدة. يمكن أن تشير مثل هذه التغييرات إلى أن المعدات محملة بشكل زائد، ولكنها قد تعني أيضًا بداية الانهيار. ستقوم الخوارزمية بوضع علامة على المعدات لمزيد من الفحص. وهذا ما يسمى أيضًا بالصيانة التنبؤية.
- قلة استخدام المعدات . يمكن لحلول الكشف عن الحالات الشاذة المستندة إلى التعلم الآلي معرفة الأجهزة التي تظل في وضع الخمول لفترة طويلة وحث المشغل على موازنة توزيع الحمل.
- مخاطر السلامة . من خلال مراقبة موجزات كاميرات المراقبة، يمكن لبرنامج الكشف عن الحالات الشاذة اكتشاف الموظفين الذين لا يلتزمون ببروتوكولات السلامة الخاصة بالمصنع، مما يعرض سلامتهم للخطر. إذا كان موظفوك يستخدمون الأجهزة القابلة للارتداء لمراقبة السلامة، فيمكن لتعلم الآلة تحليل بيانات المستشعر لتحديد العمال المنهكين والمرضى وتشجيعهم على أخذ قسط من الراحة أو تسجيل الخروج لذلك اليوم.
- قضايا البنية التحتية . يمكن لخوارزميات ML اكتشاف تسرب المياه أو الغاز وأي أضرار أخرى في البنية التحتية وإخطار مدير الموقع المقابل.
أحد الأمثلة على حلول الكشف عن العيوب في التصنيع يأتي من شركة Hemlock Semiconductor، وهي شركة مقرها الولايات المتحدة منتجة للبولي سيليكون فائق النقاء. قامت الشركة بنشر الكشف عن الحالات الشاذة للحصول على رؤية واضحة لعملياتها وتسجيل أي انحرافات عن أنماط الإنتاج المثالية. أعلنت الشركة عن توفير حوالي 300000 دولار شهريًا في استهلاك الموارد.
كشف الشذوذ في تجارة التجزئة
يمكن أن يساعد اكتشاف الحالات الشاذة تجار التجزئة على تحديد أنماط السلوك غير المعتادة واستخدام هذه الأفكار لتحسين العمليات وحماية أعمالهم وعملائهم. يمكن لخوارزميات الذكاء الاصطناعي استيعاب طلبات العملاء المتغيرة وتنبيه تجار التجزئة للتوقف عن شراء المنتجات التي لن يتم بيعها أثناء إعادة تخزين العناصر المطلوبة. كما يمكن أن تمثل الحالات الشاذة فرصًا تجارية في مراحل مبكرة، مما يسمح لتجار التجزئة بالاستفادة منها قبل المنافسة. في حالة التجارة الإلكترونية، يمكن لأصحاب مواقع الويب نشر نماذج الكشف عن الحالات الشاذة لمراقبة حركة المرور لاكتشاف السلوك غير المعتاد الذي قد يشير إلى نشاط احتيالي.
بالإضافة إلى ذلك، يمكن لتجار التجزئة استخدام تقنيات الكشف عن الحالات الشاذة لتأمين أماكن عملهم. في ITRex، أجرينا سلسلة من PoCs لبناء حل يمكنه اكتشاف تعبيرات العنف، مثل المعارك، في مقاطع الفيديو التي يتم بثها بواسطة الكاميرات الأمنية الموضوعة في مراكز التسوق والأماكن العامة الأخرى. يعتمد الحل على طريقة الكشف عن شذوذ الشبكات العصبية التلافيفية ثلاثية الأبعاد، والتي تم تدريبها على مجموعة بيانات قتالية واسعة النطاق. من المعروف أن هذا النوع من خوارزمية ML يؤدي أداءً جيدًا في مهام الكشف عن الإجراءات. إذا كنت مهتمًا بمثل هذا الحل، فيمكننا أن نعرض لك العرض التوضيحي الكامل للبدء به. بعد ذلك، سيقوم فريقنا بضبط الخوارزمية وضبط إعداداتها لتتناسب مع تفاصيل موقعك وعملك، وسنقوم بدمجها بسلاسة في نظام الأمان الحالي لديك.
البدء في الكشف عن الشذوذ
كما ترون، فإن تدريب نماذج الذكاء الاصطناعي المخصصة للكشف الفوري عن الحالات الشاذة يمكن أن يمثل تحديًا تقنيًا. ولهذا السبب قام فريقنا بإعداد دليل من خمس خطوات للشركات التي تتطلع إلى التكنولوجيا الجديدة. قم بالتمرير لأسفل للحصول على بعض نصائح الخبراء - وفكر في تنزيل دليل الأعمال الخاص بنا إلى الذكاء الاصطناعي إذا كنت جديدًا في مجال الذكاء الاصطناعي أو تبحث عن مزيد من المعلومات حول تطبيقات الذكاء الاصطناعي وتكاليف المشروع.
الخطوة 1: تحديد كيفية التعامل مع اكتشاف الحالات الشاذة
هناك خياران هنا. إما أنك تبحث عن حالات شاذة محددة في بياناتك، أو تريد وضع علامة على كل شيء ينحرف عن السلوك القياسي. ما تختاره هنا سيؤثر على بيانات التدريب الخاصة بك ويقيد اختيار تقنيات الذكاء الاصطناعي.
إذا كنت تريد التقاط كل حدث ينحرف عن خط الأساس، فسوف تقوم بتدريب النموذج على مجموعة بيانات كبيرة تمثل السلوك الطبيعي. على سبيل المثال، إذا كنت تعمل على القيادة والسلامة المرورية، فستتكون مجموعة البيانات الخاصة بك من مقاطع فيديو توضح القيادة الآمنة.
لنفترض أنك تتطلع إلى اكتشاف حالات شاذة محددة - على سبيل المثال، حوادث السيارات، ولكن ليس المخالفات البسيطة، مثل القيادة عبر الضوء الأحمر. في هذه الحالة، ستتضمن مجموعة بيانات التدريب مقاطع فيديو أو صورًا لحوادث السيارات.
الخطوة 2: تجميع مجموعة بيانات التدريب ومعالجتها مسبقًا
ستساعدك نتيجة الخطوة السابقة في تحديد نوع البيانات التي تحتاجها.
اجمع البيانات من مصادر شركتك الداخلية أو استخدم مجموعات البيانات المتاحة للعامة. ثم قم بتنظيف هذه البيانات لإزالة التكرارات وأي إدخالات غير صحيحة أو غير متوازنة. عندما يتم تنظيف مجموعة البيانات، يمكنك استخدام القياس والتطبيع وتقنيات تحويل البيانات الأخرى لجعل المجموعة مناسبة لخوارزميات الذكاء الاصطناعي. قم بتقسيم مجموعة البيانات الخاصة بك إلى ثلاثة أجزاء:
- بيانات التدريب لتعليم النماذج
- التحقق من صحة البيانات لتقييم أداء النموذج أثناء التدريب
- اختبار البيانات لقياس الأداء بعد الانتهاء من عملية التدريب
لمزيد من المعلومات، راجع دليلنا التفصيلي حول كيفية إعداد البيانات للتعلم الآلي.
الخطوة 3: اختر تقنية الكشف عن الشذوذ
هذه الخطوة مناسبة فقط إذا كنت تريد إنشاء حل مخصص. ستختار أنت أو بائع التكنولوجيا الخاص بك تقنية الذكاء الاصطناعي الأنسب لمعالجة مشكلة العمل. هناك ثلاثة عوامل رئيسية يجب مراعاتها هنا:
- المهمة المطروحة (راجع الخطوة 1 أعلاه). إذا كنت تريد اكتشاف الحالات الشاذة المحددة بشكل محدد، فإن Variational Autoencoder (VAE) يعد خيارًا رائعًا.
- المتطلبات الفنية . قد يتضمن ذلك مستويات الدقة والتفاصيل التي تهدف إلى تحقيقها. على سبيل المثال، إذا كنت ترغب في تدريب نموذج تعلم الآلة الذي يكتشف الحالات الشاذة في مقاطع الفيديو، فإن تحديد معدل الإطارات الأمثل هو المفتاح، نظرًا لأن الخوارزميات المختلفة تحلل الإطارات بسرعات مختلفة. طالما أن الشذوذ الذي تريد اكتشافه يمكن أن يحدث خلال ثانية واحدة، فمن المستحسن أن تدرس كل إطار في مقطع الفيديو، ويصبح استخدام الخوارزميات الأبطأ، مثل VAE، غير عملي. من ناحية أخرى، يمكن لتحليل القيمة المفردة (SVD) القيام بالمهمة بشكل أسرع بكثير.
- حجم مجموعة بيانات التدريب الخاصة بك . لا يمكن تدريب بعض النماذج، مثل أجهزة التشفير التلقائي، بشكل صحيح على مجموعات البيانات الصغيرة.
الخطوة 4: بناء/شراء وتدريب النموذج
يمكنك إما شراء برنامج جاهز للكشف عن الحالات الشاذة أو تنفيذ نظام مخصص يتوافق مع احتياجاتك الفريدة ويكون مصممًا ليناسب نوع الحالات الشاذة التي تهتم بها.
يمكنك اختيار نظام جاهز للكشف عن الحالات الشاذة عندما تكون لديك موارد مالية محدودة، أو لا توجد مجموعة بيانات تدريب مخصصة، أو لا يوجد وقت للتدريب النموذجي، ويمكنك العثور على بائع يقدم بالفعل حلاً يمكنه اكتشاف نوع الحالات الشاذة أنت قلق بشأن. لكن ضع في اعتبارك أن هذه الحلول تحتوي على افتراضات مضمنة فيما يتعلق بخصائص البيانات وستعمل بشكل جيد طالما ظلت هذه الافتراضات قائمة. ومع ذلك، إذا انحرفت بيانات شركتك عن خط الأساس هذا، فقد لا تكتشف الخوارزمية الحالات الشاذة بنفس الدقة.
إذا كانت لديك بيانات كافية لتدريب خوارزميات الذكاء الاصطناعي، فيمكنك الاستعانة بشركة تطوير تعلم الآلة لبناء وتدريب حل مخصص للكشف عن الحالات الشاذة. سيتم تصميم هذا الخيار لتلبية احتياجات عملك ويتناسب مع عملياتك. فائدة أخرى رائعة هي أنه لا يزال بإمكانك تحسين هذا الحل حتى بعد النشر. يمكنك تعديل إعداداته لجعله يعمل بشكل أسرع أو التركيز على معلمات مختلفة، اعتمادًا على متطلبات عملك المتغيرة.
الخطوة 5: نشر الحل ومراقبته
ستقوم بنشر حل الكشف عن الحالات الشاذة إما محليًا أو في السحابة. إذا كنت تعمل مع ITRex، سيكون لدينا خياران لتختار من بينهما:
- الكشف عن الحالات الشاذة المستندة إلى السحابة ، حيث نقوم بتجميع البيانات من أنظمة البرامج والأجهزة وخدمات الطرف الثالث الخاصة بك ونقلها إلى السحابة للتخزين والمعالجة لإزالة العبء عن مواردك المحلية.
- اكتشاف شذوذ الحافة ، حيث تقوم خوارزميات ML بتحليل بياناتك محليًا وتحميل جزء فقط من البيانات إلى السحابة. يعتبر هذا النهج هو الأنسب للأنظمة ذات المهام الحرجة التي لا تتحمل التأخير، مثل المركبات ذاتية القيادة وحلول إنترنت الأشياء الطبية.
تستمر خوارزميات تعلم الآلة في التعلم أثناء العمل، مما يسمح لها بالتكيف مع أنواع جديدة من البيانات. ولكن هذا يعني أيضًا أنهم قد يكتسبون التحيز والميول الأخرى غير المرغوب فيها. لتجنب هذا السيناريو، يمكنك جدولة عملية تدقيق لإعادة تقييم أداء الخوارزميات وتنفيذ التعديلات اللازمة.
كيف يمكن أن يساعد ITRex في الكشف عن الحالات الشاذة
في ITRex Group، لدينا خبرة واسعة في نماذج تعلم الآلة، مثل أجهزة التشفير التلقائي بيتا المتغيرة (Beta-VAE) ونماذج الخليط الغوسي (GMM)، وإنترنت الأشياء، وتحليلات البيانات، وتصور البيانات. لقد قمنا بتطبيق هذه التقنيات في صناعات مختلفة، لذلك نحن على دراية بالتفاصيل التي توفرها القطاعات شديدة التنظيم، مثل الرعاية الصحية. نحن نستخدم مزيجًا من التكنولوجيا مفتوحة المصدر والملكية، مثل أدوات استخراج البيانات وأطر تعلم الآلة، لتطوير حلول مخصصة ودمجها في عمليات عملك.
يمكن لحلولنا المخصصة القائمة على الذكاء الاصطناعي للكشف عن الحالات الشاذة أن تعمل مع كلتا المهمتين — اكتشاف الحالات الشاذة المحددة مسبقًا واكتشاف أي انحراف عن السلوك القياسي المحدد. يمكنك اختيار السحابة لحفظ البنية التحتية، أو يمكننا تشغيل النظام محليًا لدعم التطبيقات المهمة التي لا تتحمل زمن الاستجابة.
هل أنت مهتم بتنفيذ نظام الكشف عن الشذوذ؟ ترك لنا خط ! يمكننا مساعدتك في بناء وتدريب نموذج ML مخصص. حتى إذا اخترت حلاً جاهزًا، وإذا كان مفتوح المصدر ويحتوي على واجهة برمجة التطبيقات (API)، فلا يزال بإمكاننا إعادة تدريبه على بياناتك الخاصة بحيث يناسب نظامك بشكل أفضل!
نُشر في الأصل على https://itrexgroup.com في 1 أغسطس 2023.