تخطي إلى المحتوى الرئيسي
الرئيسيةالمشاريعتعلم الآلةنظام التنبؤ بتغيب الموظفين (Employee Attrition)
تعلم الآلة
مشروع عملي احترافي

نظام التنبؤ بتغيب الموظفين (Employee Attrition)

توقع احتمالية ترك الموظف للشركة باستخدام HR Analytics

متوسط
2-3 أسابيع
4 مهارات

مقدمة المشروع

في هذا المشروع العملي، ستتعلم كيفية توقع احتمالية ترك الموظف للشركة باستخدام hr analytics. هذا المشروع مصمم خصيصاً لمستوى متوسطويستغرق تقريباً 2-3 أسابيع لإكماله بشكل كامل.

سنتبع منهجية CRISP-DM (Cross-Industry Standard Process for Data Mining) المعترف بها عالمياً، والتي تضمن بناء مشروع احترافي قابل للتطبيق في بيئة الإنتاج.

ماذا ستتعلم؟

التعامل مع بيانات HR Analytics
فهم Feature Importance و SHAP Values
معالجة Class Imbalance
تقديم توصيات قابلة للتنفيذ للإدارة
منهجية CRISP-DM

خطوات العمل التفصيلية

اتبع هذه الخطوات الست لبناء مشروع احترافي

1
📊

Business Understanding

فهم المشكلة

تحديد الأهداف والمتطلبات من منظور الأعمال

الخطوات العملية:

تحديد تكلفة استبدال موظف - تصل إلى 150-200% من راتبه السنوي. تحليل معدل التغيب الحالي وتأثيره على الإنتاجية. تحديد أهداف النموذج: التنبؤ المبكر بالموظفين المعرضين للمغادرة. دراسة العوامل المحتملة: الراتب، الرضا الوظيفي، المسافة، ساعات العمل الإضافية، الترقيات.

2
🔍

Data Understanding

فهم البيانات

جمع البيانات الأولية والتعرف عليها وتحديد جودتها

الخطوات العملية:

تحميل IBM HR Analytics Dataset (1,470 موظف، 35 ميزة). استكشاف Attrition Rate: 16.1%. تحليل المتغيرات: Age, Department, JobRole, MonthlyIncome, YearsAtCompany, JobSatisfaction. رسم Distribution plots لكل متغير حسب Attrition. تحليل Correlation: هل الراتب المنخفض يرتبط بالتغيب؟ دراسة التوزيعات الديموغرافية.

3
🧹

Data Preparation

تحضير البيانات

تنظيف وتحويل البيانات لتكون جاهزة للنمذجة

الخطوات العملية:

معالجة Class Imbalance (84% stayed vs 16% left). تحويل المتغيرات الفئوية: Department, JobRole, MaritalStatus باستخدام One-Hot Encoding. Feature Engineering: Years Since Last Promotion, Income to Age Ratio, Total Satisfaction Score. تطبيع المتغيرات الرقمية. إنشاء ميزات تفاعلية: OverTime × Distance, JobSatisfaction × YearsAtCompany. تقسيم البيانات 80/20 مع Stratification.

4
⚙️

Modeling

بناء النموذج

اختيار وتطبيق تقنيات النمذجة المناسبة

الخطوات العملية:

بناء Baseline مع Logistic Regression. تطبيق Decision Tree لفهم القرارات. بناء Random Forest مع Feature Importance. تطبيق XGBoost للأداء الأفضل. استخدام SMOTE لمعالجة Imbalance. تطبيق GridSearchCV و RandomizedSearchCV. Ensemble: Voting Classifier يجمع أفضل النماذج.

5

Evaluation

التقييم

تقييم النموذج والتأكد من تحقيق الأهداف

الخطوات العملية:

حساب Recall (مهم لعدم تفويت موظفين معرضين للمغادرة) و Precision. رسم ROC Curve و حساب AUC. تحليل Feature Importance: أهم 10 عوامل. تطبيق SHAP Values لتفسير تنبؤات النموذج لكل موظف. Confusion Matrix: كم موظف سنتوقع مغادرته خطأً؟ Cost-Benefit Analysis للنموذج.

6
🚀

Deployment

النشر

نشر النموذج في بيئة الإنتاج

الخطوات العملية:

بناء Dashboard تفاعلي بـ Streamlit/Dash لفريق HR. عرض Employee Risk Scores مرتبة من الأعلى للأقل. إنشاء تقارير مخصصة لكل موظف مع العوامل المؤثرة. تقديم توصيات: زيادة راتب، تقليل ساعات إضافية، ترقية. نظام تنبيهات عند ارتفاع Risk Score. توثيق وتدريب فريق HR على استخدام النظام.

المصادر والأدوات

IBM HR Analytics Dataset - Kaggle
SHAP Documentation
XGBoost for HR Analytics

المهارات المطلوبة

ClassificationFeature ImportanceXGBoostSHAP

إحصائيات سريعة

المستوىمتوسط
المدة2-3 أسابيع
المهارات4
الخطوات6
العودة للمشاريع