אנליטיקה עסקית ו – data mining - עבודת גמר

מוסד לימוד
סוג העבודה
מקצוע
מילות מפתח ,
ציון 85
שנת הגשה 2022
מספר מילים 883

תקציר העבודה

1. שלב הכנת הנתונים
שלב 1 – העלאת קובץ csv
שלב 2– הורדה של עמודה counter
שלב 3 – הפיכת נתונים מ – נומרי לנומינלי (מספר האורחים ומספר השולחנות)
פיתוח מודלים – לפתח 12 מודלים של קלסיפיקציה 6/12 j48 לפחות 4/12 מודלים יפותחו באמצעות שיטות קלסיפיקציה אחרות.

Use training test – עושים על מנת להימנע מהתאמת יתר (overfitting) מחלקים את הנתונים ל2 קבוצות train/test על מנת לוודא שאין התאמת יתר לרוב החלוקה תהיה 2/3, 1/3. Cross validation – לאחר חלוקת הנתונים train/test לכל מודל k בונים מודל אופטימלי על סמך התצפיות בסט ה – training ובוחנים את טיב המודל שאימנו על סמך התצפיות על סט ה – test.