Box Plot for Clusters Characterising
Unsupervise learning can be impoved by different visualization techniques and additional the combination of visualization and old school box plot can give fruitfull results.
מטרה: ללמד דרך נוספת לאפיון אשכולות
זמן הקריאה: כ-10 דקות
בהדרכה זו נדגים:
- איך לבצע למידה ללא מורה – למצוא אשכולות בעזרת מודול ויזואלי TSNE
- איך להבין מהות של אשכולות בעזרת מודול BOX PLOT
מבוא: בלמידה לא מפוקחת אין משתנה מטרה. אחת המשימות השימושיות במקרה זה היא לחלק נתונים לאשכולות. עבר לחפש אשכולות בדרכים שונות: kmeans, dbscan, hierarchical clustering, tsne,…
אחרי שחוקרים מוצאים אשכולות, חשוב לנסות להבין מהי מהות של כל אשכול. היום נראה איך להשתמש במודול BOX PLOT במטרה להבין את האשכולות שקיבלנו.
- בעזרת מודול DATASETS טענו את הנתונים EMPLOYEE ATRITION
כמו שאפשר לראות בנתונים יש 1470 תצפיות ו32 משתנים.
- נעזר בשיטת הפחת מימד TSNE בעזרת מודול TSNE
אפשר לראות כאן 5 אשכולות.
כעת חשוב להבין מהו מהות של אשכול. לצורך דוגמא נבחר את האשכול הימיני ביותר. יש להיעזר בכפתור CTRL כדי לבחור את הנקודות של האשכול.
- נחבר את המודול BOX PLOT למודול TSNE
אפשר לראות שבאשכול שבחרנו כולם ממחלקת SALES
לצורך תרגיל עצמי כדאי לנסות נתונים אחרים, אפשר גם להשתמש בשיטות שונות לחיפוש אשכולות.