Random Forest for Regression and Classification

Random forest is a very robust and powerful prediction tool.
Below we will demonstrate how to use random forest in Orange Data Mining both for regression and classification problems.

המטרה : ללמוד אלגוריתם גמיש לחיזוי – יער אקראי

זמן הקריאה: כ-20 דקות

בהדרכה זו נדגים:

  • איך להשתמש במודול RANDOM FOREST ולבנות מודלים לניבוי

מבוא:  קיים מספר רב של מודלי ניבוי. לכל מודל יש יתרונות וחסרונות. מודל של יער אקראי הוא אחד המודלים הגמישים אם יכולת אינטרפרטציה נמוכה.  בדרך כלל נשתמש במודל זה אם איכות ניבוי יותר חשובה מיכולת לפרש את התוצאות.

רעיון של המודל: לגדל בצורה חכמה מספר עצי החלטה (מודלים יותר פשוטים) ואז להשתמש בהרבה עצים כדי לקבל החלטה סופית.

 

שימוש ביער אקראי עבור בעיות רגרסיה:

  • פתחו את נתונים HOUSING בעזרת מודול FILE ובנו מודל לחיזוי מחיר עתידי של בית בעזרת מודול RANDOM FOREST, בעזרת מודול TEST AND SCORE העריכו איכות של המודל

אפשר לנסות לבנות מודלים אחראים ולהשוות בין תוצאתם:

כמו שאפשר לראות, כאן התקבלו תוצאות הכי טובות עבור מודל יער אקראי.

 

אפשר לנסות לעשות ויזואליזציה של יער בעזרת מודול PYPHOGORIAN FOREST

שימוש ביער אקראי עבור בעיות סיווג דומה מאוד לשימוש עבור בעיות רגרסיה.

כעת בחרו בנתוני של מחלות לב – heart disease

גם כאן אפשר להשוואת ביצועים של מודלים שונים

אפשר להיעזר בPYTHOGORIAN FOREST כדי לראות את היער שהתקבל