Spiralogram for Time Series visualization

Spiralogram is a useful visualization tool.
It helps us to understand better the seasonality and pereodicity in time series.

מטרה: ללמוד איך להציג סדרות זמן בצורה ויזואלית נוחה להבנה וניתן בעזרת מודול spiralogram

זמן הקריאה: כ-15 דקות

 

בהדרכה זו נדגים:

  • איך להוריד נתונים מאתר תחרויות של מדעני נתונים KAGGLE
  • איך לפתוח את הנתונים בתוכנה חינמית ORANGE
  • איך להשתמש במודול spiralogram כדי להציג את הנתונים בצורה ויזואלית

מבוא: סדרות זמן time series הם נתונים הנאספות לאורך הזמן. למשל, טמפרטורה ימית הנמדדת פעם ביום, או מחיר מנייה הנמדד פעם בדקה.

 

הורדת נתונים: יש להוריד וקובץ בשם ma_lga_12345.csv מאתר תחרויות של מדעני נתונים KAGGLE.

https://www.kaggle.com/datasets/htagholdings/property-sales?resource=download

פתיחת נתונים בעזרת מודול file: הריצו תוכנה ORANGE ואז פתחו את הנתונים בעזרת מודול file

כמו שאפשר לראות מתיור הקצר בנתונים שלנו יש 347 תצפיות ו-4 מאפיינים: MA מחיר, SALEDATE תאריך מכירה,  TYPEסוג של הבית, מספר חדרי שיני.

אשפר לחקור את הנתונים בעזרת כלים סטנדרטים לאנליזה ראשונית: data table, feature statistics, distributions

אבל היות ומדובר בסדרת הזמן, נעזר בכלים מתאימים יותר, למשל בספיראלוגרם.

בעזרת מודל EDIT DOMAIN שינו את סוג של משתנה SALEDATE לסוג TIME ואז חברו את התוצאה למודול SPIRALOGRAM כמו בציור למעטה

כעת פתחו את המודול ספירלוגרם:

בחרו time period להיות שווה saledate במרווחי זמן – שנה, radial להיות שווה למספר חדרי שינה, כדאי לראות שוני במחרה בתים לפי מספר חדרי שינה ו-сolor להיות שווה למחיר .MA

כמו שאפר לראות בקלות – מחירה בית עולים משנה לשנה וככל שיש יותר מספר חדרי שינה מחרי בית גם כן עולים.