מרכז המחקר למדעי הנתונים באוניברסיטת חיפה מציע סידרה של סדנאות לחברי סגל וסטודנטים למחקר שאין להם רקע בתחום מדעי הנתונים. מטרת הסדנאות לחשוף את התחום דרך כלים, מודלים ודוגמאות מעשיות. בכל סדנא יש דגש קצת שונה, וניתן להירשם ליותר מסדנא אחת.

בחלק מהסדנאות המפגשים האחרונים יוקדשו לפרויקט קצר על דאטה סטים מעניינים, בשביל ליישם את מה שנלמד. המשתתפים גם יכולים להביא את נתוני המחקר שלהם לצורך הפרויקט (בבדיקה מראש איתנו, דרך טופס ההרשמה).

חלק מהסדנאות יהיו נגישות דרך האתר של המרכז , ללמידה מקוונת, לאלו שלא יכולים להיצטרף בזמן אמת. אין ציון לסדנאות, וגם המטלות בין מיפגשים הן מינימליות, אופציונאליות, ורק במטרה שהמשתתפים יפיקו את המקסימום מהסדנאות.

הסדנאות ממומנות עיי המרכז, ואינן כרוכות בתשלום לחוקרי ותלמידי האוניברסיטה לתארים מתקדמים.

קורסים מוקלטים לצפייה עצמית
קורסים פרונטליים
קורסים פרונטליים
קורסים מוקלטים
לצפייה עצמית

קורסים קרובים - רמת מתקדמים

Dr. Imri Aharoni
University of Haifa, Carmel campus

Main building, room 577

27.10.2024 Sunday and 30.10.2024 Wednesday
09:00-16:30

The Time Series Analysis course aims to provide a hands-on introduction to analyzing time series data using Python, covering foundational principles, analytical methods, and predictive techniques. This includes stationarity, autocorrelation, multivariate dependencies, forecasting methods, and an introduction to machine learning and deep learning technics such as RNNs and LSTM models. 
The course integrates theory with practical application, enhancing skills in time series analysis for both academic research and professional development. 

Target Audience:
This course is designed for research students—Master’s, PhD, and postdoctoral students from all faculties who are looking to deepen their expertise in time series analysis using Python
 
Prerequisite Knowledge:
Participants are expected to have a basic understanding of statistics and familiarity with Python for data analysis
 

For those looking to strengthen their Python skills before starting the course, we recommend the following online resources:

  • Campos IL Self.py (Available in Hebrew) – A beginner-friendly course that introduces the fundamentals of Python programming.
  • IBM: Python Basics for Data Science – This course covers Python essentials tailored for data science, focusing on practical applications and data handling techniques.

קורסים למתחילים

Applications of machine learning 222.4036
Semester B

Dr. David Deutsch, Dept. of Neurobiology
Dr. Eitan Hemed
University of Haifa, Carmel campus

Main building, computer room 572

Monday, 08:00-11:00

This course gives a overview on machine learning, with an emphasis on application. We will explain basic concepts, and sometimes dive a bit into the math, but will mostly stay at the level of understanding when and how to use the tools we discuss.
No previous knowledge in machine learning is assumed, but students are expected to have basic programming skills to be able to follow the tutorials and submit the assignments. Basic knowledge is statistics is also assumed.
We will start by discussing regression, and use if to also cover some basic concepts like optimization and cross-validation. Then we will move to discussing supervised and unsupervised learning, including dimensionality reduction. In the tutorial we will mostly use scikit-learn, a machine-learning python package.  

Data Science Summer School - 2023

Dr. David Deutsch, Dept. of Neurobiology
Prof. Daniel Sher, Dept. of Marine Biology
Dr. Uri Hertz, Dept. of cognitive sciences
Dr. Tomer sidi, Data Science Research Center
Dr. Iftach Amir, Data Science Research Center
Carmel campus

Madrega building, room 2007

4-13.9.2023, 08:30-18:30

Over the last few years data science tools, and especially machine learning (ML) techniques, have become increasingly popular and are now widely used in both the academia and the industry. The Haifa Data Science Summer School provides an overview of the variety of tools employed in machine learning. The course is aimed for students from diverse disciplines, with no prior experience using Machine-learning, and with a minimal experience in programming.
Our aim is to give each student enough theoretical and practical background to allow them to apply a wide range of ML techniques in their own work. Topics we will cover include exploratory data analysis, supervised learning (regression and classification, neural networks) and unsupervised learning (clustering, dimensionality reduction). For each topic, we start from an introduction, then discuss its uses, strengths, and limitations, then dedicate time for hands-on experience. Special attention will be devoted on
applying the methodologies introduced in class on empirical data using Jupyter notebooks coded in Python, with the machine-learning package ‘Scikit-learn’ (https://scikit-learn.org/ ).
It is an intense 8-day course (8:30am-6:30pm daily), with a final project. Students are expected to attend to all the meetings. Basic Python programming is a required. There will be a 4-hour prep meeting for students who wish to brush up on their Python skills, and we will also share some recommended online sources. Upon completion of the course requirements, registered students will be credited 3 academic points. The course will be given in English.
The course is open to 50 advanced (MSc and PhD) students, postdocs and research scientists from the university of Haifa and affiliated institutes (e.g. Oranim). Advanced undergraduate students are also welcome to apply and will be accepted based on free space. Participants taking the course for academic credit are required to register and to submit a final course project.

מבוא לעולם של סימולציה

ד"ר איגור קליינר
קורס מוקלט לצפיה עצמית

תיאור הקורס: מבוא קצר לעולם של סימולציה למדעי החברה. היכרות עם סוגים שונים של בעיות סימולציה: סימולציה סטטית, סימולציה דינמית,
סימולציה מבוססת סוכנים. בקורס נראה דוגמאות למחקרים משתמשים בסימולציה, חלק מהמחקרים נשחזר ביחד בחלק מעשי.ביחד ונכיר כלים מגוונים לסימולציה: Orange, Excel, Arena, NetLogo.

דרישות קדם: אין

הערות: הקורס מיועד לחוקרים וסטודנטים מתארים מתקדמים ללא ידע מיוחד בתכנות או מדעי הנתונים.

תוכן עניינים:
 
1) מוטיבציה דוגמאות ראשוניות: סגרגציה ומודל של Scheling, פקקים בכביש  – מודל פשוט, תורים בשירותים, איך לנהל בית החולים, מחט של בופון.
2) הגדרות ראשוניות וכלים  בסיסיים לפתרון בעיות סימולציה. מספריים אקראיים. 
3) סימולציה סטטית דוגמאות – קזינה, הילוך אקראי, נהיול משכנטע.
4) סימולציה דינמית שימוש בתוכנת ARENA.  אנליזה מה אם – WHAT IF ANALYSIS. מערכות שירות, ניהול מחסן.
5) סימולציה מבוססת סוכנים, NETLOGO, בניית מודלים לאוכלוסיות מלכותיות מודל SUGARSCAPE, אבולוציה, ירושה וכסף. 
6) סיכום, איך להמשיך, סימולציה למדעי הנתונים.

כריית טקסטים בעזרת פייתון

ד"ר איגור קליינר
קורס מוקלט לצפיה עצמית

תיאור הקורס: הקורס יסקור באופן תיאורטי ומעשי מושגי בסיס בעיבוד דאטה טקסטואלי. נתייחס לשלבים השונים הכרוכים בעיבוד וניתוח סטטיסטי של טקסט בקנה מידה גדול. לצורך זה, נסקור ייצוגים שונים של טקסט, נבצע הסרת רעשים, והפרדה למשפטים ומילים. כמו כן, נעסוק בתיוג הטקסט במימדים של מבנה תחבירי ומידע סמנטי. הקורס יקנה מיומנות ביישומים שונים בהם שימוש בלקסיקונים, למשל לצורך ביצוע הסקה של ביטויים רגשיים), analysis sentiment (ואיתור מבוסס- חוקים של פרטי מידע רלבנטיים בטקסט). 

דרישות קדם: ידע בסיסי בתכנות פייתון

יסודות מדעי הנתונים - KNIME

ד"ר איגור קליינר
קורס מוקלט לצפיה עצמית

תיאור הקורס: קורס התחלתי שיכיר לכם את הרעיונות בבסיס של מדעי הנתונים. הקורס כולל עבודה hands-on עם התוכנה KNIME , ללא צורך בתכנות.

דרישות קדם: אין

הערות: קורס אונליין, מורכב מ-7 שיעורים מוקלטים. במסגרת הקורס סטודנטים נחספים לעולם של מדעי הנתונים ולומדים סביבה עבודה עם דאטה – KNIME. בנוסף סטודנטים רואים דוגמאות שימוש בתוכנה חינמית ORANGE וגם היכרות ראשונית עם שפת תכנות פייתון 3.-היכרות עם עולם מדעי הנתונים
-עבודה עם תוכנת KNIME
-סוגים של נתונים, הצגה גרפית של נתונים ומדדים חשובים
-תהליך העבודה של מדען נתונים CRISP-DM
-עיבוד מקדים של נתונים
-שיטות ניבוי: רגרסיה וקלסיפיקציה
-קלסטרינג
-בדיקת איכות של מודל-עקרונות עבודה של מדעי נתונים, טעויות ומלכודות נפוצות
-עבודה עם דאטה טקסטואלי
-עבודה עם תמונות  \ רשתות ניורוניות

יסודות מדעי הנתונים (מחזור 7)

ד"ר איגור קליינר
קורס מוקלט לצפייה עצמית

תיאור הקורס: קורס מבוא. בקורס נכיר את הרעיונות בבסיסים של מדעי הנתונים. הקורס כולל עבודה hands-on עם התוכנה Orange, ללא צורך בתכנות.

דרישות קדם: אין

הערות: 8-9 מפגשים במהלך הסמסטר, כולל תרגול מעשי. שני המפגשים האחרונים יוקדשו לעבודה עלדאטה סטים מורכבים (ניתן להביא את הנתונים שלכם).

–  היכרות עם עולם מדעי הנתונים

–  עבודה עם תוכנת Orange

–  סוגים של נתונים, הצגה גרפית של נתונים ומדדים חשובים

–  תהליך העבודה של מדען נתונים CRISP-DM

–  עיבוד מקדים של נתונים

–  שיטות ניבוי: רגרסיה וקלסיפיקציה

–  למידה לא מפוקחת – מציאת אשכולות

–  בדיקת איכות של מודל

–  עקרונות עבודה של מדעי נתונים, טעויות ומלכודות נפוצות

–  עבודה עם דאטה טקסטואלי

– עבודה עם תמונות/רשתות עצביות

– בניית רשת ואימון רשת בעזרת תוכנה LOBE

– התרסקות של חברות ELRON – מדעי הנתונים בבית משפט

– אתיקה של מדעי הנתונים

– איך להמשיך?

מדעי הנתונים ולמידת מכונה

ד"ר קובי מייק
קורס מוקלט לצפיה עצמית

תיאור הקורס: מבוא למדעי הנתונים, פייתון ותכנות למדעי הנתונים, למידת מכונה, נתונים טבלאיים וpandas, חקר נתונים, KNN, מדדי ביצוע, ניקוי נתונים, תהליך פיתוח פרויקט, נתונים לא מובנית (תמונות), אלגוריתמי ML.

דרישות קדם: אין

הערות: הקורס הוכן לתלמידי תיכון במגמת מדעי המחשב. הפלייליסט המצורף ביוטיוב אינו הקלטה של הקורס אלא אוסף של סרטונים שקשורים לקורס, כלומר אי אפשר לראות את הקורס לפי רצף הסרטונים ובהתאם למצגות שקיימות בדרייב, אלא הסרטונים הם יותר לתמיכה בחומרים שונים.

מבוא לתכנות מדעי - פייתון 3

ד"ר איגור קליינר
קורס מוקלט לצפיה עצמית

תיאור הקורס: הקורס מורכב מ-14 הרצאות, מלמד יסודות של שפת תכנות פייתון ושימושים שלה בתחומים שונים.

דרישות קדם: אין

הערות: הקורס הוכן לתלמידי תיכון במגמת מדעי המחשב. הפלייליסט המצורף ביוטיוב אינו הקלטה של הקורס אלא אוסף של סרטונים שקשורים לקורס, כלומר אי אפשר לראות את הקורס לפי רצף הסרטונים ובהתאם למצגות שקיימות בדרייב, אלא הסרטונים הם יותר לתמיכה בחומרים שונים.

Fundamentals of Deep Learning -
NVIDIA Endorsed Course

ד"ר תומר סידי
יום רביעי, 15.11.2023, בשעות 09:00-15:00

תיאור הקורס: סדנא מעשית התחלתית בשיתוף עם NVIDIA בה תלמדו איך עובדים מודלים ללמידה עמוקה (Deep Learning) עם התנסות מעשית באימון מודלים לזיהוי תמונה ועיבוד שפה טבעית. בסדנא תאמנו ותבנו מודלים מהתחלה בעזרת הפלטפורמה Keras2.0 ו-tensorflow ותלמדו טריקים שונים כדי להגדיל את איכות המודלים שלכם. כמו כן, תלמדו להוריד, להפעיל ולהתאים מודלים state-of-the-art עבור השימושים שלכם. הקורס חינמי לחוקרי האוניברסיטה.

דרישות קדם: הבנה של מושגי יסוד בסיסיים בתכנות ב-python3 כמו פונקציות, לולאות ומילונים. כמו כן, היכרות שטחית עם Pandas ורגרסיה.

הערות: סדנא מעשית בתחום של למידה עמוקה מבית NVIDIA תחת הדרכה של המרכז למדעי הנתונים של אוניברסיטת חיפה. הסדנא מורכבת מ-6 שיעורים שונים ותרגול מעשי לאחר כל שיעור. הסדנא כוללת עבודה מסכמת קצרה שבסיומה תתקבל תעודת סיום קורס מבית NVIDIA.

קורסים למתקדמים

Dr. Imri Aharoni
University of Haifa, Carmel campus

Main building, room 577

27.10.2024 Sunday and 30.10.2024 Wednesday
09:00-16:30

The Time Series Analysis course aims to provide a hands-on introduction to analyzing time series data using Python, covering foundational principles, analytical methods, and predictive techniques. This includes stationarity, autocorrelation, multivariate dependencies, forecasting methods, and an introduction to machine learning and deep learning technics such as RNNs and LSTM models. 
The course integrates theory with practical application, enhancing skills in time series analysis for both academic research and professional development. 

Target Audience:
This course is designed for research students—Master’s, PhD, and postdoctoral students from all faculties who are looking to deepen their expertise in time series analysis using Python
 
Prerequisite Knowledge:
Participants are expected to have a basic understanding of statistics and familiarity with Python for data analysis
 

For those looking to strengthen their Python skills before starting the course, we recommend the following online resources:

  • Campos IL Self.py (Available in Hebrew) – A beginner-friendly course that introduces the fundamentals of Python programming.
  • IBM: Python Basics for Data Science – This course covers Python essentials tailored for data science, focusing on practical applications and data handling techniques.
Dr. David Deutsch and Dr. Lilach Avitan
University of Haifa, Carmel campus

Hamadrega building, room 2007

15-19.9.2024 Sunday - Thursday
08:30-18:00

3 Credit points

Over recent years, there has been a proliferation of methods aimed at automating the quantification of animal behavior at an unprecedented level of detail. This surge has given rise to the burgeoning field of computational ethology, promising to revolutionize our ability to comprehensively understand animal actions within their environments. The imperative to refine our behavior characterization techniques is underscored by the growing realization that unraveling behavior is not only crucial but often a prerequisite for tackling questions in neuroscience.

The utility of these methodologies extends beyond studying behavior solely in natural or strictly ethological contexts. Modern tools for behavioral quantification can enrich a broad spectrum of approaches used to correlate brain function with behavior, spanning from psychophysics to cognitive tasks. These methods offer the potential to augment traditional measurements with nuanced insights into how animals navigate various challenges.

In this 5-day course, we will delve into computational strategies for quantifying animal behaviors. Participants will explore recent advancements in behavior quantification, focusing particularly on tracking animal motion, characterizing dynamics using both supervised and unsupervised methods, and assessing group or collective behaviors.

The course will feature a blend of introductory lectures, guest talks highlighting scientific applications of behavioral quantification, and hands-on practical sessions. The workshop is open to 30 advanced (MSc and PhD) students, postdocs and research scientists from all universities. Prerequisite courses include Python programming and basic statistics. The course is given in English.

Participants taking the course for academic credit are required to register through the secretariat of their university and to submit a final course project.

For more information please contact: David (Dudi) Deutsch. ddeutsch1@univ.haifa.ac.il

Applications of AI for Anomaly Detection -
NVIDIA Endorsed Course

ד"ר תומר סידי
יום חמישי, 16.11.2023, בשעות 09:00-15:00

תיאור הקורס: קורס מעשי לזיהוי אנומליות בעזרת machine learning ו-deep learning.

דרישות קדם: ניסיון ב-machine learning ובאימון מודלים של למידה עמוקה (השלמה של הסדנא Fundamentals of Deep Learning מספקת). ידע בתכנות בפייתון.

הערות: סדנא מעשית בתחום של למידה עמוקה מבית NVIDIA תחת הדרכה של המרכז למדעי הנתונים של אוניברסיטת חיפה. הסדנא מורכבת מ-4 שיעורים שונים ותרגול מעשי לאחר כל שיעור.

הסדנא תכיר למשתתפים 3 סוגי מודלים בזיהוי אנומליות: 1 מבוסס עצים ע”ב XGBoost ו- 2 מבוססי למידה עמוקה. כמו כן, הסדנא כוללת עבודה מסכמת קצרה שבסיומה תתקבל תעודת סיום קורס מבית NVIDIA.

Building Transformer-Based Natural Language Processing Applications -
NVIDIA Endorsed Course

ד"ר תומר סידי
קמפוס העיר, חיפה

בניין עמיר, חדר 413

ימים רביעי-חמישי, 20-21.12.2023, בשעות 09:00-15:00

In this workshop, you’ll learn how Transformers are used as the building blocks of modern large language models (LLMs). You’ll then use these models for various NLP tasks, including text classification, named-entity recognition (NER), author attribution, and question answering. You’ll also learn how to analyze various model features, constraints, and characteristics to determine which model is best suited for a particular use case based on metrics, domain specificity, and available resources.

:Prerequisites

  • Python programming experience.
  • Basic understanding of neural networks, and a fundamental understanding of a deep learning framework such as TensorFlow or PyTorch

NVIDIA DLI offers hands-on training for developers, data scientists, and researchers looking to:

  • Learn how Transformers are used as the basic building blocks of modern LLMs for NLP applications
  • Learn how self-supervision improves upon the Transformer architecture in BERT, Megatron, and other LLM variants for superior NLP results
  • Leverage pretrained, modern LLM models to solve multiple NLP tasks such as text classification, NER, and question answering
  • Manage inference challenges and deploy refined models for live applications

סדנה בנושא: תשתיות חישוביות במדעי הנתונים

פרופ' מרקו סקוטרי ומאורו מלבסטיה
ZOOM

קישור למפגשי הזום ישלחו לנרשמים

24.5.2023 ,17.5.2023 ,10.5.2023
בשעות 14:00-17:00

תיאור הקורס: מדעני נתונים מקציע מאוד מבוקש שמשלב יכולות בתחום האנליטיקה והסטטיסטיקה, הבנת צרכים עסקיים ושימוש בתשתיות חישוביות לפיתוח ויישום של מודלים ושיטות שונות.
הסדנה מכוונת לספק למתעניינים ביישומים של מדעי הנתונים הבנה בתשתיות מחשוב, כלים ואמצעים המספקים תשתית לעבודת הפיתוח וההטמעה בשטח של מודלים ושיטות אנליטיות.

דרישות קדם: הקורס מיועד עבור מדעני נתונים, סטטיסטיקאים, מהנדסי נתונים, מפתחי ומיישמי אנליטיקה בתחומים שונים

למידה עמוקה

ד"ר קובי מייק
קורס מוקלט לצפיה עצמית

תיאור הקורס: הכרת הרעיון היסודי של למידה עמוקה, העמקת הידע בשפת תכנות (פייתון, net ו- J2ee), חישוב בעזרת רשת נוירונים (כולל כיוונון ואימון שלה), רשתות קונבולוציה לעיבוד תמונה, רשתות חוזרות לקלט לאורך זמן.

דרישות קדם: סיום קורס כלשהו ב”יסודות מדעי המחשב”

הערות: הקורס הוכן לתלמידי תיכון במגמת מדעי המחשב. הפלייליסט המצורף ביוטיוב אינו הקלטה של הקורס אלא אוסף של סרטונים שקשורים לקורס, כלומר אי אפשר לראות את הקורס לפי רצף הסרטונים ובהתאם למצגות שקיימות בדרייב, אלא הסרטונים הם יותר לתמיכה בחומרים שונים.

הקורס המקוון העברי הראשון בבינה מלאכותית

פרופ' רוני שטרן, פרופ׳ קובי גל, פרופ' אריאל פלנר, פרופ' מאיר קלך, פרופ' גיא שני, פרופ' רונן ברפמן, ד"ר נדב רפפורט וד"ר דור עצמון.
קורס מוקלט לצפיה עצמית

תיאור הקורס: הקורס עלה לאוויר בפלטפורמה הלאומית של קמפוס IL, וכבר רשומים אליו מעל ל ל500 לומדים. הקורס פותח על ידי חברי סגל באוניברסיטת בן גוריון שהם חוקרים מובילים בתחום והופק במסגרת הפרוייקט של מל”ג להנגשת התחום של מקצועות טכנולוגיים למגוון רחב של קהלים.