תמיד חלמת ללמוד Machine Learning או Deep Learning אבל נבהלת מכל הנוסחאות? , חיפשת דוגמאות קוד והתבלבלת מכל המושגים הטכניים? חושב שהנושא של למידת מכונה מיועד רק למתמטיקאים או מדענים? זה בדיוק המאמר בשבילך!
תחום ה Deep Learning צבר תאוצה בשנים האחרונות, וכולם רוצים לקחת חלק בטכנולוגיה הזו.
היום כאשר הנושא נכנס לתודעה ורואים את מיטב החברות הגדולות ( Google , Facebook ועוד) מפתחות ספריות או Frameworks בינה מלאכותית – כמעט כל מפתח יכול להתחיל לבנות מודל בסיסי בכמה שורות קוד פשוטות.
במאמר זה נתייחס לספרייה Keras (למרות שהיא יותר קרובה להיות Framework) שהינה ספרייה עילית לבניית מודלי בינה מלאכותית או בשמם המדעי Neural Networks .
ככלל, הFlow של תהליך Deep Learning מורכב מ-3 חלקים עיקריים:
- הכנת המידע (Data)
- הגדרת מודל
- בניית המודל
- אימון של המודל – הזנת
- המידע אליו והפעלת האלגוריתמים
- חיזוי (Prediction) – שימוש במודל ובחינה שלו
לאחר שהתהליך הושלם והשגנו אחוז גבוה של דיוק (ההסתברות שהמודל שלנו יחזיר תשובות נכונות),
ניתן להכין את המודל לשלב ה-Production אולם אנחנו נעסוק בעיקר בחלק שבו אנו בונים מודל ומאמנים אותו.
מוכנים? אז בואו נתחיל!
ע”מ לבנות רשת נוירונים נדרש בסה”כ ידע מקדים באלגברה ליניארית. ובנוסף ידע בחשבון דיפרנציאלי יעזור אך לא חובה.
הרעיון בגדול מאחורי רשת נוירונים הינו בעיית רגרסיה פשוטה שבה אנו בעצם מחפשים למצוא את המקדמים של המשוואה או יותר נכון את הערך W שמבטא את מטריצת הפרמטרים למשוואה. כאשר y הינו בעצם התשובה המתבקשת שלנו – התווית שאותה נרצה שהמודל יחזה. דמיינו רובוט שאנו שואלים אותו שאלה לגבי נושא ספציפי ויחיד שבו הוא מבין, הרובוט מחזיר לנו תשובה.
זה בדיוק התהליך שהמודל שלנו עושה – אנו שולחים לו ערך והוא מחזיר לנו תווית (יכולה להיות שיוך קטגורי, מגמה, וכדו’) אולם כדי שהמודל שלנו יידע לעשות את זה עלינו לאמן אותו- לתת לו ערכים המשויכים לתווית שעליהם אנו כבר יודעים את התשובה מראש – וכך הוא בעצם לומד למצוא את האיזון הנכון עבור ערכים שהוא לא ראה מעולם ולהחזיר תווית מתאימה בהסתמך על מה שלימדנו אותו.
המבנה הפשוט של רשת נוירונים מורכב מ-3 חלקים (שכבות) :
- קלט
- שכבות ביניים (hidden) עליהם מבוצעים החישובים
- פלט
די עם ההקדמות תן לכתוב קוד!
את הקוד שלנו אנחנו נכתוב ב Python שהיא השפה הכי פופולארית לכתיבת מודלים.
שלב ראשון – התקנת הספריות:
פתחו את הטרמינל (שורת הפקודה) והקלידו את הפקודה הבאה
Pip install tensorflow
חכו כמה דק’ עד שהספרייה תתוקן.
(אנחנו בעצם מתקינים את הספריהTensorflow מבית Google אולם Keras כבר כלול בה כשכבת אבסטרקציה)
שלב 2 – הכנת ה Data
אנו נעזר ב data שכבר הוכן ונוקה עבורנו לצורכי למידה באדיבות Keras אנו נשתמש בDataset שנקרא Mnist, זה בעצם אוסף של תמונות שחור לבן המכילות ספרות בכתב יד.
בעצם מטרת המודל שלנו היא לזהות ספרות בכתב יד ולהחזיר תווית מתאימה – ספרה המיוצגת בתמונה.
שימו לב שחילקנו את הdata שלנו שלני חלקים:
- החלק המרכזי שעליו נאמן את המודל (train)
- החלק שעליו נעשה test וכך נוכל לבחון את הביצועים של המודל עבור מידע שעדיין הוא לא ראה ואומן עליו.
שלב 3 – בניית המודל , קונפיגורציה והזנת המידע (אימון)
שלב 4 – מדידת ביצועים
לאחר שאימנו את המודל נותר כעת לבחון אותו על מידע חדש שהוא לא ראה מימיו כדי לראות את היעילות שלו בפעול הלכה למעשה.
בסוף הריצה אנו אמורים לקבל משהו דומה לזה:
evaluation result: loss(0.10702921551428735) | accuracy(0.9663)
זהוו !! – כל הכבוד בניתם את המודל הראשון שלכם.
אהבתם? שתפו את הפוסט , הירשמו לבלוג שלנו לעוד פוסטים מעניינים בנושא למידה עמוקה מכל הרמות.