שיעור #7 – מטריצת הבילבול בבעיית הפירות המלל

כעת נניח ובנינו מודל ואימנו אותו על ה training database, נרצה כעת לבחון את הביצועים שלו על ה testing database. כמדד לבחון את ההצלחה נחשב את ה confusion matrix.

מטריצת הבילבול מראה לנו מה אחוז ההצלחה של האלגוריתם לסווג פרי מסויים כשקיבל כקלט פרי מסויים.

ז”א אם הזנו לאלגוריתם תמונה של בננה היא זיהה בננה בהסתברות 95% אך גם זיהה שם בהסתברות 3% ואגס בהסתברות 2%. מספרים אלו אומרים לנו עד כמה האלגוריתם עשה טעויות ואילו.

נראה שהמספרים על האלכסון גבוהים (מעל 90%) ושאר המספרים שאינם על האלכסון נמוכים וזה אומר שהאלגוריתם מוצלח, ז”א האימון היצליח.

כי 90% מתמונות האגסים אכן סווגו ע”י האלגוריתם המאומן שלנו כאגסים.

92% מתמונות התפוחים שלנו אכן סווגו ע”י האלגוריתם המאומן שלנו כתפוחים.

ובדומה 95% לגבי הבננות.

וכמובן היו גם שגיאות, למשל לאותם 10% מתמונות האגסים שלא סווגו כאגסים, חלק (8%) סווגו כתפוחים והיתרה (2%) סווגו כבננות.

ניתן לשים לב שהאלגוריתם יותר התבלבל בין אגסים לתפוחים (7%,8%) אבל בבננות פחות טעה לחשוב שהינם תפוחים או אגסים (2%,3%) שזה הגיוני כי תפוחים ואגסים דומים יותר זה לזה מאשר לבננות.

 

חזור לוידאו