ELO שחקנים – על נקודת ציון, על נקודות מדד ועל הפתעה לא מפתיעה

בהמשך לטורים קודמים שלי על מדד ELO שחקנים שאני מנהל, השבוע (מחזור 22) המדד שלי הגיע לנקודת ציון חשובה.

מאז סוף הסיבוב הקודם, אני מנהל השוואה של יכולת התחזית שלי אל מול יכולת התחזית של מדד שהוצג באתר ערוץ הספורט – Euro Club Index – ECI. אני מנהל השוואה גם מול הגרסה המועדפת עלי לדירוג ELO, זו של האתר Clubelo.com, אך בנקודת הזמן הנוכחית ליגת העל לא מעודכנת כבר 3 שבועות.

שחקנים וירטואלים

השערת המחקר שלי היא שבשני האלגוריתמים האחרים הציון של קבוצה לפני משחק ניתן לה על סמך הביצועים שלה כקבוצה, ללא התחשבות בשחקנים, ולכן הם לא לוקחים בחשבון העברות, פציעות והחלטות הזויות של מאמנים בבחירת הרכבים. משום שהמדד שלי כן עושה זאת, הוא אמור לתת תחזיות יותר טובות. השערת הנגד היא שכיוון שהמדד שלי מנסה להתמודד עם יותר מדי פרמטרים (כל השחקנים, כולל כאלה שהצטרפו לפני מספר מועט של מחזורים) על בסיס פחות מדי מידע (כמות המשחקים) – הוא צפוי להגיע לתוצאות גרועות יותר.

שיטת ההשוואה היא פשוטה כיוון שבבסיסן של כל השיטות עומד מושג ה"שגיאה", כלומר, ההבדל בין ההסתברות האפריורית לתוצאה לבין התוצאה בפועל. לדוגמא, אם במחזור האחרון הערכתי שיחסי הכוחות בין נתניה ורעננה הם 42-58 לטובת נתניה (המספרים הם תמיד אחוזים המסתכמים ל-100%) והמשחק הסתיים בניצחון של נתניה (0-100 לטובת נתניה), אני סופר לחובתי "שגיאה" של 42% (100 פחות 58). אם המשחק היה מסתיים בתיקו השגיאה הייתה 8% בלבד (58 פחות 50) ולעומת זאת, אם המדד שלי היה "מופתע", השגיאה היא בהכרח יותר מ-50%. במקרה הזה – 58%. למשחק הזה, האלגוריתם המתחרה העריך את יחסי הכוחות ב 39-61 לטובת נתניה ולכן הוא סופג שגיאה של 39% בלבד, כך שלמעשה הוא מנצח אותי. האלגוריתם הטוב יותר אמור להגיע לממוצע שגיאה נמוך יותר.

 

עד המחזור האחרון, האלגוריתם שלי היה צמוד לשני האלגוריתמים המתחרים, אבל מאחורה (פיגור קל). זאת הייתה תוצאה טובה מבחינתי כיוון שאם מנטרלים את רגישות האלגוריתם שלי לשחקנים חדשים, הוא כנראה מדרג שחקנים ותיקים בצורה די טובה מבחינת חשיבותם לתוצאה הסופית של הקבוצה. גם חילופים הם אתגר משמעותי לאלגוריתם שלי – אני מדרג שחקנים לפי הימצאותם על המגרש בעת כיבוש שער הניצחון, אך בוחן את הביצועים של האלגוריתם לפי הרכבים פותחים.

מה שקרה במחזור האחרון הוא שבממוצע הכולל מאז תחילת המדידה (9 מחזורים, 63 משחקים), עקפתי את האלגוריתם המתחרה. השגיאה הממוצעת שלי למשחק היא 32.0% בעוד אצל המתחרה היא 32.2%. נקודת ציון זו הושגה בזכות ביצועים טובים יותר במחזור שהיה גדוש בהפתעות (אשדוד, סכנין, ב"ש) ומשחקים קשים לחיזוי (בית"ר-חיפה, חדרה-בני יהודה, ק"ש-פ"ת) והאלגוריתם שלי השיג בו שגיאה ממוצעת של 42% לעומת 49% של המתחרה.

מעניין להתעכב במיוחד על הניצחון (המפוקפק?) של הפועל ת"א על הפועל באר-שבע:

הפועל ת"א – הפועל ב"ש

גם ECI וגם Clubelo עדיין מחזיקים מב"ש הקבוצה השנייה בטיבה בישראל. האלגוריתם שלהם חושב ש-5 נקודות פער ממקום שני לא יכולות לבטל הישגים כ"כ גבוהים כמו בשנה שעברה. את הפועל ת"א הם מדרגים במקום ה-10 (לפני מכבי פ"ת, רעננה, אשדוד וסכנין). מסיבה זו, ECI העריך את יחסי הכוחות במשחק 29-71 לטובת ב"ש.

האלגוריתם שלי חזה את הניצחון של הפועל ת"א! ליתר דיוק, הוא נתן יחסי כוחות של 32-68 לטובת התל-אביבים. האם זה בגלל שהוא הבין שב"ש קבוצה לא טובה? לא בדיוק. במחזור הקודם האלגוריתם העריך את ההרכב של ב"ש בתור ההרכב הטוב ביותר שהועמד במחזור, טוב יותר מזה של מכבי ת"א (מה שלא הספיק בשביל לנצח את נתניה).

אז מה קרה במחזור האחרון? תסתכלו מיהם השחקנים עם הניקוד הכי גבוה מבין אלה ששיחקו בב"ש העונה:

  • מאור מליקסון (129 נק') – לא שיחק נגד הפועל ת"א
  • גיא מלמד (119 נק') – לא בקבוצה
  • מיגל ויטור (108 נ') – פצוע
  • מיחאי קורהוט (90 נק') – לא בקבוצה
  • דיא סבע (86 נק') – לא בקבוצה
  • דור אלו (70 נק') – לא שיחק
  • עדן בן-בסט (40 נק') – עלה כמחליף לאחר שהקבוצה נכנסה לפיגור
  • בן שהר (36 נק') – עלה כמחליף כשהקבוצה נכנסה לפיגור

למעשה, השחקן הטוב ביותר בהרכב הפותח של ב"ש היה ניב זריהן (30 נק'), שפחות טוב מכל השמונה שצוינו לעיל. בנוסף, במקרה של ב"ש, יתרון הביתיות שווה 180 נק' – שזה המון!!! בקיצור, הפועל ב"ש גם פירקה את עצמה בפגרה (קורהוט, סבע) וגם זלזלה בת"א (מליקסון, בן-בסט, שהר). אם מסתכלים על מי שכן שיחק רואים את סאבו ואלחמיד – שני השחקנים עם הציון הכי נמוך בב"ש, אבל עם קביעות בהרכב.

קלאודימיר פריירה
קרדיט לדף הפייסבוק של הפועל תל אביב

אז מה זה הנקודות האלה?

אז למאור מליקסון יש 129 נקודות. מה זה אומר? ומה זה בכלל ה-0? אסביר זאת ב-2 דרכים, אבל דווקא באמצעות מצטיין המדד מהצד התל-אביבי: אחמד עאבד.

לעאבד יש 136 נק', שזה בדיוק הפרש הניקוד במשחק שאנו מדברים עליו (90, להפועל ת"א, מינוס 46 לב"ש). דרך אחת להסביר את המשמעות של 136 הנקודות של עאבד היא שהן עומדות ביחס לאיזשהו 0, שזה בערך הציון החציוני (למעשה החציון קרוב יותר ל-2). הקבוצה שמתאפיינת בהכי הרבה שחקנים "חציוניים" (עם ציון חד ספרתי) היא באופן מובהק הפועל רעננה, ועד לחלון האחרון זה היה נכון גם לעמדת הקיצוני השמאלי עם 3 הנקודות של יואב תומר (הוחלף ע"י יוג'ין אנסה). אם כך, כאשר אנו אומרים שלעאבד יש 136 נק' אנו בעצם אומרים:

  • להפועל ת"א עם עאבד יש יחס כוחות של 32-68 מול ההרכב שב"ש העמידה
  • להפועל ת"א עם שחקן של רעננה במקום עאבד יש יחס של 50-50 מול ההרכב של ב"ש

 

דרך אחרת להתייחס למספר 136 היא מול האלטרנטיבה האמיתית. בהפועל ת"א, האלטרנטיבה בעמדת הקיצוני השמאלי היא אמיר עגייב (מינוס 22). כלומר, כשאין אופציה להעברה, עאבד שווה להפועל ת"א 158 נק' (או הבדל בין 68% ל-48% ביחסי הכוחות מול ב"ש).

וכדי לסבר את האוזן ולהדגים את הטווחים – קצת שיאי מדד:

  • הציון הגבוה ביותר במדד – ניקיטה רוקאביצה (178)
  • הציון הנמוך במדד – רועי קהת (168-)

ההפרש: 346 נק'

  • ההרכב החזק העונה – מכבי ת"א בדרבי האחרון (638)
  • ההרכב החלש העונה – אשדוד נגד ב"ש (356-)

ההפרש: 994 נק'

בטור הבא, אם תרצה מפלצת הספגטי המעופפת, 10 ההעברות המשמעותית בחלון האחרון

רועי קהת, מכבי חיפה
קהת. הפרצוף אומר הכל. קרדיט לדף הפייסבוק "מועדון כדורגל מכבי חיפה"

כתיבת תגובה

האימייל לא יוצג באתר. שדות החובה מסומנים *