דירוג שחקני ליגת העל על פי מדד ELO

בטור הקודם שלי הצגתי לכם את מדד אלו (ELO) – מדד שהומצא לדירוג שחקני שחמט ואומץ לדירוג נבחרות כדורגל ועל הניסיונות להתאימו לדירוג קבוצות כדורגל – ניסיון שהצליח רק באתר אחד ורק לקבוצות אירופאיות. העיקרון הבולט של המדד הוא ניקוד על משחקים לפי חוזק היריב.
כבר שנה-שנתיים אני מפנטז על שימוש במדד זה לדירוג שחקנים. הכוונה היא ששחקנים ידורגו לא על פי סטטיסטיקות אישיות, אלא על פי השורה התחתונה – האם הקבוצה מנצחת יותר איתם מאשר בלעדיהם – ואת מי.

אתר הזווית בחסות טיק טיק

בבואי להתאים את האתר לדירוג שחקנים עלי:
א. להצדיק זאת (להסביר מדוע אין שיטה קלה יותר לדרג שחקנים לפי ביצועי הקבוצה);
ב. להתגבר על בעיות ועיוותים

מבחינת ההצדקה, היופי בשיטה (בניגוד לסט משוואות) הוא שהיא מתייחסת גם לכושר (חשיבות יותר גדולה למשחקים ששוחקו לאחרונה) וגם לעוצמת היריבה.
מבחינת עיוותים, הייתי צריך להתייחס לנושאים הבאים:

  • איך מחלקים ניקוד על משחק בין השחקנים השונים
  • חילופים וכרטיסים אדומים
  • גורמים מחוץ לשדה המשחק – מאמנים, ביתיות וכו’
  • כיצד לאתחל שחקנים חדשים (שמצטרפים בתדירות גבוהה יותר מאשר קבוצות ונבחרות)
  • האם להתיר ציון שלילי
דור מיכה
קרדיט לדף הפייסבוק “מנהלת הליגות לכדורגל- IPFL”

בקצרה, כדי לא לטרחן, להלן חלק מהפתרונות שהכנסתי לשיטה:

  • לא ניתן לרדת מתחת לציון 0 – זה פחות נכון, אבל זו אמירה חזקה שאחרי שנה וחצי של מדד, ציונו של רועי קהת הוא עדיין 0 עגול…
  • שחקנים חדשים מתחילים בציון הנמוך ביותר של שחקן לא חדש ששיחק איתם
  • כל משחק מחושב (עם מקדם חלש מאוד) במשך 30 המחזורים הבאים, כך שכל פעם הוא מחושב עם ציונים קצת יותר נכונים של השחקנים
  • השחקנים שנחשבים למשחק הם השחקנים שהיו במגרש ברגע ההכרעה
    • במשחק שהוכרע – כיבוש שער היתרון האחרון
    • במשחק שהסתיים בשוויון – זה מורכב, הבטחתי לא לטרחן
  • חוץ משחקנים, בחלוקת הניקוד משתתפים גם 5 גורמים נוספים: 2 המאמנים, הביתיות של הקבוצה הביתית ושתי הקבוצות (ניקוד לקבוצה מייצג את היכולת לנצח עם שחקנים חלשים ע”י סקאוטינג, צוות רפואי, יחסים במועדון, עוצמת המותג\הסמל וכו’)

לאחר שהתחלתי להריץ את השיטה על נתונים מתחילת העונה שעברה, קיבלתי תוצאות שאפשר לדון בהן. בטור זה אתייחס לתוצאות בולטות ואיך הן מעידות על אמינות השיטה או נקודות התורפה שלה. בטורים הבאים אתמקד כל שבוע בקבוצה אחרת ואציג את הנקודות המעניינות שעולות מהמדד.

ועכשיו, לתוצאות האמת

טוני נוואקמה, הפועל באר שבע
קרדיט לדף הפייסבוק מנהלת הליגות לכדורגל

ובמקום הראשון…

אנתוני נוואקמה?

לאאאא… הוא רק במקום ה-23. מה שאומר שב”ש מצליחה לנצח גם בלעדיו. זו אולי נקודת התורפה הראשונה של השיטה – אני מסתכל רק על משחקי ליגה. הדומיננטיות של וואקמה באירופה לא באה לידי ביטוי. ועדיין, 4 המקומות הראשונים מאוד הגיוניים. במקום הרביעי נמצא מליקסון, שהברק שלו היה חסר לב”ש בתחילת העונה שעברה. במקום השלישי נמצא מיגל ויטור, שעל הקשר בין הימצאותו על המגרש והביצועים של ב”ש כבר דובר רבות, במקום השני נמצא… יעקב טרנר. הביתיות של ב”ש שווה לה יותר מכל שחקן. ובמקום הראשון… טה דה דה דם… וידאר קיארטנסון.

מאז המחזור ה-13 של העונה שעברה (לפני זה מחקתי את הנתונים…), אחוזי ההצלחה של מכבי ת”א עם קיארטרסון ברגע ההכרעה עומדים על 81.2 (23 – 6 – 3). אחוזי ההצלחה ללא קיארטרסון הם 28.6 (1 – 2 – 4). אגב, גם המקום החמישי הוא סופר-הגיוני: עידן ורד. אחריו כבר יש “תובנה” בדמות מרסל הייסטר. את העשירייה משלימים: שכטר, ברק בכר והפועל ב”ש (כארגון\מותג) וראיקוביץ’. מעניין לראות שמבין 20 השחקנים הטובים ביותר – 9 הם זרים.

וידאר קיארטנסן מכבי תל אביב.jpg
קיארטנסון. בראש הרשימה. Credit to “Maccabi Tel Aviv FC” Facebook page

קצב השינויים

מיישמי גרסת הנבחרות של המדד טוענים שלאחר כניסה חדשה או שינוי בכושר, ייקח למדד 30 משחקים כדי “להעמיד” את הנבחרת הנמדדת על ערך מדד נכון. כמה זמן זה לוקח בשיטה שלי? הנה כמה נתונים שיתנו מושג:

  • 21 השחקנים הראשונים נמדדים מתחילת המדד (תחילת עונה שעברה). במקום ה- 22 נמצא אנטואן קונט מביתר שהגיע בפגרת החורף האחרונה
  • המדורג הגבוה ביותר מבין השחקנים שנכנסו למדד העונה הוא אביב אברהם מנתניה – מקום 34
  • מבין השחקנים שהצטרפו השנה לקבוצה שאינה עולה חדשה, המדורגים הגבוהים ביותר הם רוסלן ברסקי וגבריאל תמאש מהפועל חיפה (מקום 58 משותף)

ברמת הקבוצות

השינוי נראה כך:

מדד ELO

מה אנחנו רואים פה?

  • העלייה של הפועל ב”ש (הסדרה הכחולה העליונה) סביב המחזור ה-12 של העונה (X=53) אינה מייצגת הצלחה כבירה, אלא הרכב חזק יותר (למשל, מיגל ויטור במקום לואיי טהא)
  • במבט מקרוב תראו שהנקודות מסודרות בזוגות, מדובר בציון ההרכב לפני המשחק ואחרי המשחק. הצלחה כבירה ניתן לראות ע”י עלייה חזקה בין זוג צמוד כזה, למשל המחזור האחרון של בני יהודה (קו מוזהב בסביבות 200 נקודות).
  • נזכיר את משמעות המספרים ב”חיים האמיתיים”: הפרש של 100 נקודות (למשל בין ההרכבים האחרונים של ב”ש למכבי ת”א) מייצג הסתברות לנצחון (במידה והמשחק מוכרע) של 64%. הפרש 240 נקודות (ב”ש – נתניה) מייצג הסתברות 80%.
  • הקווים הארוכים סביב X=40 מייצגים את המעבר מהעונה הקודמת לנוכחית. מכבי ת”א (הסדרה החומה) איבדה את טב”ח החלוץ ואלברמן ולכן מוצגת כקבוצה שנחלשה (אבל לא כמו מכבי פ”ת – קו כתום)
  • בולט מאוד שכמה שהמדד איטי ברמת השחקנים כך הוא מהיר ברמת הקבוצות. להפועל חיפה (קו תכלת) נדרשו 5 מחזורים לעלות ממקום 9 למקום 4. למכבי נתניה (אפור בהיר) נדרשו 9 מחזורים לעלות ממקום 13 למקום 5
עידן ורד, בית"ר ירושלים
Credit to “Idan Vered” Facebook page