"אם אי אפשר לבטא זאת במספרים, אין זה מדע, זו דעה" (רוברט א. היינליין)
כשאני חושב על ניתוח מידע בכדורגל נדמה לי שהוא תמיד היה שם, במיוחד בהתחשב בכך שבספורט האמריקאי הוא באמת תמיד היה שם. לצערנו (או שמחתנו, תלוי מי אתם) בכדורגל זה ממש לא כך והכדורגל האירופי מאוד פרימיטיבי בשימוש בטכנולוגיה (בכלליות פרימיטיביות בנוגע לשימוש בטכנולוגיה וכדורגל הולכים טוב ביחד) ואם אתם לא מאמינים אז הנה סיפור קטן.
ב-9 לאוגוסט 2005 התקיים משחק בליגה השניה באנגליה בין לוטון לסאות'המפטון. את סאות'המפטון אימן הארי רדנאפ המפורסם ובזמנו עבד במועדון אנליסט צעיר בתחילת דרכו בשם סיימון ווילסון. לימים אמר ווילסון על רדנאפ בסגנון הבריטי המרומז "הוא היה אדם יותר אינטואיטיבי מאנליטי, לא הצלחתי להבין מדוע שלא ירצה לקבל מידע כה חשוב". בכל אופן, לפני המשחק העביר ווילסון תדרוך ורדנאפ לא היה מרוצה מכך שמעמיסים על השחקנים שלו הררי אינפורמציה. במשחק סאות'המפטון הפסידה 3-2 משער בדקה ה-90, רדנאפ פנה אל ווילסון ואמר לו: "אני אגיד לך מה, בשבוע הבא ניתן למחשב שלך לשחק נגד המחשב שלהם ונראה מי ינצח". זה ב-2005 כן? כשכבר יש אינטרנט והעולם מפותח, וזה הארי רדנאפ כן? מאמן יחסית בכיר באחת הליגות הטובות באירופה.
למרבה המזל לא כולם רדנאפ והאמת שהסיפור של התפוצצות המידע בכדורגל מתחיל עוד לפני כן ביוני 1992, כאשר קנט סטיבנס ונובל לארסון הגישו בקשה לרישום פטנט עם הכותרת "עקיבה אוטומטית מבוססת מצלמה עבור אירועי ספורט". מאחר ומערכות עקיבה הן תחום העיסוק שלי בחיים, אני אקדיש בעתיד למערכות טכנולוגיות סדרת כתבות שלמה ומעמיקה. מה שכן, נדלג באלגנטיות על איך המערכת בעצם עוקבת ומה מיוחד בה ורק נאמר שזו היתה המערכת האופטית הראשונה לעקיבה אחר שחקנים במגרש ללא מגע יד אדם. מפה לשם, ב-1998 קמה בלידס (אנגליה) חברת סטארט-אפ בשם פרוזון שמוכרת מערכת שבאמצעות 8 מצלמות מסביב למגרש, מפיקה סרטון אנימציה של המשחק ממבט על, על ידי תיעוד של כל שחקן במגרש פעם ב-0.1 שניות ועקיבה אחריו במהלך כל המשחק ללא כל צורך להלביש עליו חיישנים כלשהם (קצת מזכיר מה שהיינו רואים במשחקי מנג'ר פעם). כמובן שעם המערכת מגיעים גם אנליסטים של החברה למועדון ומשתלבים בו כיועצי ניתוח מידע. ב-1999, הגיע סטיב מקלארן כעוזר מאמן למנצ'סטר יונייטד מדרבי, אשר עבדה בזמנו עם פרוזון ללא תשלום מכיוון שהיתה עדיין סטארט-אפ קטן. מקלארן ביקש להביא את פרוזון ליונייטד אך נתקל בקשיים – פרוזון לא הסכימו לעבוד בחינם יותר ויונייטד סירבה לשלם כסף על שירות שלא ברורה מידת התועלת שלו. לבסוף, הוסכם כי במידה והשדים האדומים יזכו בתואר כלשהו העמלה של פרוזון תהיה 50,000 פאונד. באותה עונה שני הלקוחות היחידים של החברה הצעירה היו מנצ'סטר יונייטד ודרבי קאונטי ושתיהן לא שילמו על השירות, אלא שבסוף אותה עונה יונייטד זכתה בטרבל הסטורי ובפרוזון הכסף החל לזרום. בעונת 00/01 כבר היו לחברה 6 קבוצות שקנו ממנה את השירות בתשלום (כולן באנגליה – היום אגב כל הקבוצות בפרמייר ליג ובצ'מפיונשיפ עובדות עם פרוזון בנוסף לברצלונה וריאל מדריד). הכניסה של פרוזון לעולם הכדורגל לא היתה קלה – לא קל למאמנים שבטוחים שהם יודעים הכל והכי טוב, לשמוע מילדים בני 25 כמה שהם לא מבינים בסטטיסטיקה ועד כמה שיטות המשחק שלהן לא יעילות.
אז כמה זה יעיל? אילו סטטיסטיקות מנצחות משחקים ומה הסיפור של פרוזון עם בולטון ומנצ'סטר סיטי? בשביל זה תצטרכו להמתין לחלקים ג' וד'…
אבל לסיום, כדי שלא תגידו שכתבתי פוסט שני בלי התייחסות לסטטיסטיקה ספציפית, אציג לכם כמה מספרים:
בפרוזון פיתחו אלגוריתם לחיזוי תוחלת ההבקעות של קבוצות ושחקנים. במילים אחרות, המודל שלהם חוזה כמה שערים קבוצה/שחקן יבקיעו בעונה (עם טווח טעות מסוים). כמובן ששחקנים עם תוחלת הבקעות גבוהה נחשבים שחקנים טובים יותר (בדוגמא הזו מדובר על שחקני התקפה, אך יש מדדים מתאימים גם לשחקני הגנה), אך מה שהקבוצות באמת מחפשות הם שחקנים ש"מכים את התחזיות" כלומר כאלו שעוברים את תוחלת ההבקעות שלהם ועוברים אותה בהרבה. שחקנים כאלו נקראים יעילים כאשר היעילות מחושבת כתוצאה בפועל חלקי המדד הסטטיסטי.
דוגמא לשחקן טוב: כריסטיאנו רונאלדו.
דוגמא לשחקן יעיל (אולי בגלל זה שילמו עליו כל כך הרבה): גארת' בייל – בעונת 12/13, עונתו האחרונה בטוטנהאם (אהמ אהמ…) היה אמור להבקיע על פי המודל 11 שערים. בפועל הבקיע 21 שערים כלומר היעילות שלו היא 1.9. בפרוזון מסבירים שהיעילות הקיצונית של בייל אינה נובעת מכך שהוא מגיע להרבה הזדמנויות, אלא שהוא מצליח להבקיע המון שערים ממצבים שבהם ההסתברות להבקעה נמוכה ולכן הוא כל כך קטלני – אם תרצו אנלוגיה אז בייל מקביל לשחקן שקולע מכל מצב בכדורסל.
דוגמא לקבוצה טובה: ריאל מדריד
דוגמא לקבוצה יעילה: ברצלונה – תוחלת הבקעות על פי המודל: 2.05 שערים למשחק. הבקעות בפועל: 2.95 שערים למשחק (מדד יעילות 1.44 – מקום ראשון באירופה).
לסיכום:
שלושת הקבוצות היעילות ביותר באירופה ע"פ מדד תוחלת ההבקעות של פרוזון הן (לפי סדר הדירוג) ברצלונה, באיירן מינכן ודורטמונד. לגבי בארסה, מעניין לראות שמסי דווקא מוריד את מדד היעילות שלה (המדד של מסי הוא 1.35 – מחמיץ הרבה). ריאל מדריד במקום ה-30 באירופה, פסז' במקום ה38. הקבוצה האיטלקית הראשונה בדירוג היא קטאניה במקום ה16 ורק ל-3 קבוצות מאנגליה יש יעילות חיובית והן: אסטון וילה 1.055, מנצ'סטר יונייטד 1.041 וסוונזי 1.02.
אהבתי מאוד !
אשמח לעוד הרבה כאלה.
מרתק.
אם אני מבין נכון אז הבסיס הוא האלגוריתם שהחברה פיתחה.
אני מניח שהוא נבחן בשנים האחרונות על ידם. מה היו התוצאות והאם יש הבדלים בין הליגות השונות וכתוצאה מכך גם אלגוריתמים שונים לכל ליגה ?
היי עופר, האלגוריתם לחיזוי תוחלת הכיבושים של קבוצה/שחקן הוא רק אחד מיני רבים שהחברה פיתחה. לבד אין לו כמעט שום השפעה. הכוח האמיתי של פרוזון טמון ב2 אפיקים:
1. מערכת בקרה (יש עליה פטנט) שמאפשרת למצלמות לנוע לאן שצריך ולייצר את הנתונים שמספיקים לשחזור את כל הנתונים מהמשחק בעזרת 8 מצלמות בלבד.
2. אלגוריתמים שלוקחים את המידע הגולמי שהוא בעצם בסיס נתונים עצום ומבולגן וממיינים אותו לנתונים עם משמעות – פה בעצם יושבים כל האלגוריתמים שלהם וניתוח הנתונים שזה אחד התחומים הקשים והחמים ביותר היום בעולם המחשוב.
לגבי תוצאות – לתוצאות שלהם כמובן יש השפעה מאוד גדולה על שיטות וסגנון המשחק של הקבוצות שעובדות איתם. בחלק ג' אני אתן את הדוגמאות של בולטון ומנצ'סטר סיטי כדי לתת קצת מדד כמותי לזה. לגבי האלגוריתמים עצמם קשה לדעת אילו התאמות הם עושים לכל קבוצה מכיוון שזה מידע סודי מאוד (יש להם היום לא מעט חברות מתחרות) אבל הם בוודאות עושים התאמות אישיות לכל מועדון שהם עובדים איתו. מצאתי כמה מאמרים מקצועיים שמישהו משם פרסם אבל קשה מאוד לפשט את זה בלי להשתמש במונחים מקצועיים ומשוואות אז אני לא אעשה את זה כאן. אם אתה רוצה דבר איתי ואני אשלח לך חומר מקצועי בנושא.