סטטיסטיקה – היא רק חלק מהסיפור

בשנים האחרונות צצו כמעט כפטריות אחרי הגשם, אתרים שמנגישים נתונים סטטיסטיים שבעבר הלא רחוק היו נחלתם הבלעדית של עיתונאים והמועדונים עצמם. לאוהדים מהשורה נפתח ביום בהיר אחד חלון לעולם של מספרים ונתונים שאפשרו, כך נדמה, לתת את המענה הסופי לשאלה “מי יותר טוב – רונאלדו או מסי?” ולהדגים את תרומתם החמקמקה של שחקנים שלא התבלטו בנתוני שערים ובישולים.

קל להבין מדוע אוהדי הכדורגל תפסו את ההזדמנות בשתי ידיים וזינקו על עגלת הסטטיסטיקה. יש משהו מפתה ומרגיע במספרים – הם נותנים תשובה חד משמעית, חותכת, שאי אפשר להתווכח איתה. אם בעונת 2014/15 היו לאלכסיס סאנצ’ז יותר שערים ובישולים מאשר אדן הזאר, הרי שסאנצ’ז תורם למשחק ההתקפי של קבוצתו יותר מהזאר, לא? הבחירה של הזאר כשחקן העונה בפרמייר ליג באותה שנה נראית אם כן כמוטעית – היה לפחות שחקן אחד באותה עמדה שהיה יותר טוב ממנו.

אבל כאן נכנסת הבעיה של מספרים ונתונים סטטיסטיים – הם מספרים רק חלק מהסיפור, ורק מה שקרה. הם מספרים רק חלק מהסיפור, כי נתונים סטטיסטיים יכולים לכסות רק את מה שניתן לכמת – כמות המצבים ששחקן יצר או כמות התיקולים שהוא ביצע. הם לא יכולים לספר, למשל, פעולות שהשחקן עשה ללא כדור שהביאו לכך ששחקן אחר יהיה פנוי לקבל מסירה משחקן שלישי ולכבוש. תרומה כזו אינה טריוויאלית כלל ולעתים פעולות כאלה הן הדבר היחיד שיפרוץ הגנה בצורה, אבל עבור מי שמסתכל רק על הנתונים הסטטיסטיים לא יהיה הבדל בין שני שחקנים עם נתונים מספריים זהים, שאחד מבצע 4-5 פעולות כאלה כל משחק והשני לא מבצע אותן כלל.

לבנדובסקי - אובמיינג,
“האם הסטטיסטיקות הללו אומרות לכם איזה שחקן הייתם מעדיפים?”
Credit to whoscored.com

הבעיה השנייה בנתונים הסטטיסטיים היא שהם מספרים רק את מה שכן קרה, ולא את מה שלא קרה. למשל, אם בלם מתקשה לתפקד תחת לחץ ומוסר את הכדור ברגע שהוא רואה שחקן יריבה, אזי במידה וחוליית ההגנה שהוא משחק בה היא טובה, יכול להיות שיהיו לו נתוני מסירות מצויינים והוא ייחשב – בעיני מי שמנתח את הנתונים – כבלם טוב, למרות שאלה שחקני ההגנה האחרים שגורמים לנתונים שלו להיראות טוב. אילו היה משחק בחוליית הגנה פחות טובה, יכול להיות שנתוני המסירות הטובים שלו היו הופכים במהרה לטעויות שגרמו לשער.

חוליית ההגנה – מהשוער ועד הקישור האחורי – היא אולי החלק במגרש בו הכי קשה, ואולי אף מיותר, לנסות לבצע ניתוח מבוסס נתונים. עמדת השוער היא הבעייתית ביותר בהקשר הזה, כי הנתון היחיד למעשה שאפשר לאסוף על שוער (מלבד נתוני שערים נקיים, שכמובן לא ניתן לייחס רק לשוער אלא לחוליית ההגנה ככלל ואולי אף לקבוצה ככלל) הוא הצלות. הצלות מחושבות ע”י החסרת השערים שנספגו מכלל הבעיטות למסגרת של היריבות. אין שום התייחסות (כי בניתוח מבוסס נתונים, לא יכולה להיות שום התייחסות) לאיכות הבעיטות – נתון שקשה לכמת וברוב המקרים הוא סובייקטיבי. כמובן שאין ולא יכולה להיות התייחסות ליכולת הארגון של השוער, הצדדים החזקים והפחות חזקים שלו (אחד על אחד, הרמות, בעיטות מרחוק)- ואפילו הצלות יכולות להיות מושפעות מאיכות חוליית ההגנה ככלל- במידה ומדובר בהגנה שנוטה להשאיר שחקן או שניים פנויים סביב רחבת החמש, לשוער לא יהיה כמעט כל סיכוי להציל בעיטה שתגיע למסגרת.

גם לגבי המגינים והבלמים, קשה מאד לקבל הבנה אמיתית של האיכות שלהם מנתונים מספריים בלבד. הנתונים ההגנתיים המקובלים כיום הם תיקולים, יירוטי מסירות (interception, כאשר שחקן יריבה מוסר והמגן קולט את המסירה לפני שהגיעה לשחקן היריבה אליו כוונה), דו-קרב אוויריים וטעויות שהובילו לשער. אבל כשמסתכלים על מגן, אלו רק ארבע תכונות, אולי הארבע הכי פחות חשובות כשמתייחסים למגן. מה לגבי כמות הפעמים בהן נתפס מחוץ לעמדה? מה לגבי מידת ה”לחיצות” שלו? מה לגבי היכולת שלו לשמור במצבים נייחים? כל אלה תכונות קריטיות עבור מגינים שפשוט לא קיימות בעולם הניתוח הסטטיסטי, ואפשר להוסיף שגם “טעות שהובילה לשער” היא נתון קצת מופרך שהרי אם הטעות הובילה בסופו של דבר לשער או לא זה דבר שתלוי בכמה גורמים אחרים (השחקן הבועט, השוער, מגינים אחרים).

גודין - ראמוס
“האם בנתונים האלה מסתכמת התרומה של ראמוס וגודין?”
Credit to whoscored.com

כל הדברים הללו נכונים גם לגבי קשרים וחלוצים. למשל, קשר יכול ליצור מצבים רבים, אבל עצם יצירת המצב אינה איכות של קשר. למשל, אם הקשר מסרב למסור את הכדור ומנסה ללכת לבד, ורק כשהוא כבר על קו הרוחב הוא מוסר כדור שמגיע לשחקן ברחבה במצב גרוע (או, הרבה פחות טוב ממה שהיה יכול להיות לו היה מוסר קודם), אזי מבחינת הנתונים הסטטיסטיים הוא יצר מצב, אבל בפועל המצב היה גרוע, ושחקן אחר אולי היה משכיל ליצור מצב טוב יותר.

אבל בעיקר מה שגרוע בניתוחים מבוססי הנתונים הוא רידוד הדיון. כפי שנכתב קודם, יש משהו במספרים שמאד מרגיע אותנו כבני אדם. הם נותנים תשובה דיכוטומית – זה או יותר טוב או פחות טוב, וזהו. אין עומק. אבל צריך לחשוב על המשמעות של המספרים. אם שחקן אחד מצליח ב-0.2 תיקולים יותר משחקן אחר, או יוצר 0.3 מצבים יותר, האם זה באמת כזה הבדל גדול? האם הורדנו את דיוני הכדורגל לרמת נקודה עשרונית?

 
   
   

רוצים לעזור לנו לעשות דברים חדשים?

תתמכו בנו

*כל עזרה תעזור לנו לגוון ולשפר את התוכן ולצמוח