הסטטיסטיקאים המובילים בעולם דיברו, והמסר שלהם לחוקרים, לסטודנטים ולמתקשרים מדעיים ברור - הגיע הזמן להפסיק להשתמש בעצמם בערכי p ובמשמעות סטטיסטית כדי לבדוק השערות ולקבוע האם התוצאות חשובות.
אם שום דבר מזה לא נראה לך הגיוני, ה-ELI5 הוא זה: מדענים מוצאים מתאמים במחקר שלהם כל הזמן, וכדי להבין אם הם לגיטימיים או סתם מזיקים, הם משתמשים במבחן שנקרא. ככל שערך p נמוך יותר, הסיכוי שהתוצאות אמיתיות טוב יותר, כאשר ערך p של פחות מ-0.05 הוא המספר הקסום שקובע אם משהו ראוי לפרסום (''). או, לפחות, ככה אנחנו משתמשים בזה עכשיו, אבללפי הצהרה שפורסמה זה עתהעל ידי האיגוד האמריקאי לסטטיסטיקה (ASA), אנחנו עושים הכל לא נכון.
"ערך ה-p מעולם לא נועד להיות תחליף להיגיון מדעי,"אמר מנכ"ל אס"א, רון וסרשטיין. "טיעונים סטטיסטיים מנומקים היטב מכילים הרבה יותר מהערך של מספר בודד והאם מספר זה חורג מסף שרירותי. הצהרת ASA נועדה לנווט את המחקר ל"פוסט P
באותן של סטטיסטיקאי, אלו מילים קרביות, ולראשונה בהיסטוריה בת 177 השנים שלהם, ה-ASA פרסמה הצהרה המפרטת באופן מפורש כיצד יש להשתמש בבדיקה.
ההחלטה התקבלה לאחר שהאגודה הפכה יותר ויותר מודאגת מכך שההסתמכות של הקהילה המדעית על ערכי p תורמת לפרסום ממצאים שלא ניתן לשחזר - אשר, אםמחקרים אחרוניםאם יש משהו שצריך ללכת לפיו, זו בעיה די גדולה.
"במשך הזמן נראה שערך ה-p הפך לשומר סף אם העבודה ניתנת לפרסום, לפחות בתחומים מסוימים,"אמרה ג'סיקה אוטס,נשיא ה-ASA. "הטיה העריכה לכאורה מובילה ל'אפקט מגירת הקבצים', שבו מחקר עם תוצאות מובהקות סטטיסטית נוטים להתפרסם הרבה יותר, בעוד שעבודות אחרות שעשויות להיות חשובות באותה מידה מבחינה מדעית לעולם לא נראו בדפוס."
זה גם גורם לחוקרים 'לפרוץ' לנתונים שלהם כדי לקבל את העמוד הנחוץ הזה
אז אם אנחנו משתמשים בערכי p שגויים, אז מה נכון? ל-ASA ישהוציא את ששת ההנחיות הללו:
- ערכי P יכולים לציין עד כמה הנתונים אינם תואמים למודל סטטיסטי מוגדר.
- ערכי P אינם מודדים את ההסתברות שההשערה הנחקרת נכונה, או את ההסתברות שהנתונים הופקו במקרה אקראי בלבד.
- מסקנות מדעיות והחלטות עסקיות או מדיניות אינן אמורות להתבסס רק על האם ערך p עובר סף מסוים.
- הסקה נכונה מחייבת דיווח מלא ושקיפות.
- ערך p, או מובהקות סטטיסטית, אינו מודד את גודל ההשפעה או את חשיבות התוצאה.
- כשלעצמו, ערך p אינו מספק מדד טוב של ראיות לגבי מודל או השערה.
זו לא הפעם הראשונה שערכי p זוכים לביקורת - כתב עת אחד בשנה שעברה הלך כל כך רחוקלאסור אותם כליל- ומדענים רבים מברכים על ההצהרה הנועזת.
"אין ספק שאם זה קרה לפני 20 שנה, המחקר הביו-רפואי יכול להיות במקום טוב יותר עכשיו", ג'ובאני פרמיג'יאני, ביוסטטיסטיקאי בדנה פרברהמכון בבוסטון, שאינו חלק מ-ASA,סיפרטֶבַע.
אבל אחרים מזהירים שהיא לא מטפלת בסוגיה האמיתית, שחורגת הרבה מעבר לערכי ה-p וקשורה יותר לציפיות הלא מציאותיות של החברה מהמדע.
"אנשים רוצים משהו שהם לא באמת יכולים להשיג",אמר הסטטיסטיקאי אנדרו גלמן מאוניברסיטת קולומביה. "הם רוצים ודאות".
וזה ידרוש הרבה יותר תקשורת פתוחה בין מדענים לציבור לגבי מה זה באמת אומר להסיק משמעות מתוצאות, והפרשנות הניואנסית הכרוכה בכך.
זה לא הולך להיות קל, אבל כשהמטרה היא לשפר את השיטה המדעית, זה תמיד שווה את זה.