פורסם על ידי: or100 | מאי 28, 2009

שיפוט והערכה בתנאי אי וודאות – בלוק 2: שיעור 2 משפט בייס

שיעור 2 – משפט בייז (בייס)

דוגמא 1 (שקופית 2)

קראו את השאלה הבאה וענו עליה לפני שאתם ממשיכים בקריאת השיעור:

באוכלוסיית הסטודנטים יש 1% של חולי אידס, ידוע שיש מכשיר שבודק האם אתה חולה איידס. המכשיר הזה מאתר 95% מחולי האידס ונותן להם תשובה חיובית ובנוסף מזהה נכון  90% מהבריאים ונותן להם תשובה שלילית. מתוך האוכלוסייה נדגם סטודנט באופן מקרי ונערכה לו בדיקה במכשיר הנ"ל. הסטודנט קיבל מהמכשיר תשובה חיובית.

לאור נתונים אלו, מהו לדעתך הסיכוי שהסטודנט חולה באיידס?

הפתרון הנורמטיבי (לדוגמא 1): הפתרון לשאלה מסוג זה הוא על פי משפט בייז. תחילה נציג אותו :

יהיו:

H – חולה

`H – בריא

D – תשובה חיובית

`D – תשובה שלילית

משפט בייז:

והחישוב :        8%  =  0.08  =           0.01 * 0.95

0.99 * 0.1 + 0.01 * 0.95

(חולה)P * (חולה/חיובית)P

(בריא)P * (בריא/חיובית)P + (חולה)P * (חולה/חיובית)P

בעצם חישבנו את היחס הבא:         כל מי שקיבל תשובה חיובית והוא חולה

כל מי שקיבל תשובה חיובית

איור 2-1, איור 2-2

עתה, השוו את הפתרון על פי בייז לפתרון האינטואיטיבי שנתתם לשאלה, ושאלו מספר אנשים לידכם את השאלה.

  • קל לנחש שממוצע ההערכות האינטואיטיביות של אנשים גבוהה בהרבה מהתשובה אותו מציע הקריטריון הנורמטיבי.

  • שוב אנחנו רואים את המבנה עליו דיברנו בשיעור הקודם:
  • יש בעיה בעלת פתרון נורמטיבי שמציעה תורת ההסתברות במקרה זה משפט בייז. רוב האנשים לא יודעים את הפתרון, אבל הם לא טועים בצורה מקרית ביחס לפתרון אלא טועים בצורה שיטתית – מבצעים  הטיה.
  • רוב האנשים במקרה זה ובשאלות רבות אחרות מתעלמים מן הנתון הראשוני של שיעור הבסיס באוכלוסייה ומבצעים שיפוט הקרוב מאוד לנתון החדש שנתפס להם כרלבנטי ומשמעותי יותר, במקרה זה דיוק המכשיר בקרב חולים – 90%.

בהמשך הקורס נציע הרבה הסברים למנגנון הקוגניטיבי הגורם לאנשים להתנהג בצורה זו אך השיעור היום יוקדש בעיקרו להבנה מעמיקה של הקריטריון הנורמטיבי שציינתי, משפט בייז, שהוא בעצם מודל נורמטיבי מרכזי  שילווה אותנו במשך כל הסמסטר.


גישות לפירוש הסתברות: גישה שכיחותנית וגישה סובייקטיבית

(מהמצגת- ולפני ההסברים הסטטיסטיים)

"הסיכוי לקבלת המספר 6 בהטלת קוביה היא 1/6" . מה המשמעות של ערך זה?

1) גישה שכיחותנית:

  • גישה זאת מתייחסת לגבול השכיחות היחסית של אירוע מסוים, בתוך רצף של אירועים שיכולים לחזור על עצמם

2) גישה סובייקטיבית

  • גישה זו מפרשת את ההסתברות כדרגת אמונה של הפרט לגבי תוצאות אירוע מסוים.

גישה סובייקטיבית

גישה שכיחותנית

האירוע

  • ההסתברות היא 1/6
  • היא מבטאת דרגת אמונה נמוכה בגלל שיכולים לצאת שישה מספרים ורק אחד מהם יכול להיות 6

  • עבור זריקה אחת ההסתברות היא 0 או 1
  • 1אבל אם נזרוק הרבה פעמים היחס בין 6 לשאר המספרים ילך ויתקרב ליחס של 1:5
  • ולכן ההסתברות תהיה 1/6

מה ההסתברות שבזריקת קוביה יצא 6 ?

  • ההסתברות היא…
  • היא מבטאת דרגת אמונה בגלל שהשנה משחקים במכבי…
  • והקבוצות המתחרות הן…

  • או שתזכה או שלא תזכה
  • קשה לתת לאירוע כזה משמעות שכיחותנית

מה ההסתברות שמכבי תל אביב תזכה השנה באלפיות אירופה?


I ההבדל בין פירוש קלאסי לפירוש בייזיאני להסתברות

הסתברות לפי הפירוש/התיאור הקלאסי

  • היחס בין מספר האירועים הבסיסיים התומכים באירוע לבין מספר האירועים הבסיסיים הכולל.
    • לדוגמא:
      • קוביה מאוזנת מהי ההסתברות שתיפול על 1 ?   1/6
      • מהי ההסתברות שתיפול על מספר זוגי ?  3/6 = ½

הסתברות לפי פירוש בייזיאני

  • התקבל נתון מסוים ואנו רוצים לדעת מהי סבירות ההשערה לאור הנתון החדש.
  • הפירוש הבייזיאני לוקח בחשבון גם את יחס הבסיס בין ההשערה לאלטרנטיבה וגם את ההסתברות של הנתון תחת ההשערה ותחת האלטרנטיבה.

לפני שנמשיך  חשוב לרענן מספר אקסיומות מרכזיות:

  • נניח כי יש שני כדים המיוצגים על ידי H ו-. `H
  • בכל בכד יש כדורים אדומים המיוצגים על ידי D וכחולים המיוצגים על ידי  `D, הכדורים האדומים והכדורים הכחולים, מכילים את כל העולם. מכאן ניתן לגזור:

  1. הסתברות של D והמשלים שלו `Dבתנאי H נותנים את הביטוי1 = (`D/H)P + (D/H)P
  2. הסתברות של השערה + הסתברות של אלטרנטיבה = 1 = P(H) + P(`H).
  3. חשוב לזכור כי שתי ההסתברויות שאינן תלויות אחת בשנייה הן:

¹ (D/`H)P + (D/H)P

  • דוגמא:
    • נניח שיש לנו שני שקים. בתוך כל שק יש 10 כדורים חלקם אדומים וחלקם כחולים.
    • בשק א' 7 כדורים אדומים והיתר כחולים, ובשק ב' 4 כדורים אדומים והיתר כחולים.

  • H   –  שק א'
  • `H  –  שק ב'
  • D  –  כדורים אדומים
  • `D –  כדורים כחולים

  • ע"פ ההסתברות הקלאסית בהנחה שהבחירה בין שני השקים היא מקרית, ניתן להסיק את ההסתברויות הבאות:

  • 0.7 = (D/H)P        הסתברות לאדום בהינתן שק א'.
  • 0.3 = (`D/H)P      הסתברות לכחול בהינתן שק א'.
  • 0.4 = (D/`H)P      הסתברות לאדום בהינתן שק ב'.
  • 0.6 = (`D/`H)P    הסתברות לכחול בהינתן שק ב'.

  • 11/20 = (D)P הסתברות כללית לאדום.
  • 9/20 = (D)P הסתברות כללית לכחול.

  • חשיבותו של המודל הבייזיאני עולה עקב העובדה כי ההסתברות הקלאסית אינה יכולה לענות על השאלה ההפוכה:
    • יצא כדור אדום מהי ההסתברות שהוא יצא משק א'?
  • שימו לב, במקרה זה אנו לא שואלים מהי הסתברות הנתון בתנאי ההשערה, אלא להיפך:
  • התקבל נתון וודאי, לאור הנתון מהי הסתברות ההשערה?
  • הסתברות זו יכולה להיות מחושבת רק על ידי משפט בייז המחשב את היחס בין סיכוי הוצאת כדור אדום משק א' לבין סיכוי הוצאת כדור אדום משק כלשהוא:

צורת הטבלה באופן כללי

  • אדם שדובר אמת מול אדם שמשקר (מציאות), ומול מכונת אמת (מכשיר)

דובר שקר

דובר אמת

miss

מכשיר ¹ מציאות

TP =True positive

מכשיר = מציאות

המכשיר מזהה אמת

True negative

מכשיר = מציאות

False Alarm

(אזעקת שווא)

מכשיר ¹ מציאות

המכשיר מזהה שקר

נתרגל את משפט בייז בעזרת דף העבודה הבא:

II

משפט בייז – דף תרגול

מציאות

תוצאות

הבדיקה

ע"פ המכשיר

חולה ב- X

(חולה)

לא חולה ב- X

(בריא)

סה"כ

יש מחלה X

D

74

110

184

אין מחלה X

6

810

816

סה"כ

80

920

1000

לגבי כל שאלה:   א.  סמן/י באותיות את הערך המבוקש. לדוגמא בסעיף א' – H P.

ב.  חשב/י את ההסתברות של הערך שסימנת.

שאלות

  1. מה ההסתברות להיות חולה במחלה X ?
  2. מה ההסתברות לא להיות חולה במחלה X ?
  3. מה ההסתברות שאם אני חולה במחלה X, המכשיר יאתר זאת?
  4. מה ההסתברות שאם אני לא חולה במחלה X המכשיר יאתר זאת?
  5. מה ההסתברות שאם אני חולה במחלה X המכשיר יפספס זאת?
  6. מה ההסתברות שאם אני לא חולה במחלה ,X המכשיר יאמר שאני חולה?
  7. מהו אחוז האנשים להם תינתן תחושה שגויה של בטחון?
  8. מהו אחוז האנשים להם תינתן תחושה שגויה של אסון?
  9. מה ההסתברות שהמכשיר והמציאות יסכימו?
  10. מה ההסתברות שאני באמת חולה במחלה אם המכשיר אמר "כן"?
  11. מה ההסתברות שאני לא חולה במחלה אם המכשיר אמר "כן"?
  12. מה ההסתברות שאני לא חולה במחלה  אם המכשיר אמר "לא"?

טבלת תרגול משפט בייז – פתרונות:

  1. הטבלה הזו זה בדיוק כמו הענף של בייז וממנה מוצאים את  משפט בייז

דוגמא נוספת לתת פרק הבא: איור 2-5

נחזור למשפט היחסים של בייז:

ננסה להסביר כל אחד  מהמרכיבים ונראה כיצד הוא בא לידי ביטוי:

1. יחס ההסתברות האפריורית – שיעור הבסיס BASE  RATE:

  • היחס האפריורי, הנקרא גם שיעור הבסיס, הוא הערך המבטא את היחס בין ההסתברויות שאנו נותנים לאירוע כלשהו (השערה) ולמשלים שלו (אלטרנטיבה) לפני שידוע איזשהו נתון חדש.

  • כלומר זהו  היחס הקיים לפני קבלת הנתון,
    • איזה הסתברות ללא  שום ידע קודם אני נותן על אדם   X שיהיה חולה במחלה לעומת בריא.
    • מהו המצב במציאות של ההשערה מול האלטרנטיבה.
    • לאנשים יש יחסי בסיס בראש על כל מיני דברים ויש לנו אמונות אינטואיטיביות שמסתמכות על זה
      • למשל – ניתוח פרוסטטה "כולם יוצאים מזה" , סרטן כבד "אין סיכוי". –  וזאת למרות שאנו לא מכירים את האדם החולה ואין לנו מושג על ההיסטוריה הרפואית שלו שיכולה לשנות את התמונה ולהציב אותו בתוך אוכלוסייה שיש לה סיכוי להחלמה.
      • לרוב האמונות שלנו מתבססות על יחס בסיס מסוים.
  • בדוגמא שלנו:

  • על כל 11.5 אנשים יש חולה אחד.
  • או במילים אחרות, הסיכוי לשלוף מהמדגם נבדק בריא גדול פי 11.5 מהסיכוי לשלוף ניבדק חולה.
  • אם בדוגמא של הסרטן היינו משנים את יחס הבסיס במקום 1% ל40%
    • היינו מקבלים הסתברות שונה לגמרי לתשובה הבייזיאנית לגבי הסיכוי למחלה בהינתן תשובה חיובית  (39% שהסטודנט חולה)
    • ולו שיעור הבסיס היה 80% היינו מקבלים הסתברות של 79%.

2. יחס הדיאגנוסטיות – (בחוברת נקרא יחס הנראות)

  • היחס הדיאגנוסטי הוא ערך המבטא את יכולת ההבחנה של נתון חדש שקיבלנו, כלומר עד כמה הנתון מבחין בין ההשערה לאלטרנטיבה.

  • במילים אחרות היחס הזה מראה את יכולת ההבחנה של המכשיר.
  • עד כמה המכשיר דיאגנוסטי כלומר מבחין בין חולים לבריאים.
    • תשובה חיובית בתנאי חולה חלקי תשובה חיובית בתנאי בריא.
  • יחס זה עונה על השאלה בכמה המכשיר פוגע.

  • בדוגמא שלנו יחס הוא 8 בקירוב (0.925/0.119)
  • וזה אומר שעל פי המכשיר בלבד הסיכוי לאדם חולה להיות מאותר כחולה הוא פי 8 מהסיכוי של אדם בריא להיות מאותר כחולה.
  • כלומר המכשיר עושה עבודה טובה, הוא מבחין היטב בין חולים לבריאים.

  • זהו יחס מאוד חשוב שכן מכשיר שאינו מבחין יהיה חסר טעם.
    • ניקח לדוגמא את המקרה הבא: נערך מבחן שאמור לבדוק אילו אנשים מתאימים למשרה ניהולית.
      • התקבלו התוצאות הבאות:

מנכ"לים  H

ציירים  H

מתאים D

70

35

לא מתאים D

30

15

  • היחס הדיאגנוסטי כאן שווה ל 1.
    • כלומר, המבחן הזה לגמרי לא דיאגנוסטי הוא אינו מבחין בין מנכ"לים לציירים, בכל מקרה נותן המבחן ל70% מהאנשים את התשובה שהם מתאימים.
    • למבחן אין לו תוקף ניבוי.
    • ככל שהיחס הדיאגנוסטי גדול יותר מ- 1 או לחילופין קטן יותר מ1- הוא יותר מבחין כלומר המכשיר יותר טוב,
    • ולהפך ככל שהוא קרוב יותר ל- 1 המכשיר פחות מבחין בין ההשערה לאלטרנטיבה.
      • (ובעצם אפשר לראות מהמכפלה שבמקרה שהיחס הדיאגנוסטי =1 (או מתקרב אליו) אז הוא לא תורם שום דבר ליחס הפוסטיריורי מעבר ליחס הבסיס (אפיורי)
  • זהו היחס שבין ההשערה לאלטרנטיבה לאחר שיש לי נתון מסוים D  או `D
  • לדוגמא בהינתן הנתון של הבדיקה. נוסחת בייז היא הדרך לחישוב יחס זה והיא מציעה שהוא שווה למכפלת היחס הדיאגנוסטי ביחס שיעור הבסיס.
    • בשאלה המקורית: בהתחלה נתון שפי 11.5 אני לא חולה (יחס הבסיס) ולאחר מכן נתון פי 1.5 בלבד שאני לא חולה אך שימו לב עדיין במקרה זה למרות התשובה החיובית יש יותר סיכוי שאני בריא מאשר חולה.


3.  יחס פוסטריורי  –

איור 2-6 (ממצגת 18)
שימו לב!

  • נוסחת בייז ברמה הסטטיסטית היא נוסחה אחת מיני רבות, אך חשיבותה מבחינה תיאורטית היא רבה שכן היא מדגימה לנו במצבים מסוימים דרך חדשה ושונה לבחון הסתברות.
  • במקרים בהם מתבקשת שאלה בייזיאנית יש לגישה זו מספר יתרונות משמעותיים על הגישה הקלאסית:

1)

  • הגישה הקלאסית מתייחסת רק למונה של היחס הדיאגנוסטי, רק ל (D/H)P היא לא מתייחסת לאלטרנטיבה.
    • כלומר היא לא מתייחסת לכמה הנתון שאספנו מבחין בין ההשערה לבין האלטרנטיבה.

  • זה בעייתי כיון ש D יכול להיות מאוד סביר תחת ההשערה אך גם מאוד סביר תחת האלטרנטיבה ואז הנתון אינו מבחין בין האלטרנטיבות (כמו בדוגמא של המבחן עם הציירים והמנכ"לים).
    • לדוגמא נאמר שאני רוצה לבחון את ההשערה שסטודנט X לומד פסיכולוגיה,
      • אני רואה סטודנט שיושב בספרייה וקורא מאמרים באנגלית. האם זה מספיק לי בכדי להניח שהוא סטודנט לפסיכולוגיה?
      • לא. אמנם סטודנטים לפסיכולוגיה אכן רובם חייבים לקרוא מאמרים באנגלית, ולכן (D/H)P גבוה,
      • אך זה מעין הטיית האישוש שכן גם סטודנטים לכלכלה חייבים לקרוא ולכן הנתון של קריאת אנגלית אינו מבחין  בין סטודנטים לפסיכולוגיה וכלכלה.
      • דוגמא נוספת היא פרסומת שהיתה פעם למכון המציע קורס הכנה לפסיכומטרי
        • "אם במבחן השני שלך לא תשפר את ציונך מהמבחן הראשון ב20- נקודות לפחות יוחזר לך כספך".
        • עובדה ידועה היא שללא קשר לקורס כל אדם במבחן השני שלו בפסיכומטרי משפר את ציוניו בגלל עשיית המבחן בעבר ולא בגלל הקורס,
        • ולכן גם אם תנאי השיפור מתקיים אין זה מעיד בהכרח  שהקורס דיאגנוסטי, ובעל יכולת ניבוי לציון הפסיכומטרי.

2)

  • הגישה הקלאסית אינה מכניסה לחישוב את שיעור/יחס הבסיס.
    • לדוגמא היא אינה מתייחסת לנתון של כמה סטודנטים בפסיכולוגיה וכמה בכלכלה יש ברמת גן.
    • זהו נתון מאוד חשוב ומשמעותי המשנה את ההסתברויות בצורה משמעותית.

  • הגישה הבייזיאנית מכניסה את שתי הנקודות האלה לשיקולים ואף מציעה את הדרך לעשות אינטגרציה ביניהם.

לסיכום:

  • ראינו שהגישה הבייזיאנית היא מורכבת ביותר ובהרבה מקרים היא ששואלת את השאלה ההסתברותית הנכונה.
  • גישה זו מכוונת אותנו לשימוש בהרבה יותר נתונים, היא לוקחת בחשבון גם את האלטרנטיבה וגם את שיעורי הבסיס ואומרת לנו איך לעשות את האינטגרציה בין הנתונים.
  • בייז מציע דרך חשיבה המשכללת את המידע החדש (הנתון) עם המידע שצברנו עד כה (ההשערה).

  • סיכום שונה (של המצגת)

  • התיאוריה הבייסיאנית היא מטאפורה לדרך חשיבה הכוללת השערות המתעדכנות ללא הרף על ידי נתונים חדשים.

  • משפט בייס כורך בתוכו את הנתון של שיעור הבסיס שהוא נתון אשר יכול לשנות הסתברויות בצורה משמעותית, ומציע דרך נורמטיבית לאינטגרציה בין נתונים ישנים וחדשים

  • שימוש בדרך החשיבה הבייסיאנית מאפשר לנו לנצל נתונים חדשים כדי לבחון השערות ישנות, וכן מחייב אותנו לחשיבה השוואתית, שכן חייבים להכניס לשיקולים גם את הסתברות הנתון תחת אלטרנטיבה

חזרה לשיפוט והערכה בתנאי אי וודאות

מודעות פרסומת

להשאיר תגובה

הזינו את פרטיכם בטופס, או לחצו על אחד מהאייקונים כדי להשתמש בחשבון קיים:

הלוגו של WordPress.com

אתה מגיב באמצעות חשבון WordPress.com שלך. לצאת מהמערכת / לשנות )

תמונת Twitter

אתה מגיב באמצעות חשבון Twitter שלך. לצאת מהמערכת / לשנות )

תמונת Facebook

אתה מגיב באמצעות חשבון Facebook שלך. לצאת מהמערכת / לשנות )

תמונת גוגל פלוס

אתה מגיב באמצעות חשבון Google+ שלך. לצאת מהמערכת / לשנות )

מתחבר ל-%s

קטגוריות

%d בלוגרים אהבו את זה: