פורסם על ידי: or100 | מאי 28, 2009

שיפוט והערכה בתנאי אי וודאות – בלוק 2: היוריסטיקות והטיות ארגון מאמר 2

מאמר 2 היוריסטיקות והטיות/כהנמן וטברסקי (1973) (מאמר ומולטימדיה)

מבוא

  • המאמר דן  בתהליכים הקוגניטיביים המעורבים בתפקודי שיפוט והערכה

באופן כללי מטרות המאמר והיריסטיקות

  • כהנמן וטברסקי לא הסתפקו באיתור הליקויים בתהליך ההסקה, אלא הציעו גם עקרונות שבני אדם פועלים לפיהם בבואם להסיק מסקנות בתנאי אי וודאות.

טענתם המרכזית של כהנמן וטברסקי גורסת

  • שכאשר אנשים באים לשפוט הסתברות הם לא משתמשים במודלים סטטיסטיים
  • אלא מגייסים לעזרתם מספר כללי עזר אינטואיטיביים – היוריסטיקות בלשונם (מנגנון אינטואיטיבי) – שלעיתים אינם עולים בקנה אחד עם החוקים הסטטיסטים.

  • הרעיון המרכזי של המאמר הוא רעיון ההיוריסטיקות

הגדרת  היריסטיקות

  • (המונח היורסטיקה לקוח מהמלה היוונית היריקה – שפרושה מצאתי).

  • היוריסטיקות אילו הן כללי אצבע /קיצורי דרך אינטואיטיביים המפחיתים את המטלות המורכבות של הערכת הסתברויות וחיזוי ערכים לפעולות פשוטות יותר.
  • במילים אחרות, אילו הן כללי אצבע המסייעים לנו לשפוט ולהסיק מסקנות במהירות בתנאי אי וודאות.
  • (אולם המהירות שבה פועלות ההיריסטיקות יכולה לבוא לעתים על חשבון איכות השיפוט)

במילים אחרות

  • כללים או עקרונות היריסטיים הם מעין "כללי אצבע" או "קיצורי דרך",
  • כלומר דרכים פשוטות יחסית להתמודד עם בעיות שמטבען הן מורכבות ודורשות חישובים מסובכים, המבוססים על נתונים רבים.
  • עקרונות אלה מאפשרים לפשט את התהליכים הכרוכים בשיפוטים ובאומדני הסתברות ולהקל את ביצוע המטלה הקוגניטיבית.

הטענה העיקרית (בנוגע להיוריסטיקות) היא

  • שהיוריסטיקות הללו הן מנגנון אבולוציוני שהאדם פיתח בכדי להתמודד עם שיפוטי הסתברות באי וודאות והם מציעות  לאדם מהירות, חסכניות והחלטיות במחיר של דיוק.

  • ולכן התפתחו קיצורי דרך (כללי אצבע* שאפשרו לאנשים להתמודד עם אי וודאות ולענות על משימות הסתברותיות

  • היוריסטיקות הן באופן כללי מועילות, יש שהן מקלות על מלאכת ההסקה ומאפשרות להגיע למסקנות קרובות למדי לשיפוטים ולאומדנים הנורמטיביים,
  • במילים אחרות
  • אפשר לראות את ההיריסטיקות  כחיסכון
  • יש בעיה של זמן, עומס מידע וכד'
  • קשה להשתמש במודלים מורכבים

  • אך לעיתים הן מובילות לשיפוט מוטעה ואף הפוך שיטתית ביחס למודל הנורמטיבי.
  • כאמור, המהירות שבה פועלות ההיריסטיקות יכולה לבוא לעתים על חשבון איכות השיפוט.

מטרת המאמר

  • מטרת המאמר היא להגדיר מצבים שבהם השיפוט ההיריסטי יוביל להטיה אשר ניתן לנבא אותה:
  • כהנמן וטברסקי מנסים במאמרם לאפיין את המקרים בהם התשובה על פי היורסטיקה נוגדת את התשובה הנורמטיבית
  • ודרך מצבים אלו לאפיין ולהבין לעומקם את המנגנונים הקוגניטיביים עליהם מבוססת היורסטיקה ואת השפעתם על דרך החשיבה שלנו.

  • יש לשים לב שאם נלמד את הכשלים של ההיוריסטיקות

א)      נוכל להבין מנגנונים שדרכן החשיבה שלנו עובדת (ההיוריסטיקות עובדות)

ב)      נוכל לשפר את השיפוטים שלנו בכדי לקבל החלטות חשובות

  • מילה נוספת על העבודה של כהנמן  וטברסקי
  • הרעיון החדש של כהנמן וטברסקי הוא שאנשים לא סתם מפירים את המודל הנורמטיבי
  • אלא אנשים מפירים את העקרונות הרציונלים בצורה שיטתית
  • כהנמן וטברסקי הגדירו  3 היוריסטיקות בסיסיות:

היוריסטיקות

I)        היריסטיקת היציגות

II)     היריסטיקת הזמינות

III)   היריסטיקת עיגון ותיקון

I)      יציגות

  • · היוריסטיקה זו באה לענות על השאלה:
  • מה ההסתברות שמאורע X שייך לקטגוריה Y?

  • · הסבר איך היריסטיקת היציגות פועלת
  • בבואם של אנשים לענות על שאלה זו הם מתבססים על היוריסטיקת היציגות שבה :
  • הסתברות מוערכת לפי המידה שבה X מייצג או דומה לאבטיפוס של קטגוריה Y

  • ככל שמאפייני הפרט נתפסים כדומים יותר למאפיינים הבולטים של הקטגוריה, כמתאימים להם או כמזכירים אותם, כך גוברת הנטייה לשייך את הפרט לקטגוריה זו.
  • במילים אחרות: ככל שהתיאור יותר דומה אנחנו נותנים לו הסתברות יותר גבוהה.
  • כהנמן וטברסקי טוענים שאנו שופטים את ההסתברות ע"פ מידת הדמיון בתכונות הנתפסות כזהות בין המאורע שאותו אנו שופטים לבין אב טיפוס של הקטגוריה שמעניינת אותנו.

כמה מילים על אב טיפוס

  • ממחקרים על למידת מושגים ויצירתם עולה, כי לכל מושג יש אב-טיפוס (פרוטוטיפ)
  • אובייקט כלשהו הנתפס כמיטיב לייצג את המושג, וכי אפשר לדרג אובייקטים לפי מידת הדמיון שבינם לבין האב-טיפוס.

  • למשל,
  • האובייקט "דרור" מיטיב לייצג את המושג "ציפור" יותר מהאובייקט "נשר".
  • אפשר לומר, אם כן, כי עקרון היציגות מתבסס על מידת הדמיון הנתפס בין אובייקט X לבין האב-טיפוס של קטגוריה A , וכי עיקרון זה משפיע על קביעת הסתברות שיוכו של X ל -A .

  • כאמור, במקרים רבים אפשר להסתפק בקביעת ההסתברות על-סמך עקרון היציגות, אבל במקרים מסוימים עלולה ההסתמכות על עיקרון זה להטעות, שכן הוא אינו מביא בחשבון גורמים אחדים המשפיעים על ערך ההסתברות של שיוך X לA- . בקטעים הבאים נסקור גורמים אלה.
  • לאיזה מנוי יש יותר סיכוי לזכות בפיס:

שאלות לדוגמא

א)      10, 15, 20, 25, 30

ב)      23, 17, 32, 7 , 34

  • רוב האנשים יגידו לב' למרות שלשניהם יש אותה הסתברות

ניסוי

  • בניסוי מפורסם סיפרו לנבדקים כי במסיבה  כאשר קבוצה א' דווחה ש70%- מהמשתתפים  הם מהנדסים והשאר עורכי דין וקבוצה ב' דווחה ש70%- הם עורכי דין והשאר הם מהנדסים.
  • נלקח מהמסיבה משתתף מקרי אשר תאורו מתאים למהנדס והנבדקים נשאלו מהו הסיכוי שהוא אכן מהנדס.
  • שתי הקבוצות נתנו את אותה הערכת ההסתברות, על פי כהנמן וטברסקי שתי הקבוצות פעלו על סמך יציגות,
  • הם העריכו את מידת הדמיון של התאור למהנדס מבלי להתחשב ביחסי הבסיס. בעצם זוהי טעות ההיפוך – במקום לשפוט את הסיכוי שהוא מהנדס בהינתן  התאור (הסתברות בייזיאנית)
  • הם שופטים את הסיכוי שכך יראה  כמו התאור במידה והוא מהנדס.

טעויות שהיריסטיקת היציגות עלולה להוביל באופן כללי

  • כמובן שהחוקרים אינם טוענים שהיוריסטיקה זו אינה טובה אבל יש מקרים שבהם היציגות מובילה לטעות שיטתית.

  • היוריסטיקה הזו יכולה להוביל למספר טעויות:

1. חוסר התייחסות לשיעור הבסיס אי רגישות להסתברות אפריורית

  • שפיטה ע"פ כלל היציגות גוררת להתעלמות משיעור הבסיס.
  • בניסויים נמצא שנבדקים התייחסו לשיעור הבסיס כאשר לא היו שום נתונים נוספים אבל כאשר נתנו להם איזשהו תיאור שנראה להם מייצג, הם התעלמו משיעור הבסיס (גם כאשר הנתון הנוסף לא היה רלוונטי).

2. חוסר התייחסות לגודל המדגם –

  • הדוגמא של מפעלי המסמרים ממחישה טעות זו:
  • הנבדקים לא התייחסו למספר המסמרים שנבדקו ביחס לגודל המפעל (ככל שהמפעל יותר קטן כך האפשרות לסטייה גדולה יותר).

3. הבנה מוטעית של המושג "מקריות"

  • אנשים מצפים שרצף של מאורעות שקרו בתהליך אקראי ייצגו את התכונות העיקריות/החשובות של אותו תהליך גם כאשר הרצף קצר.
  • הטענה היא כי אנשים מצפים שהאב טיפוס של המקריות יהיה מיוצג לא רק בתכונותיה הכוללות של הסדרה, אלא בכל קטע שלה, וייצוג כזה הם מכנים "יציגות מקומית".
  • דווקא יציגות מקומית כזו גורמת לסטייה שיטתית ממקריות בסדרה כולה.

  • טעות זו היא הבסיס לכשל המהמרים
  • לדוגמא בעיה 4
  • רוב אנשים חושבים של עץ-פלי-עץ-פלי יש הסתברות גדולה יותר מאשר לעץ-עץ-פלי-פלי כאשר בעצם יש לשניהם את אותה ההסתברות.

4. אשליית התוקף –

  • אנשים מבססים את הניבויים שלהם בעיקר על מידת הדמיון הנתפס (יציגות) בין התוצאה שהם מבקשים לנבא לבין הנתון שבידיהם,
  • וזאת מבלי להביא בחשבון את תוקף המדידה של נתון זה.
  • לדוגמא:
  • פסיכולוגים שעורכים ראיונות מיון למועמדים למקצועות שונים מנבאים את ההצלחה הצפויה במקצוע על סמך ההתנהגות בראיון למרות הידיעה הבדוקה כי תוקפם של ראיונות אלו נמוך.

תפיסה מוטעית של המושג "רגרסיה"  –

  • ההסבר האינטואיטיבי לתופעת הרגרסיה הוא שציון מסוים מבטא לא רק יכולתו האמיתית של הנבחן אלא גם מרכיב כלשהו של טעות.
  • הסבר
  • נניח שיוסי קיבל 90 ציון זה כולל גם את כישוריו של יוסי אך סביר להניח שהיו גורמים נוספים שתרמו להצלחתו: היה לו הרבה זמן להתכונן, הוא בא מאוד ערני ומרוכז, ניחש נכון את התשובות…..
  • מרכיב הטעות שבציון שלו הוא חיובי ומכאן שיכולתו האמיתית נמוכה במעט מהציון שקיבל.
  • ההנחה היא שבמבחן הבא יקבל ציון קצת יותר נמוך, ציון קרוב יותר לממוצע קבוצתו.

  • אנשים מתקשים לתפוס אינטואיטיבית את התופעה של תסוגה לממוצע משום שמנחה אותם עקרון היציגות,
  • כלומר יש להם ציפייה שציון המדידה השנייה יהיה דומה מאוד (ייצג) לציון המדידה הראשונה.

  • דוגמא ידועה היא

  • תגובתם של מדריכי טיס על ביצועיהם של פרחי טיס – כאשר פרח טיס ביצע היטב תרגיל טיסה הוא זכה לציון שבח.
  • בטיסת האימון הבאה חלה שמקרים רבים ירידה באיכות הביצוע.
  • המדריכים ייחסו ירידה זו להשפעה השלילית של שבח על למידה, ולא הבינו כי לאחר ביצוע טוב, המייצג נקודה קיצונית בהתפלגות הביצועים קיימת הסתברות גבוהה לתסוגה לממוצע, כלומר לביצוע פחות טוב בלי קשר לשבח.

1. אי רגישות להסתברות אפריורית (יציגות)

תרגיל המהדס ועורך הדין

מתוך המאמר –   אי רגישות להסתברות אפריורית-

תמצית השאלות והתשובות

א) הסתברות אפריורית (= שיעור בסיסי)

  • להתרחשותו של כל מאורע יש הסתברות מסוימת, אשר שלא תמיד אנו יודעים מהי. זוהי ההסתברות ההתחלתית, המבטאת את מצב העולם ברגע נתון והיא מבטאת את מהלך המאורעות עד לאותו רגע.
  • הסתברות זו מביאה בחשבון את כל ההתרחשויות עד לקבלת מידע נוסף, ולכן היא קרויה אפריורית  (apriori).
  • אפשר שמידע חדש שיתקבל יחייב לעדכן את ההסתברות, וההסתברות המעודכנת תיקרא אפוסטריורית .(aposteriori)
  • כל הסתברות אפוסטריורית תיהפך לאפריורית לגבי כל מידע נוסף שיתקבל או התרחשות חדשה שתתממש, וחוזר חלילה.
  • ככל הסתברות, גם הסתברות אפריורית יכולה לבטא אמונה סובייקטיבית, מודל של המאורע, או שכיחות יחסית של התרחשות המאורע עד לרגע הנתון.

  • "השיעור הבסיסי(base-rate)  " המייצג את שכיחות ההתפלגות של מאורעות בעולם הוא למעשה הסתברות אפריורית ברגע נתון.

  • הדוגמה המובאת בקטע מבהירה, כי אם אנו נשאלים מה ההסתברות שאדם בשם סטיב עוסק באחד מכמה מקצועות אפשריים, כי אז בלא כל קשר למידע הנתון עליו, קיימת הסתברות אפריורית להיותו בעל אותו מקצוע, והיא באה לידי ביטוי בהתפלגות הגברים במדינה בין המקצועות הנ"ל. התפלגות זו היא השיעור הבסיסי

ב) התייחסות להתפלגות התוצאות בתרגיל א' והשיעור הבסיסי

  • העובדה שהתשובות של הנבדקים בשאלון א' דומות לתשובות של הנבדקים בשאלון ב' מאפשר להסיק שהנבדקים בשתי הקבוצות עושים דבר דומה למרות השוני בשאלונים.
  • על-פי-רוב  מרבית הנשאלים מבססים את הערכתם על מידת היציגות של התיאורים:
  • כלומר על מידת הדמיון בין התיאור של המרואיין לבין התיאור הסטריאוטיפי של מהנדס. מידת דמיון זו זהה בשני השאלונים.
  • {ראה את האנימציה המתארת את ה-הטיה הנפוצה והתשובה הנורמטיבית בתרגיל הראשון}.

  • המבחין בין השאלונים הוא השיעור הבסיסי:
  • אחוז המהנדסים בקהל. המשיבים אינם מתייחסים לאחוז זה, ולכן אינם מביאים בחשבון בשיפוטם  את ההבדל בין התפלגויות המהנדסים ועורכי-הדין.

ג) התשובה המצופה למול התשובה הנורמטיבית- הדוגמא של  דיק

במאמר המחברים נותנים דוגמא

  • דיק הוא בן 30, הוא נשוי בלי ילדים, יש לו יכולויות גבוהות, ומוטיבציה גבוהה. הוא נחשב להצלחה בתחום שלו והוא מוערך על ידי הקולגות שלו

שאלה

  • נניח שנאמר לנבדק  שדיק נדגם מקרית מקבוצה של 70 מהנדסים ו- 30 עורכי דין בדומה לתרגיל 1.
  • הנבדק  מעריך כי התיאור של דיק דומה למהנדס ולעורך דין באותה מידה.
  • כעת נשאל הנבדק מהו להערכתו הסיכוי שהנבדק הוא מהנדס.
  • נשאלת השאלה מה (על-פי המאמר) תהיה תשובתו של הנבדק,
  • ומהי התשובה הנורמטיבית לשאלה זו?

תשובה

  • יש לשים לב שהתיאור של דיק הוא דוגמה למידע לא אינפורמטיבי, כלומר- מידע שאינו מבחין בין ההשערה לבין האלטרנטיבה שלה.
  • לפי המודל הנורמטיבי, יש להתעלם ממידע כזה ולהשתמש כאן רק בשעור הבסיסי, שעל פיו 70% מהאוכלוסייה שהמדגם נלקח ממנה הם מהנדסים.
  • הנבדקים במאמר אכן שפטו את המידע כלא אינפורמטיבי אך לא השתמשו בשיעור הבסיסי.
  • הנבדקים במאמר העריכו כי התיאור דומה למהנדס ולעורך דין במידה שווה.
  • כלומר במקום להתעלם מהמידע הנוסף ולהתבסס על השיעור הבסיסי, הם התעלמו גם מהשיעור הבסיסי וביטאו את הניטרליות של התיאור בהערכה כי יש אותם סיכויים שדיק מהנדס או עורך דין, כלומר נתנו הערכה של 0.5.

מצגת: תשובה נורמטיבית- הרצאה של רות בייט מרום

תאור הבעיה- חישוב נורמטיבי בעזרת נוסחת בייז
  • בתרגיל היו שתי גירסאות שנבדלו רק בהרכב הקהל:

שאלון 1

שאלון 2

  • 옕老ؖ葞 葠ﺘ[1].
  • 舂᠀
  • ᥐ萑l옕倁ؙ葞ᥐ葠l
  • .
  • 抐奒˓

  • 㛙⛝ᾧԎ繦ᾖྡ䐛Ԛ籀′⣕圡唏叢寅叢寅㫖
    • ၊င�
    • �������������������������

    • 垸㐼


      Ѝ垸㐼Ѝ垸㐼

Ѝ


ЍЍ단ЍЍ

  • ЍЍЍЍЍЍ垸㐼

Ѝ垸㐼Ѝ垸㐼ЍЍ


ЍЍ垸㐼


ЍЍЍ


ЍЍЍ


ЍЍꨢ뉺

    • ЍЍЍЍЍЍЍተꄀ�谊ЍЍ

ЍЍЍЍ垸㐼ЍЍЍ


ЍЍЍ


ЍЍ垸㐼


ЍЍЍ


ЍЍЍ


ЍЍ垸㐼


ЍЍЍ


ЍЍЍ


  • Ѝ�潄垸㐼ЍЍЍЍЍЍЍЍЍЍ
      • ЍЍЍЍЍЍ䃿老㹫㹫촬ͫ㹫㹪⠂            @�C倀

        倀倀„＀ǿ܀唀渀欀渀
      • 眀渀＀ǿࠀ＀ǿ＀ÿȀ＀ÿ＀ÿȀ＀ÿऀ䜀逖Ȁ؂ԃԄ̂蜄z ࢀ＀吀椀洀攀猀 一攀眀 刀漀洀愀渀㔀逖ȁԀąĂ؇Ԃ

    • €匀礀
      • 戀漀氀㌀逦Ȁ؋ȄȂȂ蜄z ࢀ＀䄀爀椀愀氀㌀逆넁Ā 䐀愀瘀椀搀⼀逵넁            Ā
      • 刀漀搀䬀逆넁Ā 䐀愀瘀椀搀 吀爀愀渀猀瀀愀爀攀
      • 琀㔀逦Ȁ؋̄ЅȄ蜄zaࢀ＀ā吀愀栀
        • 洀愀㼀逵Ȁ̇ȉԂЂ蜄z ࢀ＀䌀漀甀爀椀攀爀 一攀眀㬀逆ȁԀ€圀
    • 渀最搀椀渀最猀
      • Ѐ㄀蠈탰[1]栀嘀鍻嵆鎂f─뼀저            섀7ĀᰀЀ̀瘐ĀĀĀ℀

ࠀꀇ됅됀脀ኁ0砀D椀>Ȁఀ

שאלון 1 ידוע ש:

P(H)= 0.7 – הסיכוי להיות מהנדס

P(H^)= 0.3- הסיכוי להיות עורך דין

Ñჰࠀ

＀ዿᘀ퀀- הסיכוי להיות מהנדס

P(H^)= 0.7- הסיכוי להיות עורך דין

  • ההבדל בין שני השאלונים זה ההסתברויות הא- פריוריות

בשלב הראשון בשני השאלונים אנחנו רוצים להעריך את ההסתברויות המותנות הבאות:

  • יש לשים לב שההסתברויות האלה לא מותנות בשאלות ולפיכך הן זהות בשני השאלונים
  • כאמור את ההסתברויות האלה אנחנו רוצים להעריך:

שאלון 1

P(D/H)=  0.8 (הערכה בלבד)

  • = מה הסיכוי שמישהו שהוא מהנדס נראה כמו אהרלה

P(D/H^) =  0.1 (הערכה בלבד)

  • מה הסיכוי שמישהו שהוא עורך דין נראה כמו אהרלה

שאלון 2

P(D/H)=  0.8 (הערכה בלבד)

  • = מה הסיכוי שמישהו שהוא מהנדס נראה כמו אהרלה

P(D/H^) =  0.1 (הערכה בלבד)

  • מה הסיכוי שמישהו שהוא עורך דין נראה כמו אהרלה

  • הדברים שאנחנו יכולים להגיד על ההסתברויות הנ"ל
    1. כל הסתברות נעה בין 0 ל 1
    2. ההסתברויות האפריוריות  הן תמיד מסתכמות ל 1:
        • 1 = P(H^) + P(H)
        • (יכול להיות רק מהנדס ורק עורך דין)

    1. ההסתברויות המותנות לא חייבות להסתכם לאחד
        • במקרה שלנו
          • P(D/H)= 0.8
          • P(D/H^)= 0.1

4) היחס בין שני ההסתברויות ב 3' (המותנות) הדיאגנוסטיות של הנתון

        • כלומר באיזה מידה הנתון מבחין בין שתי ההשערות
        • P(D/H^)  / P(D/H)

שאלון 1: הצבת הנתונים בנוסחת בייז

  • הסיכוי שאהרלה הוא מהנדס בהינתן התאור
    • P (H/D) = { P(D/H) *P(H) } / {P(D/H)* P(H) + P(D/H^) * P(H^)}

    • P (H/D) { 0.8 * 0.7)} / { 0.8 * 0.7  + 0.1*0.3) = 0.95
    • זוהי ההסתברות שאהרלה, הוא מהנדס (ההסתברות הפוסטריורית)

  • הסיכוי שאהרלה הוא עורך דין בהינתן התאור
    • P (H/D^) = 1- P (H/D) = 1-0.95= 0.05
    • זוהי ההסתברות שאהרלה הוא עורך דין (הסתברות א פריורית)

שאלון 2: הצבת הנתונים בנוסחת בייז

  • הסיכוי שאהרלה הוא מהנדס בהינתן התאור
    • P (H/D) = { P(D/H) *P(H) } / {P(D/H)* P(H) + P(D/H^) * P(H^)}
    • P (H/D) { 0.8 * 0.3)} / { 0.8 * 0.3  + 0.1*0.7) = 0.77
    • זוהי ההסתברות שאהרלה, הוא  (ההסתברות הפוסטריורית)

  • הסיכוי שאהרלה הוא עורך דין בהינתן התאור
    • P (H/D^) = 1- P (H/D) = 1-0.77= 0.23
    • זוהי ההסתברות שאהרלה הוא עורך דין (הסתברות א פריורית)

סיכום נתונים הסתברויות אפוסטריוריות:

שאלון 1

שאלון 2

מהנדס

0.95

0.77

עורך דין

0.05

0.23

סה"כ

1

1

הסבר נוסף כיצד משפיעות ההסתברויות האפריוריות (שיעורי הבסיס) על ההסתברויות הפוסטריוריות)

נניח שיש לנו את אותן הסתברויות מותנות

  • o P(D/H)= 0.8-  נניח שמבין המהנדסים אלא שנראים כמו אהרלה הם 0.8
  • o P(D/H^)= 0.1 נניח שמבין עורכי הדין אלא שנראים כמו אהרלה הם 0.1
  • רוצים לבדוק כיצד ההסתברויות הפוסטריוריות
      • P(H/D)
      • P(H^/D)
  • מושפעות משינויים מההסתברויות האפריוריות
      • P(H^)
      • P(H)

נתייחס לטבלה אשר בה הרכב העולם משתנה (כלומר שיעור המהנדסים הוא 0.9, 0.5, 0.1)

  • נניח שמרבית המהנדסים נראים כמו אהרלה P(D/H)= 0.8
  • ורק מיעוט עורך הדין נראים כמו אהרלה P(D/H^)= 0.1
  • ואז נחשב לפי נוסחת בייז
    • P (H/D) = { P(D/H) *P(H) } / {P(D/H)* P(H) + P(D/H^) * P(H^)}

  • (מוצגות רק התוצאות)

חישוב P (H/D) ו P (H^/D)

מהנדס

עורך דין

יחס

מקרה א

0.9 = P(H)

0.989

0.014

מקרה ב

0.5 = P(H)

0.888

0.111

מקרה ג

0.1 = P(H)

0.47

0.53

  • מקרה א':
    • מרבית האנשים בקהל הם מהנדסים (90%)
    • מרבית המהנדסים נראים כמו אהרלה (80%)
    • ולפיכך ההסתברות שהאדם הוא מהנדס היא 98.9%
  • מקרה ג
    • מרבית האנשים בקהל הם עורכי דין (90) – מיעוט מהנדסים
    • מרבית המהנדסים נראים כמו אהרלה (80%)
    • ולפיכך ההסתברות שהאדם הוא מהנדס היא 0.47 והיא יותר נמוכה מההסתברות שהוא עורך דין

  • מקרה ב
    • מצב 50% מהנדסים, 50% עורכי דין
    • אילו לא היינו יודעים כלום על אהרלה אז היינו אומרים שסיכוי של 50% שהוא מהנדס (ו50% שהוא עורך דין)
    • מכיון שנתון ההסתברויות מותנות (הרבה מהמנדסים נראים כמו אהרלה)
    • כלומר ההסתברות הפוסטרית שהוא מהנדס היא 0.888, והסיכוי שהוא עורך דין היא 0.111
    • כלומר קיבלנו מספרים שמאוד דומים להסתברויות המותנות (0.8, 0.1)
    • כלומר
      • במצב ש  P(H)=0.5 אז במקרה זה:
        • P(D/H) =  P(H/D)
          • כלומר ההסתברויות הפוסטריוריות הם כמו ההסתברויות המותנות
    • כלומר במקרה

  • הסבר מה קורה שההסתברויות האפריוריות הן ביחס הפוך בדיוק להסתברויות האפריוריות

למשל

נניח שיש הסתברויות מותנות ש:

  • P(D/H) =0.8 -מבין המהנדסים 80% דומים לאהרלה
  • P(D/H^) =0.2 -מבין עורכי הדין 20% דומים לאהרלה
  • כלומר גורם הסתברויות המותנות נותן יתרון למהנדסים

נניח שיש הסתברויות אפריוריות

  • P(H)=0.2  – 20% מהקהל הם מהנדסים
  • P(H^)= 0.8 – 80% מהקהל הם עורכי דין
  • כלומר גורם הסתברויות אפריוריות נותן יתרון לעורכי הדין

  • · כאשר נציב בנוסחת בייז נקבל
    • P (H/D) = { P(D/H) *P(H) } / {P(D/H)* P(H) + P(D/H^) * P(H^)}
  • · נקבל שההסתברות הפוסטריות
  • o P(H/D)= P(H^D)=0.5
  • כלומר ההסתברות שהוא מהנדס זהה להסתברות שהוא עורך דין
  • כלומר נעשה פה קיזוז של שני הגורמים

על הקשר שבין התשובה האינטואטיבית לנורמטיבית

  • הנבדק אומר : רוב המהנדסים נראים כמו אהרלה (זה הנימוק המקובל לתשובה)
  • למעשה הנבדק מעריך:  P(D/H)
  • ובעצם  הנבדק נשאל: P(H/D) –
  • כלומר הנבדק  עונה על ההסתברות שלא מתאימה

  • · ההסתברויות הנ"ל P(H/D) ו P(D/H) הן לא זהות
  • המעבר מאחת לשניה נעשה דרך נוסחת בייז
  • לפי הנוסחא מחשבים את ההסתברויות הרצויה P(H/D)  מתוך
  • ההסתברויות המותנות: P(D/H)  ו P(D/H^)
  • וההסתברויות האפריוריות: P(H)  ו P(H^)

סיכום : הדגמה מספרית
  • אם יש מעט מהנדסים בעולם (נניח 10 מתוך 100) – P(H)
  • אם יש המון עורכי דין באולם (נניח 90 מתוך 100)- P(H^)
  • וגם
  • אם רוב המהנדסים נראים כמו אהרלה (נניח 8 מתוך 10)- P(D/H)
  • ומיעוט עורכי הדין נראים כמו אהרלה ( נניח 10 מתוך 90)- P(D/H^)
  • אזי
  • מתוך כל 18 האנשים שדומים לאהרלה ( 8 + 10)
  • רובם הם עורכי דין הרוב הם עורכי דין (10 עורכי דין לעומת 8 מהנדסים) –
  • P(H^/D) > P(H/D)
  • כלומר
  • ההסתברות שאהרלה עורך דין יותר גדולה מאשר ההסתברות שהוא מהנדס

תרגיל המוניות

השאלה עצמה

  • מונית הייתה מעורבת בתאונת פגע וברח. בעיר יש שתי תחנות מוניות, אחת שכל המוניות שלה ירוקות ואחרת שכל המוניות שלה כחולות. ידוע  כי 85% מן המוניות בעיר הן ירוקות ו 15% הן כחולות, כמו כן ידוע כי
  • עד ראייה שהיה במקום טוען שהמונית הפוגעת היתה ירוקה.
  • כדי לבדוק את יכולתו של העד לזהות צבעי מוניות בתנאי ראות שונים הציג לפניו בית המשפט מדגם של מוניות (מחציתן כחולות ומחציתן ירוקות). נמצא כי ב- 80% מהזיהויים של צבע היו נכונים ו- 20% היו מוטעים.
  • מהי ההסתברות שהמונית שהייתה מעורבת בתאונה היא כחולה?

התוצאות השכיחות

  • הבעיה היא שמסתמכים על מהימנות העד, ושוכחים את השיעור הבסיסי (הרכב המוניות בעיר)
  • גם כאשר נתון בשאלה שרוב המוניות הן ירוקות,
  • וגם כאשר נתון בשאלה שרוב המוניות הן כחולות
  • התשובה השכיחה היא
  • שההסתברות שהמונית הפוגעת היא כחולה היא 20%
  • וההסתברות שהמוניות הפוגעת היא ירוקה היא 80%

ניתוח התשובה הנורמטיבית על פי התקליטור  (הניתוח המפורט הוא ניתוח המהנדס ועורך הדין)

נגדיר

H- המוניות המעורבת ירוקה

H^ – המוני המעורבת כחולה

D- העד אמר שהמוניות ירוקה

בגירסה א

מרבית המוניות בעיר ירוקות- 85%

השאר: כחולות – 15%

בגירסה ב

מרבית המוניות בעיר כחולות – 85%

השער: ירוקות 15%

העד

בשתי הגרסאות העד אומר ירוקה, וצודק ב 80% מהמקרים

מהמנות העד 80% פירושה ש

  • P(D/H)=0.8  – דהיינו שהעד אמר שהמוניות ירוקה והיא אכן ירוקה
  • P(D^/H^)=0.8  – דהיינו שהעד אמר שהמוניות כחולה והיא אכן כחולה

ומכאן, ההסתברות לטעויות שלו:

  • P(D^/H)=0.2  – דהיינו שהעד אמר שהמוניות כחולה והיא ירוקהP(D/H^)=0.2  – דהיינו שהעד אמר שהמוניות ירוקה והיא כחולה

גרסה א

הסתברות אפריורית

  • P(H)=0.85 – הסתברות שהמוניות ירוקה
  • P(H^)=0.15- הסתברות שהמוניות כחולה

הדיאגניסטיות של הנתון

  • P(D/H)=0.8 ההסתברות שהעד אומר שהמוניות ירוקה בתנאי שהיא ירוקה
  • P(D/H^)=0.2- ההסתברות העד אומר שהמונית ירוקה והיא כחולה

גרסה ב

הסתברות אפריורית

  • P(H)=0.15 – הסתברות שהמוניות ירוקה
  • P(H^)=0.85- הסתברות שהמוניות כחולה

הדיאגניסטיות של הנתון (אותו דבר כמו בגרסה א)

  • P(D/H)=0.8 ההסתברות שהעד אומר שהמוניות ירוקה בתנאי שהיא ירוקה
  • P(D/H^)=0.2- ההסתברות העד אומר שהמונית ירוקה והיא כחולה

הסתברות פוסטריות לגירסה א'
  • P(H/D)=
  • {P(D/H)*P(H)} / { P(D/H)*P(H) + P(D/H^)*P(H^)}=
  • {0.8*0.85}  / {0.8*0.85 + 0.2*0.15}=
  • 0.96
  • P(H/D)=
  • {P(D/H)*P(H)} / { P(D/H)*P(H) + P(D/H^)*P(H^)}=
  • {0.8*0.15}  / {0.8*0.15 + 0.2*0.85}=
  • 0.41
הסתברות פוסטריות לגירסה ב'

  • למרות שאמינות העד זהה בשתי הגירסאות הסיכוי שהמוניות שפוגעת היא ירוקה היא שונה כיוון שתלויה בהסתברויות אפריוריות (שיעורי הבסיס)
  • הסתברויות אלה שונות בגירסאות השונות.

לסיכום

הנבדקים מתעלמים משיעורי הבסיס ומתייחסים רק למהימנות העד שהיא שווה בשני המקרים ל 0.8

אבל בהסתברויות אפריוריות שונות ההסתברות הפוסטריוריות הן כמובן שונות

2. אי רגישות לגודל המדגם (יציגות)

מתוך המאמר: קטע ה'- אי רגישות לגודל המדגם

  • באופן  כללי הקטע במאמר מצגים מצבים שבהם הערכות הסתברותיות מחייבות התייחסות לגדול המדגמים שעליהן הן מבוססות
  • מכיון שהערכת אנושיות מתבססות על עקרון היציגות שלא מושפע משיקולי גודל המדגם
  • הערכות במצבים אלה לעתים קרובות מוטות ומטעות

באופן כללי

הקשר בין סטטיסטי של מדגם (למשל ממוצע המדגם) גודלו של המדגם, והפרמטר באוכלוסייה

  • הסטטיסטיקה ההיסקית מבקשת למצוא את הפרמטר (ערך המייצג תכונה באוכלוסייה, – (למשל הגובה הממוצע באוכלוסיית המבוגרים)
  • על סמך הסטטיסטי (ערך המייצג תכונה במדגם, -למשל הגובה הממוצע במדגם של 100 מבוגרים).
  • הטעויות הכרוכות בהיקש כזה נובעות מטעות הדגימה,
  • כלומר מהסתמכות על מדגם שאינו מייצג כיאות את האוכלוסייה.
  • ככל שמדגם גדול יותר, כך סיכוייו גדולים יותר להיות מייצג (בתנאי של דגימה מקרית),
  • ולכן הסיכוי שהסטטיסטים שלו קרובים יותר לפרמטרים גבוה מזה של מדגם קטן ממנו.

  • אפשר לומר כי המדגם המיטיב לייצג אוכלוסייה כלשהי הוא המדגם הגדול ביותר – האוכלוסייה עצמה.
  • לעומת זאת, המדגם הקטן ביותר – המקרה הבודד, גם אם נדגם מקרית – סיכוייו לייצג את האוכלוסייה קטנים ביותר.
  • במדגם שכזה קטנים סיכוייו של ממוצע המדגם (שהוא התצפית עצמה) להיות זהים לממוצע האוכלוסייה. סיכויים אלה קטנים עוד יותר ככל שהשונות של האוכלוסייה גדלה.

משמעות של אי רגישות לגודל המדגם

  • האי-רגישות לגודל מדגם פירושה כי בני-אדם בדרך-כלל אינם רגישים ליחס הנכון שבין הסטטיסטי, גודל המדגם והפרמטר.
  • כלומר, הם שופטים
  • (א) את ההסתברות לקבל סטטיסטי מסוים במדגם כשידוע הפרמטר באוכלוסייה,
  • או (ב) את ההסתברות שפרמטר מסוים באוכלוסייה הוא ערך כלשהו כשידוע הסטטיסטי במדגם,
  • רק על-סמך הדמיון האיכותי ביניהם (יציגות), בלי להתחשב כלל בגודל המדגם.
  • אומדן ההסתברות שלהם יהיה לפיכך זהה, בין שמדובר במדגמים קטנים ובין שמדובר במדגמים גדולים.

דוגמא לכך היא ההטיה בתרגיל בית החולים-

הטיה נפוצה (מהתקליטור)

  • רוב האנשים טוענים שמספר הימים שבהם נולדו הבנים הוא אותו דבר בשני בתי החולים
  • (אבל יש התעלמות מגודל בתי חולים- מגודל המדגם

)

תשובה נורמטיבית (מהתקליטור)

ניתוח הנתונים
  • בבית חולים גדול יש 45 לידות בכל יום
  • בבית חולים קטן יש 15 לידות בכל יום

  • במשך שנה בדקו בכל יום מה אחוז הבנים
  • נשאלה שאלה באיזה בית חולים יש יותר ימים בשנה שאחוז הבנים היה גבוה מ 60%

ניתוח השאלה

  • מה הסיכוי לקבל יותר מ 60% בנים בכל כולשהו-
  • האם סיכוי זה גדול יותר בבית חולים גדול/ קטן או זהה בשניהם.
  • איפה שהסיכוי הזה גדול יותר ביום אחד שם הסיכוי גדול יותר בשנה שלמה

  • נתבונן באוכלוסיית לידות
  • יש בערך אחוז שווה של בנים ובנות 50%
  • זה הפרמטר באוכלוסייה :  p=0.5
  • ביום מסוים לא נקבל בדיוק 50% כי מדובר במדגם ויתכן שנקבל אחוז שונה
  • אחוז במדגם (סטטיסטי) P
  • אנו רוצים להסיק מהסטטיסטי במדגם (P) לפרמטר באוכלוסייה p

התייחסות לחוק המספרים הגדולים

  • חוק המספרים הגדולים אומר שככל שהמדגם גדול יותר יש סיכוי רב יותר שהסטטיסטי שמחושב בו יהיה דומה לפרמטר באוכלוסייה
  • במקרה שלנו:
  • אם נקח מדגם של 200 לידות ונבדוק אחוז הבנים
  • ונקח מדגם של 10 לידות ונבדוק את אחוז הבנים בו

  • אז יש סיכוי גבוה יותר שאחוז במדגם הגדול לעומת המדגם הקטן יהיה 50% או קרוב לו
  • יש סיכוי גדול שסטטיסטי שחושב במדגם הגדול יהיה דומה לפרמטר באוכלוסייה יותר מאשר הסטטיסטי שחושב במדגם הקטן

  • על תוצאות מדגמים גדולים אפשר לסמוך יותר מאשר על תוצאות מדגמים קטנים מבחינת היכולת שלהם לשקף מה שקורה באוכלוסייה

קישור לשאלה

  • הסיכוי שנקבל משהו חריג גדול יותר במדגם הקטן מאשר במדגם הגדול
  • השאלה היתה למעשה על החריגים
  • האם בבית חולים גדול או קטן יש יותר סיכוי לקבל אחוז חריג של בנים יותר מ 60%
  • או באיזה בית חולים יהיו יותר ימים שכאלה

  • על פי חוק המספרים הגדולים יש יותר סיכוי לכך בבית החולים הקטן
  • אפשר לחשב על פי נוסחת הבינום (ויתרתי על זה)

המושג שמרנות

  • כאשר יש לאנשים הערכה ראשונית (אפריורית) ועליהם לשנותה לאור מידע חדש, הם מתנהגים בצורה שמרנית.
  • כלומר, הם משנים את ההסתברות האפריורית שלהם כתוצאה ממידע חדש בכיוון הצפוי, אך בקצב איטי יותר ובצורה מתונה יותר
  • לעומת החישוב הנורמטיבי לפי נוסחת בייז.
  • תופעה זו מכונה "שמרנות",
  • שכן האדם נוטה לשמר את עמדתו הראשונית, ולא לשנותה בעקבות המידע החדש שקיבל במידה המתחייבת לפי המודל הנורמטיבי.

תרגיל נוסף עבודה

בעיה 1 : בעיית מפעלי המסמרים

  • בשוק מסוים ישנם שני מפעלים המייצרים מסמרים.
  • מפעל אחד גדול – מייצר כמות של 100 מסמרים בשעה
  • ומפעל שני קטן יותר – מייצר 35 מסמרים בשעה.
  • בענף ייצור המסמרים ישנה בעיית ייצור רצינית וידוע שממוצע המסמרים הפגומים המיוצרים בשוק הוא 50%.
  • כלומר על כל מסמר תקין שמיוצר מיוצר מסמר פגום.
  • עם זאת התפלגות המסמרים הפגומים ביום עבודה יכולה לסטות מההתפלגות הכללית.
  • במשך למעלה משנה נאספו נתונים בשני המפעלים כדי לקבוע את מספר הימים שבהם אחוז הפגומים היה 60% ויותר.
  • סמן באיזה מפעל נרשם לדעתך מספר רב יותר של ימים בהם אחוז הפגומים היה 60% ויותר?

א)       במפעל הגדול

ב)       במפעל הקטן

ג)        בשני המפעלים נרשם מספר זהה.

תשובה מהסיכום המורה
  • רוב האנשים עונים שאין הבדל (תשובה ג')
  • שכן על פי תפיסתם  בשני המפעלים יש הסתברות של 50% .

  • אולם הנבדקים מתעלמים מחוק  בסטטיסטיקה הנקרא "חוק המספרים הגדולים" לפיו
  • ככל שניקח מדגם גדול יותר ישנה הסתברות גדולה יותר שהתוצאות שלו יהיו קרובות יותר לממוצע האמיתי באוכלוסייה
  • (לכן ככל שהמדגם גדול יותר התפלגות הדגימה של ממוצעי אינסוף מדגמים היא צרה יותר).

  • מכאן, ניתן להסיק שהתשובה הנכונה היא במפעל הקטן
  • כיון שככל שהמפעל מייצר פחות מסמרים כך האפשרות לסטייה גדולה יותר.

  • זוהי דוגמא להתעלמות ממידע סטטיסטי קריטי להחלטה – גודל המדגם. והתייחסות אך ורק לנתון הזמין והמייצג את הסתברות ההצלחה בייצור מסמרים.

3. הבנה מוטעית של המושג "מקריות" (יציגות)

מתוך המאמר: הבנה מוטעית של המושג "מקריות"

  • מחברי המאמר טוענים, כי בני-אדם מצפים שהאב-טיפוס של המקריות יהיה מיוצג לא רק בתכונותיה הכוללות של הסדרה, אלא בכל קטע שלה
  • וייצוג כזה הם מכנים "יציגות מקומית".

  • דווקא האמונה ביציגות מקומית לגבי כל אחד מחלקי הסדרה  גורמת לסטייה שיטתית ממקריות בסדרה כולה,
  • שכן אנו כופים על הסדרה השלמה להיות מורכבת מחלקים הדומים בדיוק זה לזה.
  • צפה בתרגיל הרולטה.

תרגיל הרולטה מהתקליטור

השאלה היתה

  • השאלה היתה איזו תופיע בהסתברות גבוהה יותר

א)      שחור, לבן, שחור, לבן, לבן, שחור

ב)      שחור, שחור, שחור, לבן, לבן, לבן

ג)        שחור, שחור, שחור, שחור, לבן, שחור

  • התשובה שרוב  הנבדקים בחרו היא סידרה א
  • (אנשים חושבים שלסידרה הראשונה יש יותר סיכוי לחזור ("מסודר בבלאגן")
  • רצף א' מזכיר מקריות
  • רבים חושבים שתהליך מקרי חייב להיות מבולבל, כאילו שרולטה אחת יודעת מה השנייה עושה
  • (רוב הסדרות יהיו מבולבלות, אבל לכל אחת מהסדרות יש אותו סיכוי).

ההסבר הנורמטיבי: חישוב הסתברויות רצפים

  • ההסתברויות של שתי התוצאות הן זהות :
  • 0.5 =( המחוג ייעצר על שחור) P
  • 0.5 =( המחוג ייעצר על לבן) P
  • כל אחת משש מכונות המזל מתנהגת לפי כלל זה ואין השפעה של מכונה אחת על השנייה

באופן כללי

  • כאשר שתי מאורעות בלתי תלויים  קורים אז הסיכוי  הוא 0.5*0.5
  • ההסתברות של כל צירוף תוצאה של 6 המכונות היא מכפלת ההסתברויות
  • ההסתברות של הרצף א' הוא:
  • (שחור, לבן, שחור, לבן, לבן, שחור)
    • P(שחור, לבן, שחור, לבן, לבן, שחור) =
    • P(שחור)  * P(לבן) * P(לבן) * P(שחור) * P(לבן) * P(שחור) =
    • 0.5 *0.5 *0.5 *0.5 *0.5 *0.5 =
    • 0.015625

  • לצרוף השני יש אותו חישוב הסתברויות ולפיכך ההסתברות של צירוף ב' הוא גם 0.015625
  • לצרוף השלישי  יש אותו חישוב הסתברויות ולפיכך ההסתברות של צירוף ב' הוא גם 0.015625
  • כלומר לכל אחד מהרצפים יש את אותה ההסתברות

בנוגע לפער בין ההטיה הנפוצה לפתרון הנורמטיבי

  • אחת הסיבות שאנחנו לא תופסים את ההסתברויות של שלושת הרצפים כשוות נובעת מכך שאנחנו מתבלבלים
  • בין השיפוט הנדרש: ההסתברות של רצף מסוים
  • לבין שיפוט: הסתברות של קבוצת רצפים בעלת תכונה מסוימת
  • למשל כל אותם רצפים שבהם שלוש מכונות כלשהן עוצרות על לבן
  • נסתכל על התרגיל מזווית שונה
  • לכל מכונה יש שתי תוצאות:
  • הצלחה (לבן)
  • כשלון (שחור)
    • P (לבן)= 0.5
    • P (שחור)= 0.5
  • נניח X מספר הצלחות
  • בעזרת הבינום אפשר  למצוא ש:
    • P(X=0)= 0.01562
    • P(X=1)= 0.09375
    • P(X=2)=  0.234375
    • P(X=3)= 0.3215
    • P(X=4)= 0.234375
    • P(X=5)= 0.09375
    • P(X=6)= 0.01562

  • מכאן
  • שההסתברות למשל שלוש הצלחות גדולה מהצלחה אחת

ד)      הסתברות א: שחור, לבן, שחור, לבן, לבן, שחור

ה)      הסתברות ב' שחור, שחור, שחור, לבן, לבן, לבן

  • הן רק שני רצפים מתוך כל הרצפים (20)  של X=3
  • לכל אחד מהרצפים הללו יש סיכוי של 0.01562 להתקבל
  • לעומת זאת X=1

ו)        כמו  שחור, שחור, שחור, שחור, לבן, שחור

  • היא 0.09375    (כי יש 6 רצפים שבהם אפשר לקבל הצלחה אחת)
  • יש חשיבות להבחין האם מתענינים ברצף מסוים
  • או בקבוצה מסוימת של רצפים (למשל  6רצפים שיש הצלחה אחת)
  • לכל אחד מהרצפים אותה הסתברות  (0.01562)
  • אבל לקבוצות שנות הסתברויות שונות
  • ולעניננו
  • אם במקום לשפוט מה ההסתברויות של כל אחת מהרצפים (שהיא זהה)
  • נסתכל ברצף מסוים כרצף מסוים שמיצג קבוצה אז ניתן לרצפים בטעות הסתברויות שונות
  • למשל נראה בשלוש על לבן ושלוש על שחור הסתברות גבוה יותר
  • מרצף שיש בו לבן אחד
  • הרצף האחרון מייצג כאילו קבוצה קטנה יותר של רצפים
  • מה שעניין אותנו בתרגיל זה כל אחד מהרצפים בנפרד ולא כקבוצה.

המנגנון הקוגנטיבי של כשל המהמרים

  • כשל המהמרים הוא תופעה שנצפתה בקרב מהמרים, והתהליך הקוגניטיבי שהיא כרוכה בו משמש עוד דוגמה לציפייה ליציגות מקומית של מקריות.
  • למשל
  • מהמר ברולטה המורכבת מ- 50% בתים שחורים ו- 50% בתים אדומים.
  • הסיכוי לקבלת שחור בכל סיבוב של הרולטה (בהיעדר רמייה) הוא 0.5
  • ללא תלות בצבע שהתקבל בסיבוב הקודם. הוא הדין לגבי קבלת אדום.

  • המהמר  מחליט "ללמוד" את התנהגות הרולטה וצופה בה כמה פעמים.
  • למרבה הפתעתו הצבע הזוכה 6 פעמים רצופות הוא אדום.
  • המהמר חש שרצף זה לא יכול להימשך, שהרי מדובר בתהליך מקרי והכרח שהמאורעות בו יתחלפו תדירות. לכן הוא חש ביטחון עצמי רב, מעין אמונה פנימית, כי "הפעם זה חייב להיות שחור".
  • הוא מהמר בסכום כסף גדול על הצבע השחור, ולאכזבתו הרבה גם בפעם השביעית זוכה האדום.

  • גם בחיי היומיום אנו נתקלים תכופות בתופעה דומה:
  • היא באה לידי ביטוי בהתעקשותו של אדם לקנות כרטיס פיס בעל מספר קבוע בכל שבוע, מתוך אמונה כי יום אחד יעלה דווקא מספר זה בגורל.
  • המהמר מאמין שככל שיעברו יותר ימים בהם המספר שבחר לא עלה בגורל, גדלה ההסתברות שיעלה בגורל המספר הספציפי בפעם הבאה, אך למעשה בכל הגרלה נוספת ההסתברות למספר ספציפי היא שווה.

חוק המספרים הגדולים

  • בסטטיסטיקה ובהסתברות יש חוק הקרוי חוק "המספרים הגדולים". חוק זה קובע כי ככל שמספר המקרים במדגם מקרי גדול יותר, כך יתקרב ממוצע המדגם לממוצע האוכלוסייה.

  • לעומת זאת, רוב האנשים מאמינים ב"חוק המספרים הקטנים"
  • (חוק שאינו קיים בסטטיסטיקה, אלא הוא מונח תיאורי שטבעו החוקרים),
  • על-פיו אפשר להקיש על פרמטרים באוכלוסיות גם מתוך סטטיסטים המסתמכים על מדגמים קטנים ואף קטנים מאוד
  • ברור כי גם אמונה זו יסודה בתפיסה מוטעית של מושג המקריות ובאמונה במה שכינינו "יציגות מקומית".
  • החוקרים מציינים, כי אמונה מוטעית זו אינה נחלתם של הדיוטות בלבד, אלא גם של אנשי מקצוע, ובהם חוקרים העוסקים במחקר פסיכולוגי.
  • חוקרים אלה מקנים משמעות יתר לממצאים אמפיריים שנמצאו במדגמים קטנים.

בעיה 4 מדף עבודה: בעיית הטלות מטבע

בהטלת מטבע מהו הצירוף שלו ההסתברות הגבוהה ביותר:

  1. עץ-פלי-עץ-פלי-פלי-עץ
  2. עץ-עץ-עץ-פלי-פלי-פלי
  3. עץ-עץ-עץ-עץ-פלי-עץ

תשובה של המורה

  • אנשים בד"כ עונים א' או ב' אבל מבחינה סטטיסטית אין זה משנה.
  • חישוב פשוט יוכיח, כי ההסתברות לקבלת כל אחת מהסדרת זהה, והיא 6^(0.5)
  • שכן כל הטלת מטבע היא אירוע בפני עצמו שאינו תלוי בהטלות אחרות.
  • אם אכן מדובר במטבע הוגנת, אזי בכל הטלה בודדת ההסתברות לקבל כל אחד מהצדדים היא 0.5 וההסתברות של סדרת מאורעות בלתי תלויים היא מכפלת הסתברויותיהם.

  • הטעות מקורה שוב בהיוריסטיקת היציגות.
  • הנבדקים מאמינים שכל חלק משלם צריך לייצג את השלם וככל שהוא דומה לו יותר ההסתברות שלו להתרחש היא גדולה יותר.
  • ולכן נותנים הסתברות גבוהה יותר לרצפים המתנהגים בצורה הדומה לדעתם למקריות.

  • תהליך השיפוט בשאלה זו מתבסס גם על הבנה חלקית של המושג מקריות ותלות בין מאורעות.
  • האמונה ביציגות מביאה אנשים להאמין שאם אכן רצף הוא מקרי כל מקטע קצר צריך לייצג את השלם
  • ולכן אם למ

II)

1.

2.

3.

4.

III)

1.

תייחסות לפירסטון ופיץ (מאמר 1)

הקריטריון הנורמטיבי ערך המכפלה היה נחשב על ידי  פירסון וביץ לקריטריון של דיוק

  • בשאלה שנשאלה על חישוב המכפלה אפשר לחשב את גודל המכפלה במדוייק. כלומר למכפלה 1*2*3*4*5*6*7*8= 40320 -ישנה תשובה אחת מדוייקת וברורה.

  • אפשר להשוות את האומדן של הנבדק  (המכפלה שהוא העריך אותה) לערך האמיתי-  (40320)
  • כלומר הקריטריון (תוצאת המכפלה) במקרה זה הוא הדיוק.  (קרי עד כמה התשובה של הנבדק סטתה  מהאומדן האמיתי).

לסיכום:

  • מכיון שבערך המכפלה מדובר על תשובה מדוייקת של השאלה
  • (ולא מדובר על  מהי שאלות הערכה עם התשובה הכי טובה שאפשר לתת לאור הנתונים – כמו במקרה של קריטריון של אופטימליות- שאלות הערכה שהסטטיסטיקה יכולה לתת)
  • ומכיון שאפשר להשוות את האומדן של הנבדק לערך המכפלה, הרי בערך המכפלה מדובר על קריטריון של דיוק.

2.  הטיות בהערכת מאורעות חיתוך ואיחוד

תרגיל הכדורים

  • כאן מדובר על איחוד וחיתוך אבל ויתרתי ללמוד את זה למבחן

3.  עגינה באומדן התפלגויות של הסתברויות סובייקטיביות

חזרה לשיפוט והערכה בתנאי אי וודאות

מודעות פרסומת

כתיבת תגובה

הזינו את פרטיכם בטופס, או לחצו על אחד מהאייקונים כדי להשתמש בחשבון קיים:

הלוגו של WordPress.com

אתה מגיב באמצעות חשבון WordPress.com שלך. לצאת מהמערכת / לשנות )

תמונת Twitter

אתה מגיב באמצעות חשבון Twitter שלך. לצאת מהמערכת / לשנות )

תמונת Facebook

אתה מגיב באמצעות חשבון Facebook שלך. לצאת מהמערכת / לשנות )

תמונת גוגל פלוס

אתה מגיב באמצעות חשבון Google+ שלך. לצאת מהמערכת / לשנות )

מתחבר ל-%s

קטגוריות

%d בלוגרים אהבו את זה: