1 / 92

מבוא לסטטיסטיקה א'

מבוא לסטטיסטיקה א'. מגל לס magalless@gmail.com 054-5793060. אז למה לי סטטיסטיקה עכשיו?. כל מחקר שמבוסס על נתונים אמפיריים דורש ידע בסטטיסטיקה , על מנת שנוכל לארגן את הנתונים, לנתח ולהסיק מהם מסקנות . בסמסטר א', אנו מתמקדים בסטטיסטיקה תיאורית. סטטיסטיקה תיאורית.

Télécharger la présentation

מבוא לסטטיסטיקה א'

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. מבוא לסטטיסטיקה א' מגל לס magalless@gmail.com 054-5793060

  2. אז למה לי סטטיסטיקה עכשיו? • כל מחקר שמבוסס על נתונים אמפיריים דורש ידע בסטטיסטיקה, על מנת שנוכל לארגן את הנתונים, לנתח ולהסיק מהם מסקנות. • בסמסטר א', אנו מתמקדים בסטטיסטיקה תיאורית.

  3. סטטיסטיקה תיאורית • סטטיסטיקה תיאורית עוסקת בשיטות לארגון, ותמצות הנתונים • שנאספו במחקר הסטטיסטי. • הנושאים בהם נתמקד: 1. מיון משתנים לפי מהות. 2. מיון משתנים לפי רמת המדידה. 3. הצגת נתונים ע"י טבלת שכיחויות וגרפים.

  4. מיון משתנים על פי מהות

  5. מיון משתנים על פי מהות • משתנה איכותי- ערכי המשתנה נבחנים לפי סוג איכותי ללא ביטוי במספרים. משמע- מילים! לדוגמא: מין, מצב משפחתי. • משתנה כמותי- ערכי המשתנה מציינים כמות. הקטגוריות הן מספרים. לדוגמא: גיל, שכר, ותק, מספר ילדים.

  6. מיון משתנים על פי מהות • כמותי בדיד- ערכי משתנים בדידים. בין כל שני ערכים של המשתנה, קיים מספרסופי של ערכים ובין שני ערכים קבועים מתקיימת קפיצה. למשל: מס' ילדים, מספר איחורים, מס' חדרים. אין חצי ילד, אין חצי איחור אמנם יש כיום חצי חדר אבל גם קפיצה זו היא מדידה.

  7. הבדל בין כמותי בדיד לבין רציף • כמותי בדיד • כמותי רציף

  8. מיון משתנים לפי רמת מדידה • משתנה נומינאלי (שמי)- ערכי המשתנה נבחנים לפי שמות/סוגים, כאשר אין משמעות לסדר שבין הערכים. (לדוג': מין, מצב משפחתי, מס' טלפון) ניתן רק להבחין בין שני המשתנים. מי שזכר הוא לא נקבה. a=b • משתנה אורדינאלי (סדר)- יש חשיבות לסדר, ניתן לסדר את הערכים מהנמוך לגבוה. (דרגות בצבא). משתנה זה יכול להופיע גם כאיכותי וגם ככמותי: כמותי: טוראי- 1, רב"ט-2, סמל-3 a>b, a=b איכותי: כלל לא מרוצה, מרוצה, מרוצה מאוד.

  9. מיון משתנים לפי רמת המדידה • משתנה אנטרוואלי (רווח) - ערכי המשתנה במספרים, יש משמעות למרווחים שבין הערכים, ניתן לחשב את ההפרשים ביניהם. לא קיים אפס מוחלט! אפס מוחלט לא מעיד על העדר התופעה! (בד"כ מדובר על משתנים שהומצאו ע"י בני האדם -כמו: טמפ', ציון פסיכומטרי). • משתנה יחס (מנה)- ערכי המשתנה במספרים, קיים ערך אפס מוחלט, ניתן לחלק ערך אחד בשני ולציין מה היחס ביניהם. (כמו - משקל, גובה וגיל). • משתנה נומינאלי הוא ברמת המדידה הנמוכה ביותר. • משתנה יחס הוא בעל רמת המדידה הגבוהה ביותר וכולל את כל התכונות של קודמיו!

  10. שאלה 1 • רשמו לגבי כל אחד מהמשתנים את סוגו: א. איכותי, כמותי-בדיד, כמותי- רציף. ב. נומינאלי, אורדינלי, אינטרוולי, יחס. • משקל המרצים בחוג לסטטיסטיקה. • צבע החולצות של הבנים בכתה. • מספרי הטלפון של המרצים במכללה. • ארץ מוצאם של פועלים במפעל. • הזמן שלוקח לכל אחד מהסטודנטים לפתור תרגיל זה. • גובהו של מועמד לקורס קצונה. • קווי האוטובוסים הנוסעים ברחוב הרצל.

  11. שאלה 2 (ממבחן) • בסקר שנערך ע"י "מכון לשאלות לא חשובות" התבקשו הנשאלים לענות על שמונה שאלות. להלן אחת השאלות מתוך סקר זה: המשכורת הממוצעת בישראל הינה 5000 ₪ לחודש. המשכרות שלך הינה (בשקלים חדשים): • 1) 1 - 2499 . • 2) 2500 - 4999 . • 3) 5000- 7500 . • 4) מעל 7000 . • ברור שהמשתנה הנבחן (לגביו המכון שואל את השאלה) הינו משתנה איכותי – יחס. נכון / לא נכון.

  12. הצגת נתונים בטבלת שכיחויות • חישוב שכיחות יחסית: חישוב ערך X חלקי הסה"כ. F(X) N • חישוב שכיחות יחסית מצטברת באחוזים: הנ"ל כפול 100. F(X) *100 N • חישוב שכיחות יחסית מצטברת באחוזים %: מדובר על שכיחות יחסית הכוללת שהתקבלה, הקטנה או שווה לערך הנתון. • מחברים את התוצאות עד לאותו ערך כולל.

  13. הצגה גרפית • דרך נוחה וברורה להבלטת התופעה הנחקרת. • בסטטיסטיקה תיאורית קיימות שלוש הצגות גראפיות בהתאם לסוג המשתנה: • דיאגרמת מעגל: מתאימה למשתנה איכותי נומינאלי. כיצד בונים דיאגרמת מעגל? א. מחשבים שכיחות יחסית לכל משתנה. ב. משרטטים מעגל ומחלקים את השטח שלו לגזרות. ג. יש להקפיד ששטחה של כל גזרה תהיה פרופורציונאלית לשכיחות המקרים.

  14. הצגה גרפית 2. דיאגרמת מקלות: מתאימה לתיאור משתנה כמותי בדיד ומשתנה איכותי אורדניאלי. כיצד בונים דיאגרמת מקלות? א. בונים מערכת צירים של X ו-Y. ב. על ציר ה-X נציג את הערכים של המשתנה הנחקר (X) ועל ציר ה-Y נציג את השכיחות (F). ג. מעל כל ערך של משתנה X נציב מקל באורך פרופורציונאלי לשכיחות המקרים.

  15. הצגה גרפית 3. היסטוגרמה (דיאגראמת מלבנים):הצגה גרפית זו מתאימה למשתנה כמותי רציף, אינטרוואלי או יחס. כיצד בונים דיאגראמת מלבנים? א. מצרפים לטבלה את העמודות: רוחב הקבוצה (1) וצפיפות (d). ב. מחשבים. חישוב צפיפות: ג. בונים מערכת צירים של X וY. ד. על ציר ה- X נציג את הערכים של המשתנה הנחקר ) X ( ע"י קטעים לפי רוחב הקבוצה. ועל ציר ה Y נציג את הצפיפות. ה. קנה המידה לשרטוט המלבן נקבע לפי רוחב הקבוצה וגובהו יהיה עד לצפיפות הקבוצה.

  16. מצולע שכיחויות • מצולע השכיחויות מתאר את המהלך הכללי של התפלגות המשתנה הנחקר. לאחר שציירנו את ההיסטוגרמה אנו מסמנים נקודה באמצע של כל בסיס ומחברים באמצעות קווים ישרים.

  17. סוגי התפלגויות • יכולות לצאת שלוש סוגי התפלגויות: 1.התפלגות סימטרית חד שיאית: *קיים ריכוז של המקרים על ערכים בינוניים של המשתנה. *הצפיפות פוחתת בשני הכיוונים בצורה סימטרית ככל שמתקרבים לקצוות. התפלגות סימטרית

  18. סוגי התפלגויות 2. התפלגות א-סיטמטרית חיובית: • קיים ריכוז של המקרים על ערכים נמוכים של המשתנה. • זנב ההתפלגות לכיוון הערכים הגבוהים. התפלגות א-סימטרית חיובית זנב ימינה.

  19. סוגי התפלגויות • התפלגות א-סימטרית שלילית (זנב שמאל): • קיים ריכוז של המקרים על ערכים גבוהים של המשתנה. • זנב ההתפלגות לכיוון הערכים הנמוכים. התפלגות א- סימטרית שלילית, זנב שמאלי

  20. ערכים מרכזיים • ערך מרכזי הוא ערך יחיד המסכם ומבליט תכונות מיוחדות של ההתפלגות. • ערכים מרכזיים מתייחיסים למיקום התופעה. • אנו נדון בשלושה ערכים מרכזיים מקובלים: • שכיח • חציון • ממוצע

  21. שכיח • שכיחMO- הוא ערך של משתנה הנחקר בעל התדירות הגבוהה ביותר. ערך המשתנה הנפוץ ביותר! • את השכיח ניתן לחשב למשתנה מרמת המדידה הנמוכה ביותר- ממשתנה נומניאלי ולכן ניתן גם לחשב אותו לכל משתנה ברמת מדידה גבוהה יותר. • משתנה זה קל לחישוב ומשמעותו ברורה. (יתרון). • לא תמיד קיים שכיח ולעיתים יש יותר משכיח אחד. • שכיח אינו מושפע מערכים קיצוניים

  22. חישוב השכיח • שימו ! חשוב להבחין מה סוג המשתנה שלפנינו- לכל משתנה יש שיטת חישוב שונה! 1. סדרת ערכים בודדים: • השכיח הוא המספר המופיע הכי הרבה פעמים: 29,17,12,15,12,13,12

  23. חישוב השכיח 2. משתנה בדיד או רציף עם קבוצות בעלות אותו רוחב: • יש להסתכל על עמודת השכיחות. • השכיח (X) הוא בעל השכיחות הגבוהה ביותר.

  24. חישוב השכיח 3. למשתנה רציף בקבוצות בעלות רוחב קבוצה שונה: • בונים עמודה של רוחב קבוצה (*** לשים לב לסגירת הקבוצה!!! ) • מחשבים צפיפות (d): • הקבוצה השכיחה היא בעלת הצפיפות הגבוהה ביותר.

  25. חציון Me • החציון הוא ערך של המשתנה הנחקר שמחצית המקרים קטנים ממנו או שווים לו, מחצית המקרים גדולים ממנו או שווים לו. • החציון הוא ערך אמצעי בהתפלגות. • את החציון ניתן לחשב למשתנה ברמה אורדינאלית, אינטרוולית ויחס. • כדי לחשב חציון חייבים לסדר את הערכים מהנמוך לגבוה. • החציון מושפע מסדר הערכים ולא מהערכים עצמם, פרט לערך האמצעי שקובע את החציון. כל עוד מתקיים, שהערכים הקטנים מהחציון, אף אם הם ישתנו, ישארו קטנים ממנו, ואילו הערכים שגדולים מהחציון, אף אם הם ישתנו, יהיו גדולים ממנו- החציון לא ישתנה. • החציון לא מושפע מערכים קיצוניים.

  26. חישוב חציון • חישוב חציון בסדרת ערכים בודדים כאשר מס' ערכים אי זוגי: 1. יש לסדר תחילה את הערכים מהערך הנמוך ביותר לערך הגבוה. 2. כאשר מס' הערכים הוא אי זוגי החציון ימוקם ב: מס הערכים (1+(n 2 דוגמא א': להלן נתונים על גובה של 9 גברים:

  27. חישוב החציון • חישוב חציון בסדרת ערכים בודדים כאשר מס' ערכים זוגי: 1. יש לסדר תחילה את הערכים מהערך הנמוך ביותר לערך הגבוה. 2. כאשר מס' הערכים הוא זוגי החציון ימוקם בין: מס' הערכים לבין: מס' הערכים+2 2 2 דוגמא ב': להלן נתונים על גובה 9 גברים:

  28. חישוב חציון • חישוב חציון למשתנה בדיד: • יש לבנות לוח שכיחות מצטברת באחוזים. • הערך החציוני הוא זה שעד אליו מתפלגים 50% מהמקרים.

  29. חישוב החציון • חישוב חציון למשתנה רציף: 1.יש לבנות לוח שכיחות יחסית מצטברת ב%. 2. הקבוצה החציונית היא זו שעד איליה מתפלגים 50% מהמקרים. 3. לאותה קבוצה נמצא את רוחב הקבוצה. 4. יש להציב את הערכים בנוסחא:

  30. ממוצע Mean • הממוצע הינו הסכום של כל ערכי המשתנה חלקי מספר הנחקרים. • ניתן לחשב ממוצע מרמה אינטרוולית ומעלה. • הממוצע מתאר רמה כללית של התופעה והוא לא בהכרח ערך קיים בסדרה הסטטיסטית. • הממוצע מושפע מערכים קיצוניים (חיסרון) • סכום ההפרשים של ערכי הסדרה הסטטיסטית, ממוצעם תמיד יהיה שווה ל-0. זאת מאחר, שסך ההפרשים החיוביים מתקזזים עם השליליים.

  31. תכונות הממוצע

  32. חישוב הממוצע • חישוב ממוצע בסדרת ערכים בודדים: סוכמים את כל הערכים חלקי מס' הערכים. • חישוב ממוצע למשתנה בדיד: • חישוב ממוצע למשתנה רציף: יש לחשב אמצע קטע לכל קבוצה והם נהפכים להיות . משתמשים באותה נוסחא כמו של משתנה בדיד. חישוב אמצע קטע: גבול עליון+גבול תחתון 2 יש לשים לב לרווח הקבוצה.

  33. שאלות ממבחנים • בטבלה מתוארים מס' כוסות הקפה שמרצים במכללה שותים במהלך החודש:

  34. שאלות ממבחנים א. החציון של מס' כוסות הקפה הוא? ב. מס' כוסות הקפה הממוצע הוא? ג. קבוצת השכיח היא? ד. לאחר בדיקה חוזרת של הנתונים, התברר כי חלה טעות ברישום והקבוצה האחרונה צריכה להיות 81-120 במקום 81-100. אין שינויים בנתונים אחרים. יש להסביר בלי לחשב כיצד ישפיע השינוי על המדדים הבאים: • חציון: יגדל/יקטן/לא ישתנה • ממוצע: יגדל/יקטן/לא ישתנה • שכיח: יגדל/יקטן/לא ישתנה

  35. שאלות ממבחנים 61 סטודנטים נבחנו בקורס מבוא לכלכלה והתקבלו התוצאות הבאות: ממוצע 70 , חציון 74 . לקבוצה זו נוספו עוד 3 סטודנטים אשר ציוניהם: 65 , 70 , 73 . לכל 64 הציונים: א. הממוצע יגדל נכון / לא נכון ב. החציון יגדל נכון/ לא נכון

  36. שאלות ממבחנים • במדגם של 100 יילודים נמצא כי התפלגות הילודים לפי משקל היא סימטרית. המשקל החציוני הוא 3200 גרם. נוספו למדגם עוד שני ילודים: במשקל 3900 גרם ובמשקל 300 גרם. • עבור כל 102 הילודים- המשקל הממוצע יגדל והמשקל החציוני לא ישתנה. נכון / לא נכון

  37. שאלה נוספת

  38. הקשר בין סדר הערכים המרכזיים לצורת ההתפלגות • כל הערכים נמצאים על אותה נקודה במרכז ההתפלגות. • כלומר, ריכוז המקרים הוא באמצע ההתפלגות ושאר הערכים מפוזרים באופן שווה בקצוות ההתפלגות.

  39. הקשר בין סדר הערכים המרכזיים לצורת ההתפלגות • קיים ריכוז של מקרים בערכים הנמוכים של המשתנה וזנב ההתפלגות מתמשך לצד ימין לכיוון הערכים הגבוהים.

  40. הקשר בין סדר הערכים המרכזיים לצורת ההתפלגות • קיים ריכוז של מקרים בערכים הגבוהים של המשתנה וזנב ההתפלגות מתמשך לצד שמאל לכיוון הערכים הגבוהים.

  41. שאלות ממבחנים במפעל מסוים ידוע כי התפלגות העובדים לפי שנות הוותק שלהם היא אסימטרית חיובית, לכן ברור כי אחוז העובדים בעלי הוותק הנמוך מהוותק השכיח במפעל הינו גדול יותר מאחוז העובדים בעלי הוותק הגבוה מהוותק השכיח במפעל. נכון/לא נכון.

  42. שאלה

  43. מדדי פיזור • תיאור סדרה סטטיסטית ע"י ערכים מרכזיים הוא לא תיאור שלם. • על מנת ללמוד יותר על התפלגות ערכי המשתנה יש לתאר גם את הפיזור שלהם ע"י מדדי הפיזור. • מדדי הפיזור בהם נתון: • תחום/טווח. • תחום בין רביעוני. • שונות. • סטיית תקן.

  44. התחום R • התחום הינו ההפרש בין התצפית הגדולה ביותר בסדרה הסטטיסטית לבין התצפית הקטנה ביותר. • התחום מתאים למשתנה אינטרוואלי ויחס.

  45. חישוב במשתנים • סדרת ערכים בודדים: 9,8,7,6,5 • כאשר R=0 זה מעיד על כך שאין פיזור ולא קיימים הבדלים בין הערכים: 7,7,7,7,7 משתנה בדיד:משתנה רציף:

  46. דוגמא: כיתה של 40 סטודנטים נבחנו בסטטיסטיקה. סטודנט אחד קיבל 0, סטודנט אחר קיבל 100. כל ה-38 האחרים קיבלו 80. מהו התחום? (R)?

  47. תכונות התחום R • התחום קל לחישוב ובעל משמעות ברורה. • התחום מושפע מערכים קיצוניים. • התחום מתבסס רק על קצוות ההתפלגות ולא מבטא את הערכים בפיזור של הסדר הסטטיסטית. • החיסרון שלו בולט כאשר מתקיימים מקרים קיצוניים מאחר והם קובעים את אמת הפיזור. (התמונה הכללית עלולה להיות מושפעת מכך).

  48. התחום הבין רביעוני IQR • התחום הבין רביעוני הוא ההפרש בין הרביעון העליון (השלישי) לבין הרביעון התחתון (הראשון). • התחום הבין רביעוני מתאים למשתנה אורדינאלי ולכן גם יחס ואינטרוולי. • על התחום הבין רביעוני מרוכזים מחתית המקרים שבמרכז ההתפלגות והוא לא מושפע מהמקרים שבקצוות ההתפלגות. • הוא מושפע מסדר הערכים ונקבע רק לפי הערכים הנמצאים במקומות הסדורים N/4, 3N/4

  49. מהם הם הרבעונים?

  50. חישוב רביעונים למשתנה בדיד: • יש לבנות לוח שכיחות יחסית מצטברת באחוזים. Q1- הוא הערך שעד אליו- כולל, מתפלגים 25% מהמקרים. Q3- הוא הערך שעד אליו- כולל, מתפלגים 75% מהמקרים. • מציאת התחום הבין רביעוני

More Related