סיכום קורס מבוא לסטטיסטיקה

מוסד לימוד
סוג העבודה
מקצוע
מילות מפתח , , , , ,
שנת הגשה 2009
מספר מילים 9358
מספר מקורות 10

תקציר העבודה

שיעור מס' 1
מושגי יסוד בסטטיסטיקה סטטיסטיקה תיאורית – DESCRIPTIVE STATISTICS מדע של קביעת ערכים המשקפים באופן יעיל ומתומצת את הנטיות הקיימות באוסף גדול של תצפיות ומדידות, כדי לסייע לנו להבין מצב נתון. (למשל: לקבץ נתונים, לחשב ממוצע וסטיית תקן במדגם עבור התצפיות שמדדנו).
סטטיסטיקה הסקית – INFERENTIAL STATISTICS (שיטת הניבוי) מדע שמטרתו לאפשר הסקת מסקנות ופרוש תצפיות ונתונים שיש בידנו. לרוב משתמשים בהסקה ובפרוש כאלה כאשר מסיקים מידע ממדגם לגבי אוכלוסייה אוכלוסייה – כל קבוצת האנשים (הנחקרים/הפרטים; חיות או דומם) בעלי תכונה מוגדרת.
מדגם – תת קבוצה של האוכלוסייה. גודל המדגם נקבע על ידי החוקר.
תצפית – נתון אחד במחקר. אוסף תצפיות יוביל למידע.
סטטיסטיקה הסקית מבוססת על סטטיסטיקה תיאורית.
קבוע – ערך שאינו משתנה בהקשרים שונים (למשל הערך  פיי  שתמיד 3.14).
משתנה – מהות שיכולה לקבל ערכים שונים (רדיוס של מעגל, אינטליגנציה, זמן תגובה..).
משתנה בדיד – משתנה המקבל מספר ערכים סופי, ולכן בין כל שני ערכים יש מספר סופי של נקודות. (לדוגמא: ציונים) משתנה רציף – משתנה שיכול לקבל אינסוף ערכים, ולכן בין כל שני ערכי יש אינסוף נקודות. (לדוגמא: כסף, זמן, משקל, גובה, שטח מעגל [הרדיוס R]..) מערכי מחקר נבחר במערך המחקר המתאים בהתאם לשאלת המחקר ובהתאם לאפשרויות הטכניות.
קיימים 2 סוגים עיקריים של מערכי מחקר: ניסוי ומתאמי.
מערך מחקר ניסויי – מתפעלים משתנה אחד לפחות ומשווים ביצועי נבדקים בתנאים השונים (ראה/לא ראה סרטון, חוסן/לא חוסן…) החוקר יכול להסיק לא רק על קשר בין משתנים, אל גם על סיבתיות.
המשתנה הבלתי-תלוי מתופעל והמשתנה התלוי נמדד. בודקים את השפעת המשתנה הבלתי-תלוי על התלוי. המב"ת הוא המשפיע והמסביר, המ"ת הוא המושפע.
מערך מחקר מתאמי – כל המשתנים נמדדים וניתן להסיק מסקנות בדבר קשר סטטיסטי בלבד בין מספר משתנים.
לדוגמא:
בודקים במדגם IQ של ילדים ו- IQ של הוריהם.
מה מידת הקשר בין משתנים אלה? האם הקשר קיים גם באוכלוסייה?
נבחר במערך מתאמי אם לא ניתן לערוך מניפולציה על משתנה רלוונטי (מין) או כאשר ניתן לעשות מניפולציה אבל זה לא אתי (מעשנים/לא מעשנים, ילדים מוכים/לא מוכים).
תרגיל זהו את האוכלוסייה והמדגם בתיאורים הבאים:
1.      ל-20 תלמידי פסיכולוגיה הועבר מבחן זיכרון בתחילת שנה"ל ובסופה כדי לבדוק האם לימודי הפסיכולוגיה משפרים את זיכרון התלמידים.
תלמידי פסיכולוגיה – אוכלוסייה. 20 תלמידים – הוא המדגם.
2.      לתלמידי גן נחמה הועבר מבחן "צייר איש" כדי להסיק על מידת התפתחותם.
האוכלוסייה – גן נחמה. מדגם – אין.
תרגיל מהרשימה הבאה זהו את המשתנים והקבועים. אם מדובר במשתנה ציינו האם הוא בדיד או רציף.
·        הערך פיי (3.14). קבוע.
·        אורך רדיוס במעגל. משתנה רציף.
·        הציונים בקורס סטטיסטיקה. משתנה בדיד.
·        ממוצע הציונים בקורס סטטיסטיקה. משתנה רציף.
·        הספרה 7. קבוע.
·        גובה. משתנה רציף.
·        מדידת הגובה כאשר מעגלים את המדידה ליחידת ס"מ. משתנה בדיד.
·        מספר תלמידים בכיתה. משתנה בדיד.
סולמות מדידה סולם שמי, נומינלי NAME – נותן תווית שמאפשרת סיווג וזיהוי. אין לערך המספרי משמעות אחרת.
התכונה היא הזהות.
שמא שווים או לא שווים.
טרנספורמציה: כל טרנספורמציה שהיא, כך שהקטגוריות של המשתנה ימשיכו להיות שונות ונבחנות.
לדוגמא:
הנתון
2 + 5- X0
1
3
4 – 0
2
4
3 – 0
3 5
2 – 0 ­­­­­­­_________________________ סולם סדר, אורדינלי (ORDER) הקטגוריות הנבחנות באופן מספרי גם מבטאות את הסדר הקיים בין הערכים, ללא חשיבות לגודל המרווח.
תכונות: זהות+ ייצוג גודל – מה גדול ממה, אך לא בכמה >=< משתנה: קבוצה גיל אפשרות לשם אחד אפשרות אחרת אסור להכפיל במינוס (לדוגמא: כפול 2- בעמודה הראשונה) תינוקות ילדים מתבגרים מבוגרים זקנים 1 2 3 4 5 6 8 0 90 1 000 5000 2 - 4 - 6 - 8 - 1 0- אין משמעות ליחידת המדידה השם שאני בוחר חייב להגדיר סדר מסוים והמספר המייצג הוא גדול מהמספר שקדם לו. ואם החוקר רוצה להוסיף קבוצת גיל נוספת, אזי יצטרך להוסיף מספר מייצג בין 2 מספרים: למשל: אם החוקר רוצה להוסיף קבוצה בין 3 ל-4. ניתן יהיה לקרוא לקבוצה זו 3.5 או 3. 5 . אסור בסולם זה להכפיל ב-0 או במינוס ולא להעלות בריבוע. טרנספורמציה: כל מה שישמור על הסדר והזהות, הרצף יישמר, הסידור בין הקטגוריות נשמר. סולם רווח, אינטרוולי ENTERVALE שומר על זהות + סדר + משמעת לרווחים (הפרשים) בין המספרים. יחידת המדידה שווה בכל מקום בסולם. לדוגמא: משתנה: טמפרטורה בסולם צלזיוס דוגמא א' דוגמא ב' מעלות צלזיוס מעלות צלזיוס צפת 2 0 X 2 0 חיפה 2 5 Y 4 0 בדוגמא א' ניתן להתרשם, כי בחיפה הטמפרטורה היא גבוה מזו שבצפת ב-5 מעלות. בדוגמא ב', ניתן לומר ש Y יותר גדול מ X אך לא כפול ממנו, משום שלא התחלנו למדוד מ-0 מוחלט. ברגע שמודדים מ-0 מוחלט ניתן לומר אם כפול או לא. מותרת טרנספורמציה לינארית כאשר B חיובי: B>0,  A+ Y=BX.
מותר לכפול במספר חיובי ולהוסיף או להחסיר מספר נוסף.
דוגמא למספר 20-A= Y=1X-20 Y X
1 0-
1 0 0
2 0
1 0
3 0 לדוגמא:
F=9/5C+32
F C
3 2
0 50
1 0
8 6
3 0
2 12
1 00 סולם מנה, יחס (RATIO) התכונות הנשמרות הן:
זהות+סדר+הפרש+יחס, משום שקיימת נקודת אפס מוחלט, שמצביעה על העדר מוחלט של הערך הנמדד. (כמו: גיל, מהירות, משקל, גובה) הטרנספורמציה המותרת:
הכפלה בקבוע חיובי בלבד 0. סדר, רווח ומנה/יחס.
·        חישוב היחס בין שני ערכים.  מנה/יחס.
·        הכפלת כל ערך בקבוע חיובי. מנה/יחס, רווח, סדר ושמי.
·        הכפלת כל ערך בקבוע חיובי והוספת קבוע. רווח, סדר ושמי.
שיעור מס' 3
מבוא
לסטטיסטיקה התפלגות שכיחויות התפלגות שכיחויות – FREQUENCY DISTRIBUTION הגדרה:
ייצוג הקשר על ידי חוק או באופן מתמטי בין קבוצה של קטגוריות ממצות ומוציאות (כל תצפית נופלת לקטגוריה אחת ואחת בלבד) לבין השכיחות של כל קטגוריה.
שכיחות – FREQUENCY מסומנת כ- F או F(x) שכיחות יחסית – מספר התצפיות מתוך סך הכל באחוזים.
שכיחות יחסית F מין 0.58=70/120 70 M 0.42=50/120 50 F
1 .00
2 0=N הערה:
המשתנה שנבחר בדוגמא לעיל הוא על סולם שמי והוא משתנה בדיד (כי אין רצף).
התפלגות שכיחות מקובצת – כשיש למשתנה תחום רחב של ערכים ו/או הרבה תצפיות, מקבצים את הערכים למחלקות (אינטרוולים INTERVALE) שיכילו מספר ערכים אפשריים.
יחידת מדידה – הפרש בין גבול עליון מדומה שלמחלקה אחת והגבול התחתון של המחלקה מעליה.
גבולות אמיתיים וגבולות מדומים.
לדוגמא: גבהים של 70 מועמדים לקבוצת כדורסל (סולם יחס/מנה) שכיחות יחסית מצטברת F(X)/N שכיחות יחסית F(X)/N שכיחות מצטברת F(x) שכיחות F(x) מחלקות (גבולות מדומים) גבולות אמיתיים נקודת אמצע –