Verschil tussen populatie en steekproef standaardafwijking
Bevolking versus Sample Standard Deviation
In statistieken worden meerdere indexen gebruikt om een dataset te beschrijven die overeenkomt met zijn centrale neiging, dispersie en scheefheid. Standaardafwijking is een van de meest voorkomende maatregelen van verspreiding van gegevens uit het midden van de dataset.
Door praktische moeilijkheden is het niet mogelijk om gegevens van de gehele bevolking te gebruiken wanneer een hypothese wordt getest. Daarom gebruiken wij gegevenswaarden van monsters om afleidingen te maken over de bevolking. In een dergelijke situatie worden dit schattingen genoemd, omdat ze de populatieparameterwaarden schatten.
Het is uiterst belangrijk om onbevooroordeelde schattingen in inferentie te gebruiken. Een schatting is onbevooroordeeld als de verwachte waarde van die schatting gelijk is aan de populatieparameter. Bijvoorbeeld, we gebruiken het monster gemiddelde als een onbevooroordeelde schatter voor de populatie gemiddelde. (Mathematisch kan worden aangetoond dat de verwachte waarde van het monster gemiddelde gelijk is aan het populatie gemiddelde). Bij het schatten van de populatie standaardafwijking is de steekproef standaardafwijking ook een onbevooroordeelde schatter.
Wat is de standaardafwijking van de bevolking?
Wanneer gegevens uit de gehele bevolking in rekening kunnen worden gebracht (bijvoorbeeld bij een volkstelling) is het mogelijk om de populatie standaardafwijking te berekenen. Om de standaardafwijking van de populatie te berekenen, worden eerst de afwijkingen van de gegevenswaarden van het populatiegemiddelde berekend. Het wortelgemiddelde vierkant (kwadratische gemiddelde) van afwijkingen heet de standaardafwijking van de populatie.
In een klas van 10 studenten kunnen gegevens over de studenten gemakkelijk worden verzameld. Als er een hypothese wordt getest op deze populatie van studenten, dan is het niet nodig om steekproefwaarden te gebruiken. Bijvoorbeeld worden de gewichten van de 10 studenten (in kilogram) gemeten op 70, 62, 65, 72, 80, 70, 63, 72, 77 en 79. Dan is het gemiddelde gewicht van de tien personen (in kilogram) (70 + 62 + 65 + 72 + 80 + 70 + 63 + 72 + 77 + 79) / 10, dat is 71 (in kilogram). Dit is de populatiegemiddelde.
Nu berekenen we de populatie standaardafwijking, berekenen we afwijkingen van het gemiddelde. De respectievelijke afwijkingen van de gemiddelde zijn (70-71) = -1, (62-71) = -9, (65-71) = -6, (72-71) = 1, (80-71) = 9, (70-71) = -1, (63-71) = -8, (72-71) = 1, (77-71) = 6 en (79-71) = 8. De som van vierkanten van afwijking is -1) 2 2 + (-6) 2 + 1 2 + 9 2 < + (-1) 2 + (-8) 2 + 1 2 + 6 2 + 8 2 = 366. De populatie standaardafwijking is √ (366/10) = 6,05 (in kilogram). 71 is het exacte gemiddelde gewicht van de leerlingen van de klas en 6.05 is de exacte standaardafwijking van het gewicht van 71. Wat is steekproef standaardafwijking? Wanneer gegevens uit een steekproef (van grootte n) worden gebruikt om de parameters van de populatie te schatten, wordt de steekproef standaardafwijking berekend. Eerst worden de afwijkingen van de gegevenswaarden van het monstergemiddelde berekend. Aangezien de steekproef gemiddeld wordt gebruikt in plaats van de populatiegemiddelde (die onbekend is), is het kwadratische gemiddelde niet geschikt. Om het gebruik van steekproef te compenseren, wordt de som van vierkanten van afwijkingen gedeeld door (n-1) in plaats van n. De steekproef standaardafwijking is het vierkantswortel van deze. In wiskundige symbolen, S = √ (Σ (x
i
-ẍ) 2 / (n-1)}, waar S de steekproef standaardafwijking is, is het monster gemeen en x i zijn de data punten. Neem nu aan dat in het vorige voorbeeld de bevolking de studenten van de hele school is. Dan is de les slechts een voorbeeld. Als dit monster in de schatting wordt gebruikt, zal de steekproef standaardafwijking √ (366/9) = 6 38 (in kilogram) zijn, aangezien 366 door 9 in plaats van 10 (de steekproefgrootte) is gedeeld. Het feit dat men moet observeren is dat dit niet gegarandeerd is de exacte standaard deviatiewaarde van de populatie te zijn. Het is maar een schatting daarvoor. Wat is het verschil tussen populatie standaardafwijking en steekproef standaardafwijking?
• Bevolking standaardafwijking is de exacte parameterwaarde die gebruikt wordt om de dispersie van het centrum te meten, terwijl de standaardafwijking van de sample een onbevooroordeelde schatter is.