Verschil tussen gemiddelde, median en mode: gemiddelde tegen median vs modus

Anonim

gemiddelde vs median vs mode

Gemiddelde, mediaan en modus zijn de belangrijkste maatregelen van centrale neiging die worden gebruikt in beschrijvende statistieken. Ze zijn volledig verschillend van elkaar en gevallen waarin ze gebruikt worden om de gegevens samen te vatten zijn ook verschillend.

Gemiddelde

Het rekenkundige gemiddelde is de som van de data waarden gedeeld door het aantal data waarden, i. e.

Als de gegevens uit een steekproefruimte zijn, wordt het een steekproefgemiddelde (

) genoemd, dat is een beschrijvende statistiek van het monster. Hoewel het de meest gebruikte beschrijvende maatregel voor een monster is, is het niet een robuuste statistiek. Het is zeer gevoelig voor de outliers en oscillaties.

Bijvoorbeeld, beschouw het gemiddelde inkomen van de burgers van een bepaalde stad. Aangezien alle gegevenswaarden worden opgesomd en vervolgens verdeeld, beïnvloedt het inkomen van een zeer rijke persoon het gemiddelde aanzienlijk. Daarom zijn de gemiddelde waarden niet altijd een goede weergave van de gegevens.

Ook bij een wisselend signaal varieert de stroom die door een element doorloopt periodiek van de positieve richting naar de negatieve richting en omgekeerd. Als we de gemiddelde stroom door een element in een enkele periode doorlopen, geeft het een 0, wat betekent dat er geen stroom door het element is doorgegeven, wat natuurlijk niet waar is. Daarom, in dit geval ook, rekenkundige gemiddelde is niet een goede maatregel.

Het rekenkundig gemiddelde is een goede indicator wanneer de data gelijkmatig verdeeld is. Voor een normale verdeling is het gemiddelde gelijk aan de modus en mediaan. Het heeft ook de laagste residuen bij het overwegen van de wortelgemiddelde kwadraatfout; dus de beste beschrijvende maatregel wanneer het nodig is om een ​​dataset te vertegenwoordigen met een enkel getal.

Mediaanwaarde

De waarden van het middelste gegevenspunt na het regelen van alle gegevenswaarden in oplopende volgorde worden gedefinieerd als de mediaan van de dataset. Mediaan is het 2e kwartiel, 5de deciel en 50ste percentiel.

• Als het aantal waarnemingen (datapunten) vreemd is, dan is de mediaan de observatie precies in het midden van de bestelde lijst.

• Als het aantal waarnemingen (datapunten) gelijk is, dan is de mediaan het gemiddelde van de twee middelste waarnemingen in de bestelde lijst.

Mediaan verdeelt de waarneming in twee groepen; ik. e. een groep (50%) van de waarden hoger en een groep (50%) van de waarden lager dan de mediaan. Medianen worden specifiek gebruikt in skeefde verdelingen en vertegenwoordigen gegevens redelijk beter dan de rekenkundige gemiddelde.

Mode

De modus is het meest voorkomende getal in een reeks waarnemingen.De modus van een dataset wordt berekend door de frequentie van elk element binnen de set te vinden.

• Als er geen waarde meer dan een keer optreedt, dan heeft de dataset geen modus.

• Anders is elke waarde die het meest voorkomt een modus van de dataset.

Er kan meer dan 1 modus bestaan ​​in een set; daarom is de modus niet een unieke statistiek van een dataset. In een uniforme verdeling is er één modus. De modus van een discrete kansverdeling is het punt waar de kansmassiefunctie het hoogste punt bereikt. Uitgaande van bovenstaande interpretaties kunnen we zeggen dat globale maxima modi zijn.

Overweeg de toepassing van alle drie de maatregelen in de volgende dataset.

DATA: {1, 1, 2, 3, 5, 5, 5, 6, 6, 8, 8, 9, 9, 9, 9, 9, 10, 10, 10, 14, 14, 15, 15, 15}

Gemiddelde = (1+ 1+ 2+ 3+ 5+ 5+ 5+ 5+ 6+ 6+ 8+ 8+ 9+ 9+ 9+ 9+ 10+ 10+ 10+ 14+ 14+ 15+ 15+ 15) / 25 = 8. 12

Mediaan = 9 (13de element)

Mode = 9 (frequentie van 9 = 5)

Wat is het verschil tussen gemiddelde, mediane en modus?

• Aritmetische gemiddelde is de som van de waarden (waarnemingen) gedeeld door het aantal waarnemingen. Het is niet een robuuste statistiek, en sterk afhankelijk van de normale distributie natuur binnen de beschouwde distributie. Een enkele outlier kan een significante verschuiving in het gemiddelde veroorzaken, wat relatief misleidende waarden geeft. Het concept kan uitgebreid worden naar geometrische gemiddelde, harmonische gemiddelde, gewogen gemiddelde en ga zo maar door.

• Mediaan is de middelwaarden van de reeks waarnemingen en is relatief minder beïnvloed door uitwijkers. Het kan een goede schatting geven als de samenvatting statistiek in zeer scheve gevallen.

• Modus is de meest voorkomende waarnemingswaarden in de dataset. Als de verdeling positief is geschroefd, ligt de modus links naar de mediaan en, als het negatief is gesneden, ligt de modus recht naar de mediaan.

• Als het positief is gescheurd, is het middel gemiddeld voor de mediaan; als negatief gesplitst betekent is links van de mediaan.

• In de normale verdeling zijn alle drie, gemiddelde, modus en mediaan gelijk.