Verschil tussen T-TEST en ANOVA Verschil tussen
T-TEST vs. ANOVA
Verzamelen en berekenen van statistische gegevens om het gemiddelde te verkrijgen, is vaak een lang en moeizaam proces. De t-toets en de eenwegs variantieanalyse (ANOVA) zijn de twee meest gebruikelijke tests die voor dit doel worden gebruikt.
De t-toets is een statistische hypothesetest waarbij de teststatistiek een Student's t-verdeling volgt als de nulhypothese wordt ondersteund. Deze test wordt toegepast wanneer de teststatistiek een normale verdeling volgt en de waarde van een schaalterm in de teststatistiek bekend is. Als de schaalterm onbekend is, wordt deze vervangen door een schatting op basis van de beschikbare gegevens. De teststatistiek zal een Student-t-verdeling volgen.
William Sealy Gosset introduceerde de t-statistiek in 1908. Gosset was een chemicus voor de Guinness-brouwerij in Dublin, Ierland. De brouwerij van Guinness had het beleid om de beste afgestudeerden uit Oxford en Cambridge aan te werven, waarbij ze konden kiezen uit diegenen die toepassingen van biochemie en statistiek konden bieden voor de gevestigde industriële processen van het bedrijf. William Sealy Gosset was zo'n afgestudeerd. In het proces bedacht William Sealy Gosset de t-test, die oorspronkelijk was bedoeld als een manier om de kwaliteit van de stout (het donkere bier dat de brouwerij produceert) op een kosteneffectieve manier te monitoren. Gosset publiceerde de test onder het pseudoniem 'Student' in Biometrika, circa 1908. De reden voor de pseudoniem was het aandringen van Guinness, omdat het bedrijf hun beleid over het gebruik van statistieken wilde behouden als onderdeel van hun 'bedrijfsgeheimen'.
T-teststatistieken volgen over het algemeen het formulier T = Z / s, waarbij Z en s functies van de gegevens zijn. De Z-variabele is ontworpen om gevoelig te zijn voor de alternatieve hypothese; effectief is de grootte van de Z-variabele groter wanneer de alternatieve hypothese waar is. In de tussentijd is 's' een schaalparameter waarmee de verdeling van T kan worden bepaald. De aannames die aan een t-toets ten grondslag liggen, zijn dat a) Z een standaard normale verdeling onder de nulhypothese volgt; b) ps2 volgt een Ï ‡ 2 verdeling met p vrijheidsgraden onder de nulhypothese (waarbij p een positieve constante is); en c) de Z-waarde en s-waarde zijn onafhankelijk. In een specifiek type t-test zijn deze aandoeningen gevolgen van de populatie die wordt bestudeerd, evenals de manier waarop de gegevens worden bemonsterd.
Aan de andere kant is de variantieanalyse (ANOVA) een verzameling statistische modellen. Hoewel de principes van ANOVA al lange tijd door onderzoekers en statistici zijn gebruikt, heeft Sir Ronald Fisher pas in 1918 een voorstel gedaan om variantieanalyse te formaliseren in een artikel met de titel 'De correlatie tussen verwanten op de veronderstelling van overerving door Mendelianen'..Sindsdien is ANOVA uitgebreid in zijn toepassingsgebied en toepassing. ANOVA is eigenlijk een verkeerde benaming, omdat deze niet is afgeleid van de verschillen in variantie, maar eerder van de verschillen tussen gemiddelden van groepen. Het omvat de bijbehorende procedures waarbij de waargenomen variantie in een bepaalde variabele wordt onderverdeeld in componenten die kunnen worden toegeschreven aan verschillende bronnen van variatie.
In essentie levert een ANOVA een statistische test op om te bepalen of de gemiddelden van verschillende groepen allemaal gelijk zijn en, als gevolg daarvan, de t-test generaliseert naar meer dan twee groepen. Een ANOVA kan nuttiger zijn dan een t-toets met twee steekproeven, omdat deze een kleinere kans heeft om een type I-fout te begaan. Het hebben van meerdere tweetonige t-testen zou bijvoorbeeld een grotere kans hebben om een fout te begaan dan een ANOVA van dezelfde betrokken variabelen om het gemiddelde te verkrijgen. Het model is hetzelfde en de teststatistiek is de F-verhouding. In eenvoudiger bewoordingen zijn t-tests slechts een speciaal geval van ANOVA: het doen van een ANOVA zal hetzelfde resultaat hebben als meerdere t-testen. Er zijn drie klassen van ANOVA-modellen: a) modellen met vaste effecten waarbij wordt aangenomen dat de gegevens afkomstig zijn van normale populaties, die alleen op hun manier verschillen; b) Willekeurige effectmodellen die veronderstellen dat de gegevens een hiërarchie beschrijven van verschillende populaties waarvan de verschillen worden beperkt door de hiërarchie; en, c) Mixed-effect-modellen, situaties waarin zowel de vaste als de random effecten aanwezig zijn.
Samenvatting:
- De t-toets wordt gebruikt om te bepalen of twee gemiddelden of gemiddelden hetzelfde of verschillend zijn. De ANOVA heeft de voorkeur wanneer drie of meer gemiddelden of gemiddelden worden vergeleken.
- Een t-toets heeft meer kansen om een fout te maken naarmate er meer middelen worden gebruikt. Daarom wordt ANOVA gebruikt bij het vergelijken van twee of meer manieren.