Verschil tussen regressie en correlatie: regressie vs correlatie vergeleken

Anonim

Regressie vs correlatie

In statistieken, bepalen de relatie tussen twee willekeurige variabelen is belangrijk. Het geeft de mogelijkheid om voorspellingen te maken over een variabele ten opzichte van anderen. Regressie analyse en correlatie worden toegepast in weersvoorspellingen, financieel marktgedrag, vestiging van fysieke relaties door experimenten en in veel meer echte wereldscenario's.

Wat is regressie?

Regressie is een statistische methode die gebruikt wordt om de relatie tussen twee variabelen te tekenen. Vaak worden er gegevens verzameld, variabelen die afhankelijk zijn van anderen. De exacte relatie tussen die variabelen kan alleen door de regressiemethoden worden vastgesteld. Het bepalen van deze relatie helpt het gedrag van een variabele te begrijpen en voor te stellen aan de andere.

De meest voorkomende toepassing van de regressieanalyse is om de waarde van de afhankelijke variabele voor een bepaalde waarde of waardebereik van de onafhankelijke variabelen te schatten. Bijvoorbeeld, met behulp van regressie kunnen we de relatie tussen de grondstofprijs en het verbruik vaststellen op basis van de gegevens die zijn verzameld uit een willekeurige steekproef. Regressie-analyse produceert de regressiefunctie van een dataset, dat is een wiskundig model dat het beste past bij de beschikbare gegevens. Dit kan gemakkelijk worden vertegenwoordigd door een scatterplot. Grafisch is regressie gelijk aan het vinden van de beste pasvorm voor de gegevensset. De functie van de curve is de regressiefunctie. Met behulp van het wiskundige model kan de vraag van een commoditeit voor een bepaalde prijs worden voorspeld.

Daarom wordt de regressieanalyse veel gebruikt bij het voorspellen en prognosen. Het wordt ook gebruikt om relaties op te stellen in experimentele data, op het gebied van natuurkunde, chemie en veel natuurwetenschappen en engineering disciplines. Als de relatie of de regressiefunctie een lineaire functie is, dan is het proces bekend als een lineaire regressie. In het spreidingsdiagram kan het als een rechte lijn worden weergegeven. Als de functie geen lineaire combinatie van de parameters is, dan is de regressie niet-lineair.

Wat is correlatie?

Correlatie is een maatstaf van sterkte van de relatie tussen twee variabelen. De correlatiecoëfficiënt kwantificeert de mate van verandering in een variabele op basis van de verandering in de andere variabele. In statistieken is correlatie verbonden met het begrip afhankelijkheid, dat is de statistische relatie tussen twee variabelen.

De correlatiecoëfficiënt van de Pearsons of gewoon de correlatiecoëfficiënt r is een waarde tussen -1 en 1 (-1≤r≤ + 1). Het is de meest gebruikte correlatiecoëfficiënt en geldt alleen voor een lineaire relatie tussen de variabelen. Als r = 0 bestaat er geen relatie, en als r≥0 is de relatie direct proportioneel; ik. e. de waarde van een variabele neemt toe met de toename van de andere. Als r≤0, is de relatie omgekeerd evenredig; ik. e. één variabele neemt af als de andere stijgt.

Door de lineariteitsconditie kan correlatiecoëfficiënt r ook gebruikt worden om de aanwezigheid van een lineaire relatie tussen de variabelen te bepalen.

Wat is het verschil tussen regressie en correlatie?

Regressie geeft de vorm van de relatie tussen twee willekeurige variabelen, en de correlatie geeft de mate van sterkte van de relatie.

Regressieanalyse produceert een regressiefunctie, die bijdraagt ​​tot het extrapoleren en voorspellen van resultaten, terwijl correlatie alleen informatie kan verschaffen over welke richting het kan veranderen.

De nauwkeuriger lineaire regressiemodellen worden gegeven door de analyse, als de correlatiecoëfficiënt hoger is. (| r | ≥0.8)