Regressie vs Korrelasie
In statistiek is dit belangrik om die verband tussen twee ewekansige veranderlikes te bepaal. Dit gee die vermoë om voorspellings te maak oor een veranderlike relatief tot ander. Regressie-analise en korrelasie word toegepas in weervoorspellings, finansiële markgedrag, vestiging van fisiese verhoudings deur eksperimente, en in baie meer werklike wêreld scenario's.
Wat is regressie?
Regressie is 'n statistiese metode wat gebruik word om die verband tussen twee veranderlikes te teken. Dikwels wanneer data ingesamel word, kan daar veranderlikes wees wat van ander afhanklik is. Die presiese verband tussen daardie veranderlikes kan slegs deur die regressiemetodes vasgestel word. Die bepaling van hierdie verwantskap help om die gedrag van een veranderlike teenoor die ander te verstaan en te voorspel.
Die mees algemene toepassing van die regressie-analise is om die waarde van die afhanklike veranderlike vir 'n gegewe waarde of reeks waardes van die onafhanklike veranderlikes te skat. Byvoorbeeld, met behulp van regressie kan ons die verband tussen die kommoditeitsprys en die verbruik vasstel, gebaseer op die data wat van 'n ewekansige steekproef ingesamel is. Regressie-analise produseer die regressiefunksie van 'n datastel, wat 'n wiskundige model is wat die beste pas by die beskikbare data. Dit kan maklik voorgestel word deur 'n spreidingsdiagram. Grafies is regressie gelykstaande aan die vind van die beste gepaste kurwe vir die gegewe datastel. Die funksie van die kromme is die regressiefunksie. Deur die wiskundige model te gebruik, kan die vraag na 'n kommoditeit vir 'n gegewe prys voorspel word.
Daarom word die regressie-analise wyd gebruik in voorspelling en voorspelling. Dit word ook gebruik om verwantskappe in eksperimentele data te vestig, in die velde van fisika, chemie, en baie natuurwetenskappe en ingenieursdissiplines. As die verwantskap of die regressiefunksie 'n lineêre funksie is, staan die proses bekend as 'n lineêre regressie. In die spreidingsdiagram kan dit as 'n reguit lyn voorgestel word. As die funksie nie 'n lineêre kombinasie van die parameters is nie, dan is die regressie nie-lineêr.
Wat is korrelasie?
Korrelasie is 'n maatstaf van sterkte van die verwantskap tussen twee veranderlikes. Die korrelasiekoëffisiënt kwantifiseer die mate van verandering in een veranderlike gebaseer op die verandering in die ander veranderlike. In statistiek word korrelasie verbind met die konsep van afhanklikheid, wat die statistiese verband tussen twee veranderlikes is.
Die Pearsons se korrelasiekoëffisiënt of net die korrelasiekoëffisiënt r is 'n waarde tussen -1 en 1 (-1≤r≤+1). Dit is die korrelasiekoëffisiënt wat die meeste gebruik word en slegs geldig vir 'n lineêre verwantskap tussen die veranderlikes. As r=0, bestaan geen verwantskap nie, en as r≥0, is die verband direk eweredig; dit wil sê die waarde van een veranderlike neem toe met die toename van die ander. Indien r≤0, is die verwantskap omgekeerd eweredig; d.w.s. een veranderlike neem af soos die ander toeneem.
As gevolg van die lineariteitsvoorwaarde, kan korrelasiekoëffisiënt r ook gebruik word om die teenwoordigheid van 'n lineêre verwantskap tussen die veranderlikes vas te stel.
Wat is die verskil tussen regressie en korrelasie?
Regressie gee die vorm van die verwantskap tussen twee ewekansige veranderlikes, en die korrelasie gee die sterkte van die verwantskap.
Regressie-analise produseer 'n regressiefunksie, wat help om resultate te ekstrapoleer en te voorspel, terwyl korrelasie dalk net inligting verskaf oor watter rigting dit kan verander.
Die meer akkurate lineêre regressiemodelle word deur die analise gegee, as die korrelasiekoëffisiënt hoër is. (|r|≥0.8)