Lineêre vs logistiese regressie
In statistiese analise is dit belangrik om die verbande tussen veranderlikes wat betrokke is by die studie te identifiseer. Soms is dit dalk die enigste doel van die analise self. Een sterk hulpmiddel wat aangewend word om die bestaan van 'n verhouding vas te stel en die verband te identifiseer, is regressie-analise.
Die eenvoudigste vorm van regressie-analise is die lineêre regressie, waar die verband tussen die veranderlikes 'n lineêre verwantskap is. In statistiese terme bring dit die verband tussen die verklarende veranderlike en die responsveranderlike na vore. Byvoorbeeld, met behulp van regressie kan ons die verband tussen die kommoditeitsprys en die verbruik vasstel gebaseer op data wat van 'n ewekansige steekproef ingesamel is. Regressie-analise sal 'n regressiefunksie van die datastel produseer, wat 'n wiskundige model is wat die beste pas by die beskikbare data. Dit kan maklik voorgestel word deur 'n spreidingsdiagram. Grafies is regressie gelykstaande aan die vind van die beste passingskromme vir die gegewe datastel. Die funksie van die kromme is die regressiefunksie. Deur die wiskundige model te gebruik, kan die gebruik van 'n kommoditeit vir 'n gegewe prys voorspel word.
Daarom word die regressie-analise wyd gebruik in voorspelling en voorspelling. Dit word ook gebruik om die verwantskappe in eksperimentele data, in die velde van fisika, chemie, en in baie natuurwetenskappe en ingenieursdissiplines vas te stel. As die verwantskap of die regressiefunksie 'n lineêre funksie is, staan die proses bekend as 'n lineêre regressie. In die spreidingsdiagram kan dit as 'n reguit lyn voorgestel word. As die funksie nie 'n lineêre kombinasie van die parameters is nie, dan is die regressie nie-lineêr.
Logistiese regressie is vergelykbaar met meerveranderlike regressie, en dit skep 'n model om die impak van veelvuldige voorspellers op 'n responsveranderlike te verduidelik. In logistiese regressie moet die eindresultaatveranderlike egter kategories wees (gewoonlik verdeel; d.w.s. 'n paar haalbare uitkomste, soos dood of oorlewing, alhoewel spesiale tegnieke dit moontlik maak om meer gekategoriseerde inligting te modelleer). 'n Kontinue uitkoms veranderlike kan omskep word in 'n kategoriese veranderlike, om vir logistieke regressie gebruik te word; die ineenstorting van kontinue veranderlikes op hierdie manier word egter meestal ontmoedig omdat dit die akkuraatheid verminder.
Anders as in die lineêre regressie, na die gemiddelde, hoef die voorspellerveranderlikes in logistieke regressie nie gedwing te word om lineêr verbind te wees, algemeen verspreid, of om gelyke variansie binne elke groep te hê nie. As gevolg hiervan is die verband tussen die voorspeller en uitkomsveranderlikes waarskynlik nie 'n lineêre funksie nie.
Wat is die verskil tussen logistiese en lineêre regressie?
• In lineêre regressie word 'n lineêre verband tussen die verklarende veranderlike en die responsveranderlike veronderstel en parameters wat die model bevredig word deur analise gevind om die presiese verwantskap te gee.
• Lineêre regressie word uitgevoer vir kwantitatiewe veranderlikes, en die resulterende funksie is 'n kwantitatiewe.
• In die logistiese regressie kan data wat gebruik word óf kategories óf kwantitatief wees, maar die resultaat is altyd kategories.