Mean vs Mediaan vs Mode
Gemiddeld, mediaan en modus is die primêre maatstawwe van sentrale neiging wat in beskrywende statistiek gebruik word. Hulle verskil heeltemal van mekaar en gevalle waarin hulle gebruik word om die data op te som, verskil ook.
Mean
Die rekenkundige gemiddelde is die som van die datawaardes gedeel deur die aantal datawaardes, dit wil sê
[latex]\bar{x}=\frac{1}{n}\sum_{i=1}^{n}x_{i}=\frac{x_{1}+x_{2} +x_{3}+…+x_{n}}{n}[/latex]
As die data uit 'n steekproefruimte kom, word dit 'n steekproefgemiddeld ([latex]\bar{x} [/latex]) genoem, wat 'n beskrywende statistiek van die steekproef is. Alhoewel dit die mees gebruikte beskrywende maatstaf vir 'n steekproef is, is dit nie 'n robuuste statistiek nie. Dit is baie sensitief vir die uitskieters en ossillasies.
Beskou byvoorbeeld die gemiddelde inkomste van die inwoners van 'n spesifieke stad. Aangesien al die datawaardes opgetel en dan verdeel word, beïnvloed die inkomste van 'n uiters ryk persoon die gemiddelde aansienlik. Daarom is die gemiddelde waardes nie altyd 'n goeie voorstelling van die data nie.
Ook, in die geval van 'n wisselende sein, wissel die stroom wat deur 'n element gaan periodiek van die positiewe rigting na negatiewe rigting en omgekeerd. As ons die gemiddelde stroom neem wat in 'n enkele periode deur die element gaan, sal dit 'n 0 gee, wat beteken dat geen stroom deur die element gegaan het nie, wat natuurlik nie waar is nie. Daarom is rekenkundige gemiddelde ook in hierdie geval nie 'n goeie maatstaf nie.
Die rekenkundige gemiddelde is 'n goeie aanwyser wanneer die data eweredig versprei is. Vir 'n normaalverdeling is die gemiddelde gelyk aan die modus en mediaan. Dit het ook die laagste residue wanneer die wortelgemiddeldekwadraatfout in ag geneem word; dus die beste beskrywende maatstaf wanneer dit vereis word om 'n datastel deur 'n enkele getal voor te stel.
Median
Die waardes van die middelste datapunt nadat al die datawaardes in stygende volgorde gerangskik is, word gedefinieer as die mediaan van die datastel. Mediaan is die 2de kwartiel, 5de desiel en 50ste persentiel.
• As die aantal waarnemings (datapunte) onewe is, dan is die mediaan die waarneming presies in die middel van die geordende lys.
• As die aantal waarnemings (datapunte) ewe is, dan is die mediaan die gemiddelde van die twee middelste waarnemings in die geordende lys.
Median verdeel die waarneming in twee groepe; dit wil sê 'n groep (50%) waardes hoër en 'n groep (50%) waardes laer as die mediaan. Mediane word spesifiek in skewe verdelings gebruik en verteenwoordig data redelik beter as die rekenkundige gemiddelde.
Modus
Modus is die getal wat die meeste in 'n stel waarnemings voorkom. Modus van 'n datastel word bereken deur die frekwensie van elke element binne die stel te vind.
• Indien geen waarde meer as een keer voorkom nie, het die datastel geen modus nie.
• Andersins is enige waarde wat met die grootste frekwensie voorkom, 'n modus van die datastel.
Meer as 1 modus kan in 'n stel bestaan; daarom is modus nie 'n unieke statistiek van 'n datastel nie. In 'n eenvormige verspreiding is daar een modus. Die modus van 'n diskrete waarskynlikheidsverdeling is die punt waar die waarskynlikheidsmassafunksie sy hoogste punt bereik. Met die weergawe van bogenoemde interpretasies kan ons sê dat globale maksima modusse is.
Oorweeg die toepassing van al drie maatstawwe op die volgende datastel.
DATA: {1, 1, 2, 3, 5, 5, 5, 5, 6, 6, 8, 8, 9, 9, 9, 9, 9, 10, 10, 10, 14, 14, 15, 15, 15}
Gemiddeld=(1+ 1+ 2+ 3+ 5+ 5+ 5+ 5+ 6+ 6+ 8+ 8+ 9+ 9+ 9+ 9+ 10+ 10+ 10+ 14+ 14+ 15+ 15+ 15) / 25=8,12
Median=9 (13de element)
Modus=9 (frekwensie van 9=5)
Wat is die verskil tussen gemiddelde, mediaan en modus?
• Rekenkundige gemiddelde is die som van die waardes (waarnemings) gedeel deur die aantal waarnemings. Dit is nie 'n robuuste statistiek nie, en sterk afhanklik van die normale verspreiding aard binne die verspreiding wat oorweeg word. 'n Enkele uitskieter kan 'n beduidende verskuiwing in die gemiddelde veroorsaak wat relatief misleidende waardes gee. Die konsep kan uitgebrei word na meetkundige gemiddelde, harmoniese gemiddelde, geweegde gemiddelde en so meer.
• Mediaan is die middelwaardes van die stel waarnemings, en dit word relatief minder deur uitskieters beïnvloed. Dit kan 'n goeie skatting gee as die opsommende statistiek in hoogs skewe gevalle.
• Modus is die mees algemene waarnemingswaardes in die datastel. As die verspreiding positief skeef is, lê die modus links na die mediaan en, indien negatief skeef, lê die modus regs na die mediaan.
• Indien positief skeef, is gemiddelde reg tot die mediaan; as negatief skeef gemiddeld links van die mediaan is.
• In die normaalverdeling is al drie, gemiddeld, modus en mediaan gelyk.