Spredning vs skevhed
I statistik og sandsynlighedsteori skal variationen i distributionerne ofte udtrykkes kvantitativt med henblik på sammenligning. Dispersion og skevhed er to statistiske begreber, hvor fordelingen af fordelingen præsenteres i en kvantitativ skala.
Mere om spredning
I statistikker er spredningen variationen af en tilfældig variabel eller dens sandsynlighedsfordeling. Det er et mål for, hvor langt datapunkterne ligger fra den centrale værdi. For at udtrykke dette kvantitativt anvendes målinger af spredning i beskrivende statistik.
Varians, standardafvigelse og interkvartilområde er de mest anvendte målinger af spredning.
Hvis dataværdierne har en bestemt enhed på grund af skalaen, kan målingerne af spredning også have de samme enheder. Interdecile rækkevidde, område, gennemsnitlig forskel, median absolut afvigelse, gennemsnitlig absolut afvigelse og afstand standardafvigelse er målinger af spredning med enheder.
I modsætning hertil er der målinger af spredning, der ikke har nogen enheder, dvs. dimensionsløs. Varians, variationskoefficient, kvartil dispersionskoefficient og relativ gennemsnitlig forskel er dispersionsmål uden enheder.
Spredning i et system kan stamme fra fejl, såsom instrumentelle og observationsfejl. Også tilfældige variationer i selve prøven kan forårsage variationer. Det er vigtigt at have en kvantitativ idé om variationen i data, før man træffer andre konklusioner fra datasættet.
Mere om skævhed
I statistik er skævhed et mål for asymmetri af sandsynlighedsfordelingerne. Skævhed kan være positiv eller negativ eller i nogle tilfælde ikke-eksisterende. Det kan også betragtes som et mål for modregning i normalfordelingen.
Hvis skævheden er positiv, er hovedparten af datapunkterne centreret til venstre for kurven, og den højre hale er længere. Hvis skævheden er negativ, er hovedparten af datapunkterne centreret mod højre for kurven, og venstre hale er ret lang. Hvis skævheden er nul, er befolkningen normalt fordelt.
I en normalfordeling, det er når kurven er symmetrisk, har middelværdien, medianen og tilstanden den samme værdi. Hvis skævheden ikke er nul, holder denne egenskab ikke, og gennemsnit, tilstand og median kan have forskellige værdier.
Pearsons første og anden koefficienter for skævhed bruges almindeligvis til at bestemme skævheden af distributionerne.
Pearsons første skævhedskaffe = (middel - tilstand) / (standardafvigelse)
Pearson's anden skævhedskaffe = 3 (middel - tilstand) / (satndard afvigelse)
I mere følsomme tilfælde anvendes justeret Fisher-Pearson standardiseret momentkoefficient.
G = {n / (n-1) (n-2)} ∑ n i = 1 ((y-ӯ) / s) 3
Hvad er forskellen mellem spredning og skævhed?
Dispersionsproblemer med hensyn til det område, hvor datapunkterne distribueres, og skævheden vedrører symmetrien i fordelingen.
Begge målinger af spredning og skævhed er beskrivende målinger, og skævhedskoefficienten giver en indikation på fordelingen.
Målinger af spredning bruges til at forstå datapunkternes rækkevidde og forskudt fra middelværdien, mens skævhed bruges til at forstå tendensen til variationen af datapunkter i en bestemt retning.