Kategoriske data vs numeriske data
Data er de fakta eller oplysninger, der indsamles med henblik på reference eller analyse. Ofte indsamles disse data som en attribut for det pågældende emne. Denne attribut kan variere fra den ene til den anden, derfor kan denne varierende attribut betragtes som en variabel. Variablerne kan antage forskellige former for værdier, og disse er iboende i de indsamlede data.
Variabler kan være enten kvalitative eller kvantitative; dvs. hvis variablen er kvantitativ, er svarene tal, og størrelsen af den målte attribut kan angives med en vis grad af nøjagtighed. Den anden type, de kvalitative variabler måler de kvalitative attributter, og de værdier, der antages af variablerne, kan ikke angives i form af størrelse eller størrelse. Variablerne i sig selv er kendt som kategoriske variabler, og dataene indsamlet ved hjælp af en kategorisk variabel er kategoriske data.
Mere om numeriske data
Numeriske data er grundlæggende de kvantitative data opnået fra en variabel, og værdien har en følelse af størrelse / størrelse. De opnåede numeriske data er yderligere opdelt i yderligere tre kategorier baseret på teorien udviklet af Stanley Smith Stevens. Numeriske data kan være enten ordinær, interval eller forhold. Datatypen bestemmes af målemetoden for værdierne, og typerne er kendt som målingsniveauer.
Vægt af en person, afstanden mellem to punkter, temperatur og prisen på en aktie er eksempler på numeriske data.
I statistikken er størstedelen af metoderne afledt til analyse af numeriske data. Grundlæggende beskrivende statistik og regression og andre inferentielle metoder anvendes hovedsageligt til analyse af numeriske data.
Mere om kategoriske data
Kategoriske data er værdier for en kvalitativ variabel, ofte et tal, et ord eller et symbol. De fremhæver det faktum, at variablen i det betragtede tilfælde hører til et af de mange tilgængelige valg. Derfor hører de til en af kategorierne; deraf navnet kategorisk.
En persons politiske tilknytning, en persons nationalitet, en persons yndlingsfarve og en patients blodgruppe er kvalitative egenskaber. Nogle gange kan et tal opnås som en kategorisk værdi, men selve tallet repræsenterer ikke størrelsen på den målte attribut. Postnummer er et eksempel.
Alle kategoriske værdier hører også til den nominelle datatype, som er en anden type baseret på målingerne. Metoder, der anvendes til analyse af kategoriske data, adskiller sig fra numeriske data, men det underliggende princip kan være det samme.
Hvad er forskellen mellem kategoriske og numeriske data?
• Numeriske data er værdier opnået for den kvantitative variabel og bærer en følelse af størrelsesorden relateret til konteksten af variablen (derfor er de altid tal eller symboler med en numerisk værdi). Kategoriske data er værdier opnået for en kvalitativ variabel; kategoriske datanumre har ikke en følelse af størrelsesorden.
• Numeriske data hører altid til enten ordinal, ratio eller intervaltype, mens kategoriske data hører til nominel type.
• Metoder, der bruges til at analysere kvantitative data, adskiller sig fra metoderne til kategoriske data, selvom principperne er de samme, i det mindste har applikationen signifikante forskelle.
• Numeriske data analyseres ved hjælp af statistiske metoder i beskrivende statistik, regression, tidsserier og mange flere.
• Til kategoriske data anvendes normalt beskrivende metoder og grafiske metoder. Nogle ikke-parametriske tests bruges også.