Forskellen Mellem Data Mining Og OLAP

Forskellen Mellem Data Mining Og OLAP
Forskellen Mellem Data Mining Og OLAP

Video: Forskellen Mellem Data Mining Og OLAP

Video: Forskellen Mellem Data Mining Og OLAP
Video: Многомерные базы данных 2024, November
Anonim

Data Mining vs OLAP

Både data mining og OLAP er to af de almindelige Business Intelligence (BI) teknologier. Business intelligence henviser til computerbaserede metoder til at identificere og udtrække nyttige oplysninger fra forretningsdata. Data mining er området datalogi, der beskæftiger sig med at udvinde interessante mønstre fra store datasæt. Det kombinerer mange metoder fra kunstig intelligens, statistik og databasestyring. OLAP (online analytisk behandling), som navnet antyder, er en samling af måder at forespørge på multidimensionelle databaser.

Data mining er også kendt som Knowledge Discovery in data (KDD). Som nævnt ovenfor er det et felt inden for datalogi, der beskæftiger sig med udvinding af tidligere ukendt og interessant information fra rådata. På grund af den eksponentielle vækst i data, især inden for områder som forretning, er datamining blevet et meget vigtigt redskab til at konvertere denne store rigdom af data til business intelligence, da manuel udvinding af mønstre er blevet tilsyneladende umulig i de sidste par årtier. For eksempel er det i øjeblikket blevet brugt til forskellige applikationer, såsom analyse af sociale netværk, afsløring af svig og markedsføring. Data mining behandler normalt følgende fire opgaver: klyngedannelse, klassificering, regression og tilknytning. Clustering identificerer lignende grupper fra ustrukturerede data. Klassificering er indlæringsregler, der kan anvendes på nye data og vil typisk omfatte følgende trin: forbehandling af data, designe modellering, indlæring / valg af funktion og evaluering / validering. Regression er at finde funktioner med minimal fejl til modeldata. Og forening leder efter forhold mellem variabler. Data mining bruges normalt til at besvare spørgsmål som hvad er de vigtigste produkter, der kan hjælpe med at opnå høj fortjeneste næste år i Wal-Mart. Data mining bruges normalt til at besvare spørgsmål som hvad er de vigtigste produkter, der kan hjælpe med at opnå høj fortjeneste næste år i Wal-Mart. Data mining bruges normalt til at besvare spørgsmål som hvad er de vigtigste produkter, der kan hjælpe med at opnå høj fortjeneste næste år i Wal-Mart.

OLAP er en klasse af systemer, der giver svar på flerdimensionelle forespørgsler. OLAP bruges typisk til marketing, budgettering, prognoser og lignende applikationer. Det siger sig selv, at de databaser, der bruges til OLAP, er konfigureret til komplekse og ad hoc-forespørgsler med en hurtig ydelse i tankerne. Typisk bruges en matrix til at vise output fra en OLAP. Rækkerne og kolonnerne er dannet af dimensionerne på forespørgslen. De bruger ofte metoder til sammenlægning på flere tabeller for at få resuméer. For eksempel kan det bruges til at finde ud af om dette års salg i Wal-Mart sammenlignet med sidste år? Hvad er forudsigelsen for salget i det næste kvartal? Hvad kan man sige om tendensen ved at se på den procentvise ændring?

Selvom det er indlysende, at datamining og OLAP er ens, fordi de opererer på data for at få intelligens, kommer den største forskel fra, hvordan de opererer på data. OLAP-værktøjer giver flerdimensionel dataanalyse, og de giver resuméer af dataene, men i modsætning hertil fokuserer data mining på forhold, mønstre og påvirkninger i datasættet. Det er en OLAP-aftale med aggregering, som koger ned til driften af data via "tilføjelse", men data mining svarer til "division". En anden bemærkelsesværdig forskel er, at mens data mining værktøjer modellerer data og returnerer handlingsmæssige regler, vil OLAP gennemføre sammenligning og kontrastteknikker langs forretningsdimensionen i realtid.

Anbefalet: