Forskellen Mellem Overvåget Og Ikke-overvåget Maskinindlæring

Indholdsfortegnelse:

Forskellen Mellem Overvåget Og Ikke-overvåget Maskinindlæring
Forskellen Mellem Overvåget Og Ikke-overvåget Maskinindlæring

Video: Forskellen Mellem Overvåget Og Ikke-overvåget Maskinindlæring

Video: Forskellen Mellem Overvåget Og Ikke-overvåget Maskinindlæring
Video: Overvægtige 2024, November
Anonim

Nøgleforskel - Overvåget vs Uovervåget maskinindlæring

Overvåget læring og ikke-overvåget læring er to centrale begreber inden for maskinlæring. Supervised Learning er en Machine Learning-opgave at lære en funktion, der kortlægger et input til et output baseret på eksemplet input-output par. Uovervåget læring er Machine Learning-opgaven at udlede en funktion til at beskrive skjult struktur fra umærket data. Hovedforskellen mellem overvåget og ikke-overvåget maskinindlæring er, at overvåget læring bruger mærkede data, mens ikke-overvåget læring bruger umærkede data.

Machine Learning er et felt inden for datalogi, der giver et computersystem mulighed for at lære af data uden at være eksplicit programmeret. Det gør det muligt at analysere dataene og forudsige mønstre i dem. Der er mange anvendelser af maskinlæring. Nogle af dem er ansigtsgenkendelse, gestegenkendelse og talegenkendelse. Der er forskellige algoritmer relateret til maskinlæring. Nogle af dem er regression, klassificering og klyngedannelse. De mest almindelige programmeringssprog til udvikling af maskinlæringsbaserede applikationer er R og Python. Andre sprog som Java, C ++ og Matlab kan også bruges.

INDHOLD

1. Oversigt og nøgleforskel

2. Hvad er overvåget læring

3. Hvad er ikke-overvåget læring

4. Ligheder mellem overvåget og ikke-overvåget maskinindlæring

5. Sammenligning side om side - Overvåget vs ikke-overvåget maskinindlæring i tabelform

6. Resumé

Hvad er overvåget læring?

I maskinindlæringsbaserede systemer fungerer modellen efter en algoritme. I overvåget læring overvåges modellen. For det første er det nødvendigt at træne modellen. Med den opnåede viden kan den forudsige svar for fremtidige forekomster. Modellen trænes ved hjælp af et mærket datasæt. Når der gives et ud af eksempeldata til systemet, kan det forudsige resultatet. Følgende er et lille uddrag fra det populære IRIS-datasæt.

Forskellen mellem overvåget og ikke-overvåget læring Figur 02
Forskellen mellem overvåget og ikke-overvåget læring Figur 02

I henhold til ovenstående tabel kaldes skållængde, skålbredde, skaftlængde, skivebredde og art attributter. Kolonnerne er kendt som funktioner. En række har data for alle attributter. Derfor kaldes en række en observation. Dataene kan enten være numeriske eller kategoriske. Modellen får observationer med det tilsvarende artsnavn som input. Når der gives en ny observation, skal modellen forudsige, hvilken type art den tilhører.

I overvåget læring er der algoritmer til klassificering og regression. Klassificering er processen med at klassificere de mærkede data. Modellen skabte grænser, der adskilt datakategorierne. Når nye data leveres til modellen, kan den kategorisere ud fra, hvor punktet findes. De K-nærmeste naboer (KNN) er en klassificeringsmodel. Afhængig af k-værdien bestemmes kategorien. For eksempel, når k er 5, hvis et bestemt datapunkt er tæt på otte datapunkter i kategori A og seks datapunkter i kategori B, klassificeres datapunktet som A.

Regression er processen med at forudsige tendensen i de tidligere data for at forudsige resultatet af de nye data. I regression kan output bestå af en eller flere kontinuerlige variabler. Forudsigelse sker ved hjælp af en linje, der dækker de fleste datapunkter. Den enkleste regressionsmodel er en lineær regression. Det er hurtigt og kræver ikke indstillingsparametre som i KNN. Hvis dataene viser en parabolisk tendens, er den lineære regressionsmodel ikke egnet.

Forskellen mellem læring og tilsyn uden opsyn
Forskellen mellem læring og tilsyn uden opsyn

Disse er nogle eksempler på overvågede læringsalgoritmer. Generelt er resultaterne genereret fra overvågede læringsmetoder mere nøjagtige og pålidelige, fordi inputdataene er velkendte og mærket. Derfor skal maskinen kun analysere de skjulte mønstre.

Hvad er tilsyn uden opsyn?

I ikke-overvåget læring overvåges ikke modellen. Modellen fungerer alene for at forudsige resultaterne. Det bruger maskinlæringsalgoritmer til at komme til konklusioner om umærket data. Generelt er de ikke-overvågede læringsalgoritmer sværere end overvågede læringsalgoritmer, fordi der er få oplysninger. Klyngedannelse er en type ikke-overvåget læring. Det kan bruges til at gruppere de ukendte data ved hjælp af algoritmer. K-middelværdien og densitetsbaseret klyngedannelse er to klyngealgoritmer.

k-middelalgoritme, placerer k centroid tilfældigt for hver klynge. Derefter tildeles hvert datapunkt den nærmeste centroid. Euklidisk afstand bruges til at beregne afstanden fra datapunktet til centroid. Datapunkterne er klassificeret i grupper. Positionerne for k centroider beregnes igen. Den nye centroid-position bestemmes af gennemsnittet af alle punkter i gruppen. Igen tildeles hvert datapunkt til den nærmeste centroid. Denne proces gentages, indtil centroiderne ikke længere ændres. k-middel er en hurtig klyngealgoritme, men der er ingen specificeret initialisering af klyngepunkter. Der er også en høj variation af klyngemodeller baseret på initialisering af klyngepunkter.

En anden klyngealgoritme er tæthedsbaseret klyngedannelse. Det er også kendt som Density Based Spatial Clustering Applications med støj. Det fungerer ved at definere en klynge som det maksimale sæt af densitetsforbundne punkter. De er to parametre, der bruges til tæthedsbaseret klyngedannelse. De er Ɛ (epsilon) og minimumspoint. Ɛ er kvarterets maksimale radius. Minimumspunkterne er minimumspunkterne i kvarteret Ɛ for at definere en klynge. Dette er nogle eksempler på klyngedannelse, der falder ind under læring uden opsyn.

Generelt er resultaterne genereret fra ikke-overvågede indlæringsalgoritmer ikke meget nøjagtige og pålidelige, fordi maskinen skal definere og mærke inputdataene, inden de bestemmer de skjulte mønstre og funktioner.

Hvad er ligheden mellem overvåget og ikke-overvåget maskinindlæring?

Både overvåget og ikke-overvåget læring er typer af maskinlæring

Hvad er forskellen mellem overvåget og ikke-overvåget maskinindlæring?

Diff artikel midt foran bordet

Overvåget vs Uovervåget maskinindlæring

Supervised Learning er Machine Learning-opgaven med at lære en funktion, der kortlægger et input til et output baseret på eksempelvis input-output-par. Uovervåget læring er Machine Learning-opgaven med at udlede en funktion til at beskrive skjult struktur fra umærkede data.
Hovedfunktionalitet
I overvåget læring forudsiger modellen resultatet baseret på de mærkede inputdata. I ikke-overvåget læring forudsiger modellen resultatet uden mærket data ved at identificere mønstrene alene.
Nøjagtighed af resultaterne
Resultaterne fra overvågede læringsmetoder er mere nøjagtige og pålidelige. Resultaterne fra ikke-overvågede læringsmetoder er ikke meget nøjagtige og pålidelige.
Hovedalgoritmer
Der er algoritmer til regression og klassificering i overvåget læring. Der er algoritmer til klyngedannelse i ikke-overvåget læring.

Resumé - Overvåget vs Uovervåget maskinindlæring

Overvåget læring og ikke-overvåget læring er to typer maskinindlæring. Supervised Learning er Machine Learning-opgaven med at lære en funktion, der kortlægger et input til et output baseret på eksempelvis input-output-par. Uovervåget læring er Machine Learning-opgaven med at udlede en funktion til at beskrive skjult struktur fra umærkede data. Forskellen mellem overvåget og ikke-overvåget maskinindlæring er, at overvåget læring bruger mærkede data, mens ikke-overvåget hældning bruger umærket data.

Anbefalet: