Mining er prosessen med å trekke Knowledge skjult for store mengder Raw Done

Hvorfor bruke data mining?

To hovedgrunner til å bruke gruvedrift:

For mye og for lite informasjon

Det er behov for å trekke ut nyttig informasjon fra dataene og tolke data

Facing til enorme mengder data, menneskelige analytikere uten spesialverktøy kan ikke lenger være fornuftig. Imidlertid kan gruvedrift automatisere prosessen med å finne sammenhenger og mønstre i rå og resultatene kan enten benyttes i en automatisert beslutningsstøtte system eller vurdert av en menneskelig analytiker. Dette er grunnen til å bruke, spesielt i realfag og forretningsområder som trenger å analysere store mengder data for å oppdage trender som de ellers ikke ville kunne finne.

Hvis vi vet hvordan å avsløre verdifull kunnskap gjemt i rådata, kan data være en av våre mest verdifulle eiendeler. mens data mining er verktøyet for å trekke diamanter av kunnskap fra dine historiske data og forutsi utfallet av framtidige situasjoner.

En brife historie data mining

Begrepet "mining" ble introdusert på 1990-tallet, men er utviklingen av et felt med en lang historie.

røtter spores tilbake langs tre slektslinjer: klassisk statistikk, kunstig intelligens og maskinlæring.

satistics er grunnlaget for de fleste teknologier som data mining er bygget, f.eks regresjonsanalyse, standard distribusjon, standad avvik, standard avvik, diskriminant analyse, klyngeanalyse, og konfidensintervall. Alle disse blir brukt til å studere data og datarelasjoner.

Kunstig intelligens eller AI, som er bygget på heuristikk i motsetning til statistikk, forsøk på å bruke menneske trodde lignende behandling statistiske problemer. Visse AI konsepter som ble vedtatt av noen high-end kommersielle produkter, som for eksempel spørreoptimalisering moduler for mr jatt.com | Gratis nedlasting Punjabi Musikk | 3gp mp4 mp3 sanger | Relational Database Management Systems (RDBMS).

Maskinlæring er foreningen av statistikk og AI. Det kan anses som en evolusjon av AI, fordi det blander AI heuristikk med avansert statistisk analyse. Maskinlæring forsøker å la dataprogrammer lære om data de studerer, slik at programmene gjør ulike beslutninger basert på det beste fra de studerte, ved hjelp av statistikk for grunnleggende begreper, og legge mer avanserte AI heuristikk og algoritmer for å oppnå sine mål.

gruvedrift, på mange måter, er fundamentalt tilpasning av maskinlæringsteknikker for å forretningsapplikasjoner. Data mining er best beskrives som en union av historiske og den siste utviklingen i statistikken, AI, og maskinlæring. Disse teknikkene er så brukt sammen for å studere data og finne tidligere skjulte trender eller mønstre innenfor.

Hva er den nåværende tilstand?

Association Regel:

Foreningen er å finne interessante assosiasjoner mellom attributter som finnes i en database. Denne teknikken er også kjent markeds kurv analyse som. Basert på frekvens tellinger av antall elementer oppstå i tilfelle (dvs. en kombinasjon av elementer), forteller foreningen regelen om elementet X er en del av arrangementet, så hva er prosentandelen av elementet Y er også en del av arrangementet.

Clustering

Clustering er ofte brukt for å finne hensiktsmessige grupperinger av elementer for et sett med data. I motsetning til beslutningstrær vi diskuterer ovenfor, er clustering en slags urettet kunnskap funn eller uten tilsyn læring; det vil si, det er ingen mål felt, og forholdet mellom data er identifisert av bottom-up tilnærming.

beslutningstrær

beslutningstrær utfører klassifisering ved å konstruere et tre basert på opplærings tilfeller med blader som har klasse etiketter. Treet er krysset for hver test eksempel for å finne et blad, og den klasse av bladet er den forutsagte klasse. Dette er en rettet kunnskap funn i den forstand at det er et bestemt felt der verdien vi ønsker å forutsi.

Neural Network

Neural nettverk er ofte representert som en lagdelt sett av sammenkoblede prosessorer. Disse prosessornoder blir ofte omtalt som neurodes for derved å indikere en forbindelse med nevronene i hjernen. Hver node har en vektet tilkobling til flere andre knutepunkter i tilstøtende lag. Individuelle noder ta innspill mottatt fra tilkoblede noder og bruke vekter sammen for å beregne utgangsverdier.



Previous:
Next Page: