Verskil tussen data-ontginning en OLAP

Verskil tussen data-ontginning en OLAP
Verskil tussen data-ontginning en OLAP

Video: Verskil tussen data-ontginning en OLAP

Video: Verskil tussen data-ontginning en OLAP
Video: Verskil tussen Plekwaarde en Getalwaarde 🔢 GRATIS Afrikaanse Opvoedkundige Wiskunde video 2024, November
Anonim

Data-ontginning vs OLAP

Beide data-ontginning en OLAP is twee van die algemene Business Intelligence (BI)-tegnologieë. Besigheidsintelligensie verwys na rekenaargebaseerde metodes om nuttige inligting uit besigheidsdata te identifiseer en te onttrek. Data-ontginning is die veld van rekenaarwetenskap wat handel oor die onttrekking van interessante patrone uit groot stelle data. Dit kombineer baie metodes van kunsmatige intelligensie, statistiek en databasisbestuur. OLAP (aanlyn analitiese verwerking) soos die naam aandui, is 'n samestelling van maniere om navraag te doen oor multidimensionele databasisse.

Data-ontginning staan ook bekend as Knowledge Discovery in data (KDD). Soos hierbo genoem, is dit 'n veld van rekenaarwetenskap, wat handel oor die onttrekking van voorheen onbekende en interessante inligting uit rou data. As gevolg van die eksponensiële groei van data, veral in gebiede soos besigheid, het data-ontginning 'n baie belangrike hulpmiddel geword om hierdie groot rykdom data na besigheidsintelligensie om te skakel, aangesien handmatige onttrekking van patrone in die afgelope paar dekades oënskynlik onmoontlik geword het. Dit word byvoorbeeld tans gebruik vir verskeie toepassings soos sosiale netwerk-analise, bedrogopsporing en bemarking. Data-ontginning handel gewoonlik oor die volgende vier take: groepering, klassifikasie, regressie en assosiasie. Groepering is om soortgelyke groepe uit ongestruktureerde data te identifiseer. Klassifikasie is leerreëls wat op nuwe data toegepas kan word en sal tipies die volgende stappe insluit: voorafverwerking van data, ontwerp van modellering, leer/kenmerkkeuring en evaluering/validering. Regressie is die vind van funksies met minimale foute om data te modelleer. En assosiasie soek na verwantskappe tussen veranderlikes. Data-ontginning word gewoonlik gebruik om vrae te beantwoord soos wat die hoofprodukte is wat kan help om volgende jaar hoë wins in Wal-Mart te behaal.

OLAP is 'n klas stelsels wat antwoorde op multidimensionele navrae verskaf. Tipies word OLAP gebruik vir bemarking, begroting, vooruitskatting en soortgelyke toepassings. Dit spreek vanself dat die databasisse wat vir OLAP gebruik word, opgestel is vir komplekse en ad-hoc-navrae met 'n vinnige werkverrigting in gedagte. Tipies word 'n matriks gebruik om die uitset van 'n OLAP te vertoon. Die rye en kolomme word gevorm deur die afmetings van die navraag. Hulle gebruik dikwels metodes van samevoeging op veelvuldige tabelle om opsommings te verkry. Dit kan byvoorbeeld gebruik word om uit te vind oor die verkope van vanjaar in Wal-Mart in vergelyking met verlede jaar? Wat is die voorspelling oor die verkope in die volgende kwartaal? Wat kan oor die neiging gesê word deur na die persentasieverandering te kyk?

Alhoewel dit duidelik is dat data-ontginning en OLAP soortgelyk is omdat hulle op data werk om intelligensie te verkry, kom die belangrikste verskil van hoe hulle op data werk. OLAP-gereedskap verskaf multidimensionele data-analise en dit verskaf opsommings van die data, maar in teenstelling, data-ontginning fokus op verhoudings, patrone en invloede in die stel data. Dit is 'n OLAP-ooreenkoms met samevoeging, wat neerkom op die werking van data via "byvoeging", maar data-ontginning stem ooreen met "verdeling". Nog 'n noemenswaardige verskil is dat terwyl data-ontginningsnutsmiddels data modelleer en aksiebare reëls terugstuur, OLAP vergelykings- en kontrastegnieke volgens besigheidsdimensie intyds sal uitvoer.

Aanbeveel: