Verskil tussen RDBMS en Hadoop

INHOUDSOPGAWE:

Verskil tussen RDBMS en Hadoop
Verskil tussen RDBMS en Hadoop

Video: Verskil tussen RDBMS en Hadoop

Video: Verskil tussen RDBMS en Hadoop
Video: Hadoop против РСУБД 2024, Julie
Anonim

Die sleutelverskil tussen RDBMS en Hadoop is dat die RDBMS gestruktureerde data stoor terwyl die Hadoop gestruktureerde, semi-gestruktureerde en ongestruktureerde data stoor.

Die RDBMS is 'n databasisbestuurstelsel gebaseer op die relasionele model. Die Hadoop is 'n sagteware vir die stoor van data en om toepassings op groepe van kommoditeit hardeware te laat loop.

Beeld
Beeld

Wat is RDBMS?

RDBMS staan vir Relational Database Management System gebaseer op die relasionele model. In die RDBMS word tabelle gebruik om data te stoor, en sleutels en indekse help om die tabelle te verbind. 'n Tabel is 'n versameling data-elemente, en hulle is die entiteite. Dit bevat rye en kolomme. Die rye verteenwoordig 'n enkele inskrywing in die tabel. Die kolomme verteenwoordig die eienskappe.

Byvoorbeeld, die verkoopsdatabasis kan klant- en produkentiteite hê. Die kliënt kan kenmerke hê soos klant_id, naam, adres, telefoonnommer. Die item kan kenmerke hê soos produk_id, naam ens. Die primêre sleutel van klanttabel is klant_id terwyl die primêre sleutel van produktabel produk_ID is. Die plasing van die product_id in die klanttabel as 'n vreemde sleutel verbind hierdie twee entiteite. Net so hou die tabelle ook verband met mekaar. Dit bied data-integriteit, normalisering en vele meer. Min van die algemene RDBMS is MySQL, MSSQL en Oracle. Hulle gebruik SQL vir navrae.

Wat is Hadoop?

The Hadoop is 'n Apache oopbronraamwerk wat in Java geskryf is. Dit help om 'n groot hoeveelheid data oor groepe rekenaars te stoor en te verwerk deur eenvoudige programmeringsmodelle te gebruik. Die hoofdoel van Hadoop is om Big Data te stoor en te verwerk, wat verwys na 'n groot hoeveelheid komplekse data. Die deurset van Hadoop, wat die kapasiteit is om 'n volume data binne 'n bepaalde tydperk te verwerk, is hoog.

Verskil tussen RDBMS en Hadoop
Verskil tussen RDBMS en Hadoop

Daar is vier modules in Hadoop-argitektuur. Hulle is Hadoop common, YARN, Hadoop Distributed File System (HDFS) en Hadoop MapReduce. Die algemene module bevat die Java-biblioteke en nutsprogramme. Dit het ook die lêers om Hadoop te begin. Hadoop YARN voer die werkskedulering en groeperinghulpbronbestuur uit.

Verder is die Hadoop Distributed File System (HDFS) die Hadoop-bergingstelsel. Dit gebruik die meester-slaaf-argitektuur. Die Meesternodus is die NaamNode, en dit bestuur die lêerstelsel-metadata. Ander rekenaars is slawe nodes of DataNodes. Hulle stoor die werklike data. Aan die ander kant doen Hadoop MapReduce die verspreide berekening. Dit het die algoritmes om die data te verwerk. In die HDFS het die Meesternodus 'n werkspoorder. Dit loop kaart verminder werk op die slawe nodusse. Daar is 'n taakopspoorder vir elke slaafnodus om dataverwerking te voltooi en om die resultaat na die hoofnodus terug te stuur. In die algemeen bied die Hadoop massiewe berging van data met 'n hoë verwerkingskrag.

Wat is die verskil tussen RDBMS en Hadoop?

RDBMS vs Hadoop

RDBMS is 'n stelselsagteware vir die skep en bestuur van databasisse wat gebaseer is op die relasionele model. Hadoop is 'n versameling oopbronsagteware wat baie rekenaars verbind om probleme op te los wat 'n groot hoeveelheid data en berekening behels.
Dataverskeidenheid
RDBMS stoor gestruktureerde data. Hadoop stoor gestruktureerde, semi-gestruktureerde en ongestruktureerde data.
Databerging
RDBMS stoor gemiddelde hoeveelheid data. Hadoop stoor 'n groot hoeveelheid data as RDBMS.
Spoed
In RDBMS is lees vinnig. In Hadoop is lees en skryf vinnig.
Skaalbaarheid
RDBMS het vertikale skaalbaarheid. Hadoop het horisontale skaalbaarheid.
Hardeware
RDBMS gebruik hoë-end bedieners. Hadoop gebruik kommoditeitshardeware.
Deurvloei
RDBMS-deurset is hoër. Hadoop-deurset is laer.

Opsomming – RDBMS vs Hadoop

Hierdie artikel het die verskil tussen RDBMS en Hadoop bespreek. Die sleutelverskil tussen RDBMS en Hadoop is dat die RDBMS gestruktureerde data stoor terwyl die Hadoop gestruktureerde, semi-gestruktureerde en ongestruktureerde data stoor.

Aanbeveel: