Atšķirība starp Hadoop Big Data, Cassandra, MongoDB?

Atšķirība starp Hadoop Big Data, Cassandra, MongoDB?

Hadoop iegūst lielu daļu lielo datu kredītpunktu skaita, taču patiesība ir tāda, ka NoSQL datu avoti tiek ieviesti daudz vispārīgāk - un daudz vispārīgāk. Faktiski, kaut arī pirkšana Hadoop avotam ir samērā sarežģīta, NoSQL datu avota izvēle ir nekas cits kā. Galu galā ir vairāk nekā 100 NoSQL datu avotu, kā atklāj DB-Engines datu bāzes reputācijas pozīcija.

Sabojāts par izvēli

Tā kā izvēlēties, jums ir jābūt tikpat satriecošam, kā varētu būt, lai dzīvotu apmierinātā tā saucamā poliglota noteikšanas utopijā, “kur jebkuram pienācīga lieluma uzņēmumam būs vairākas atšķirīgas informācijas glabāšanas telpas tehnoloģiskās inovācijas dažāda veida informācijai”, kā saka Martins Fowlers apgalvo, ka patiesībā jūs nevarat izdoties tērēt, apgūstot vairāk nekā dažus.

Par laimi, izvēle kļūst arvien vienkāršāka, jo nozare apvienojas ar trim ievērojamām NoSQL datu bāzēm: MongoDB (atbalsta mans bijušais darba devējs), Cassandra (kuru galvenokārt izstrādājis DataStax, lai arī tas ir dzimis Facebook) un HBase (cieši sakārtots ar Hadoop un izstrādājis tas pats kopiena).

Tā ir LinkedIn informācija. Pilnīgāka perspektīva ir DB-Engines ”, kas apkopo uzdevumus, meklēšanu un citu informāciju, lai izprastu datu bāzes reputāciju. Kamēr Oracle, SQL Server un MySQL ir pārāki par noteikumiem, MongoDB (Nr. 5), Cassandra (Nr. 9) un HBase (Nr. 15) nodrošina viņiem naudas izmaksu.

Lai gan ir pāragri zvanīt uz jebkuru citu NoSQL datu bāzi par noapaļošanas kļūdu, mēs ātri to sasniedzam, tieši tā, kā tas notika relāciju datu bāzes nozarē.

Globuss, kas izveidots ar nestrukturētiem datiem

Mēs arvien vairāk uzturamies pasaulē, kur informācija nav pilnīgi piemērota RDBMS tīrajām sērijām un saturam. Šūnu, publiskā un argumentācijas apstrāde ir radījusi lielu informācijas pārpildi. Saskaņā ar vairākiem ziņojumiem 90% pasaules informācijas tika izstrādāta pēdējos divos gados, Gartner piesaistot 80% visas biznesa informācijas kā nestrukturētu. Turklāt nestrukturēta informācija turpina pieaugt divreiz ātrāk nekā organizētā informācija.

Mainoties visai pasaulei, informācijas kontroles specifikācijas pārsniedz tradicionālo relāciju datu avotu efektīvo iespēju. Pirmie uzņēmumi, kas pamanīja nepieciešamību pēc alternatīvām alternatīvām, bija tīmekļa vadītāji, valdības departamenti un firmas, kas ir informācijas pakalpojumu eksperti.

Tagad arvien vairāk visu nozaru uzņēmumi vēlas izmantot tādu alternatīvu priekšrocības kā NoSQL un Hadoop: NoSQL, lai izstrādātu funkcionālas programmas, kas ģenerē viņu biznesu, izmantojot iesaistes paņēmienus, un Hadoop, lai izstrādātu programmas, kas viņu informāciju vērtē retrospektīvi un palīdz sniegt ļoti efektīvas idejas. .

MongoDB: no dizaineriem, izstrādātājiem

Starp NoSQL izvēlēm, kuras ņem vērā MongoDB Stirman, MongoDB ir mērķtiecīgi izvēlējusies veselīgu stratēģiju, kas paredzēta plašam programmu klāstam. Kaut arī veiktspēja ir tuvu parastajam relāciju datu avotam, MongoDB ļauj klientiem izmantot argumentācijas iespēju priekšrocības ar tās horizontālo mērogojamību un viegli strādāt ar dažādo informāciju, kuru mūsdienās sāk izmantot, pateicoties tās daudzveidīgajai informācijas konstrukcijai.

Cassandra: droši darboties mērogā

Ir vismaz divu veidu datu avotu vienkāršība: izaugsmes ērtības un funkcionālās ērtības. Lai gan MongoDB pienācīgi iegūst kredītreitingu par vienkāršu pieredzi, kas pieejams, Cassandra ģenerē pilnus apzīmējumus, lai to būtu vienkārši darbināt diapazonā.

Kā sacīja DataStax McFadin, klienti parasti pārceļas uz Cassandra, jo vairāk izliek galvu pret to, ka nav iespējams padarīt relāciju datu bāzi ātrāku un efektīvāku, it īpaši diapazonā. Bijušais Oracle DBA, Makfadins ar gandarījumu atklāja, ka “replikācija un kāpšana taisnā līnijā ir primitīvas lietas” ar Kasandru, un iespējas bija “galvenais dizaina mērķis jau pašā sākumā”.

HBase: Bosom draudzējas ar Hadoop

HBase, tāpat kā Cassandra uz kolonnu orientētu galveno vērtību veikals, tiek daudz izmantots galvenokārt tāpēc, ka tai ir kopīga reputācija ar Hadoop. Kā teica Cloudera's Kestelyn, “HBase nodrošina uz ierakstiem balstītas krātuves vietas daļu, kas ļauj ātri, unikāli plūst un rada informāciju, pieskaņojot Hadoop, koncentrējot lielu caurlaidspēju zemas latentuma I / O problēmās.”

Tātad CRB Tech sniedz jums labākos karjeras padomus, kas jums sniegti Oracle. Vairāk studentu pārskatu: CRB Tech DBA atsauksmes