Mi az Data Mart? - Az adatok Mart típusai, jellemzői és lépései

Tartalomjegyzék:

Anonim

Bevezetés az Data Mart-ba

A világ egyre inkább digitalizálódik, és mindegyik szervezet több adathalmazt generál. A Data Mart az adattárház adatainak ilyen osztályozása, ahol az összefonódás egy alanyra vonatkozik.

Azt mondhatjuk, hogy egy adott osztályra vagy kategóriára vonatkozó adatok, például értékesítés, pénzügy vagy marketing stb. Alapvetően az adattárolás részhalmaza. Mivel a meghatározott témákra vagy osztályokra koncentrálunk, azt mondhatjuk, hogy ezek forrása korlátozott, vagy nagyon kevés forrástól függ.

Data Mart vs Data Warehouse

Az adattárház olyan raktár, amelyben a tárgy több adatfolyamáról gyűjtik az adatokat. A karbantartási és ellenőrzési részeket, mint például a nyers adatok gyűjtését és feldolgozását, főként a vállalati informatikai informatikai csoportok végzik, amelyek különféle szolgáltatásokat nyújtanak az anyavállalatok számára.

Az adatraktárt központi vagy vállalati adattárháznak is nevezik. Tehát az adattárház forrása többszörös lesz, ellentétben az data mart-tal, amely bizonyos esetekben az adattár részhalmaza.

Adattípusok Mart

Jellemzően háromféle adatleképezés létezik. Ők:

1. Függő adattárház

Egy függõ adat mart pusztán az adattárházból származik, és az összes csoportos függõ egy vállalati adattárházat fog képezni. Ez pusztán az adattárház részhalmaza, mivel a központi DW-ből jött létre.

Mivel a tiszta és összefoglalott adatok már jelen vannak a központi adattárban, az ETT folyamat vagy az Extract Transform and Transport egyszerűsödik. Csak meg kell határoznunk az adott részhalmazt, és végre kell hajtanunk az ETT-t.

Ezeket az adatkártyákat általában a jobb elérhetőség és sokkal jobb teljesítmény, jobb vezérlés és hatékonyság elérése érdekében építik fel.

2. Független adatok Mart

Ezt nem a központi adattárból hozták létre, és ennek forrása eltérő lehet. Mivel az adatok nem a központi DW ETT folyamatból származnak, egy kicsit más.

A független adatok nagy részét a szervezetek kisebb csoportja használja, és ennek forrása szintén korlátozott. A Független adatátvitelt általában akkor hozzák létre, amikor viszonylag rövidebb időn belül megoldást kell kapnunk.

3. Hibrid adat Mart

A hibrid adat mart lehetővé teszi az összes többi forrás csoportosítását, a központi adatraktáron kívül, a DW. Ha ad hoc integrációval foglalkozunk, ez nagyban elősegíti az összes olyan termékkel végzett munkát, amelyet a szervezetekhez külsőleg hozzáadtak.

Jellemzői Data Mart

Az alábbiakban bemutatjuk az adatkezelő szolgáltatás néhány jellemzőjét:

  • Mivel az adatok forrása az alanyra koncentrálódik, a felhasználó válaszideje azáltal növekszik.
  • A gyakran szükséges adatok esetében az adattárak használata hasznos lesz, mivel a központi DW részhalmaza, ezért az adatok mérete kisebb.
  • Mivel az adatok mennyisége korlátozott, a feldolgozási idő meglehetősen csökken a központi Dws-hoz képest.
  • Ezek alapvetően mozgékonyak, és elég gyorsan és hatékonyan képesek befogadni a modell változásait az adattárházhoz képest.
  • A Datamart egyetlen alany szakértőjétől megköveteli a raktári adatokkal ellentétben a több tárgyraktárban igényelt szakértelmet. Emiatt azt mondjuk, hogy az adatok mart agilisabbak.
  • Szétválaszthatjuk a hozzáférési kategóriákat alacsony szintre osztott adatokkal és az mart mart adatokkal, ez nagyon egyszerű.
  • Az infrastruktúrától való függőség meglehetősen korlátozott, és az adatokat szegmentálás után különféle hardverplatformokon lehet tárolni.

Az adatok végrehajtásának lépései Mart

Az alábbiakban bemutatjuk a végrehajtásához szükséges lépéseket.

1. Tervezés

Ez lesz a végrehajtás első lépése, ahol a műszaki és üzleti információk összegyűjtéséhez szükséges feladatokat és forrásokat azonosítják. Később a logikai terv végrehajtásra kerül, és áttekintéskor ez fizikai tervré konvertálódik. Emellett itt döntenek az adatok logikai és fizikai felépítéséről, például arról, hogyan lehet particionálni az adatokat és a partíció mezőjét, például a dátumot vagy más fájlt.

2. Építés

Ez a megvalósítás második szakasza, ahol fizikai adatbázisokat hoztak létre az RDBMS segítségével, amelyet a tervezési folyamat és a logikai struktúrák részeként határoztak meg. Az összes objektum, például séma, indexek, táblázatok, nézetek stb. Létrejön.

3. Népesség

Ez a harmadik szakasz, és itt az adatok kerülnek feltöltésre az adatok beszerzésekor. Az összes szükséges átalakítást végrehajtják, mielőtt rajta szerepelnek az adatok.

4. Hozzáférés

Ez a megvalósítás következő lépése, ahol a kitöltött adatok alapján lekérdezésre készítünk jelentéseket. A végfelhasználó ezt a lépést használja az adatok megértéséhez lekérdezésekkel.

5. Kezelés

Ez az adatkezelő megvalósításának utolsó szakasza, és itt a különféle feladatokra, mint például a hozzáféréskezelés, a rendszer optimalizálása, valamint az új adatok hangolása, kezelése és hozzáadása az adatkezelőhöz, valamint a helyreállítási forgatókönyvek tervezése a hibák kezelésére.

Az Data Mart előnyei

Az alábbiakban bemutatjuk néhány használatának előnyeit.

  • Ez az adattárház egyik legjobb költséghatékony alternatívája, ahol csak az adatok egy kis szegmensén kell dolgoznia.
  • Az adatok szétválasztása a forrásokból hatékonyabbá teszi az adatokat, mivel egy adott embercsoport az adatok tárolása helyett egy adott forrásból tudja feldolgozni az adatokat.
  • Az adatok gyorsabb elérése az adat mart használatával lehetséges, ha tudjuk, melyik részhalmazra van szükségünk.
  • A Datamart sokkal könnyebben használható, így a végfelhasználók könnyedén lekérdezhetnek rá.
  • A végrehajtási időhöz való hozzáféréshez az mart mart kevesebb időt igényel az adattárházhoz képest, mivel az adatok csoportokban vannak elkülönítve.
  • Egy adott alanyról származó történelmi adatok felhasználhatók az egyszerű trend elemzésre.

Következtetés

Mivel egyetlen funkcionális területre koncentrálódik, számos előnye van mind a folyamat-végrehajtó, mind a végfelhasználó számára. Ennélfogva a hatékony marts megvalósításra, valamint a szervezet adattárházára van szükség.

Ajánlott cikkek

Ez egy útmutató a Mi az a Data Mart-hoz. Itt tárgyaljuk a bevezetést, a szolgáltatásokat és a 3 legfontosabb típust, valamint annak jellemzőit és lépéseit. A következő cikkeket is megnézheti további információkért -

  1. Oracle adattárolás
  2. R adattípusok
  3. Python adattípusok
  4. Cassandra adatmodellezés
  5. Teljes útmutató az adatmodellhez Cassandra-ban