Data Warehouse Architecture

Bevezetés az adattárház architektúrájába

Az Adatraktár olyan tárolóhely, amely többféle típusú adatgyűjtést tartalmaz, többféle forrásból beszerezve.
Az a teljes folyamat, amelyben a külső adatforrásokat megszerzik, feldolgozzák, tárolják és felhasználható információkké elemezik, egy olyan rendszerkészletben zajlik, amelyet egyesít egyetlen, a Data Warehouse Architecture néven ismert séma.

Az adattárház architektúrája általában három rétegből áll.

Élvonalban
Középszint
Alsó szint

Élvonalban

A legfelső szint az ügyféloldali felépítésből áll.
Az Adatraktárban tárolt, átalakított és logikai alkalmazású információkat üzleti célra használják fel és szerezzék meg ebben a szintben.
A jelentés elkészítéséhez és elemzéséhez számos eszköz létezik a kívánt információ előállításához.
Az adatbányászat, amely manapság nagy trend lett, itt történik.
Az összes követelményelemzési dokumentumot, a költségeket és az összes olyan szolgáltatást, amely meghatározza a profit alapú üzleti üzletet, ezen Adattárház információt használó eszközök alapján készítik el.

Középszint

A középső réteg az OLAP szerverekből áll
Az OLAP Online Analytical Processing Server
Az OLAP célja az információ elemzése az üzleti elemzők és vezetők számára
Mivel a középső rétegben található, jogszerűen kölcsönhatásba lép az alsó rétegben található információkkal, és továbbadja a betekintést a felső szintű eszközökhöz, amelyek feldolgozzák a rendelkezésre álló információkat.
Az Adatraktár architektúrában leginkább a Relációs vagy Többdimenziós OLAP-t használják.

Alsó szint

Az alsó szint elsősorban az adatforrásokból, az ETL eszközből és az adattárházból áll.

1. Adatforrások

Az adatforrások a forrás adatokból állnak, amelyeket megszerznek és továbbadnak a Staging és az ETL eszközökhöz a további feldolgozáshoz.

2. ETL eszközök

Az ETL eszközök nagyon fontosak, mivel elősegítik a logika, a nyers adatok és a sémák egyesítését, és az információkat betöltik az adattárházba vagy az adatkezelő mappákba.
Időnként az ETL betölti az adatokat az Adatlapokba, majd az adatokat a Data Warehouse tárolja. Ezt a megközelítést Alulról felfelé irányuló megközelítésnek nevezik.
Az a megközelítés, amikor az ETL közvetlenül tölti be az adatokat az Adattárba, felülről lefelé mutató módszerként ismert.

Különbség a fentről lefelé és az alulról felfelé történő megközelítés között

Felülről lefelé irányuló megközelítés	Alulról felfelé építkező megközelítés
Meghatározott és következetes képet nyújt az információról, mivel az adattárházból származó információkat felhasználják az Adatlapok létrehozására	A jelentések könnyen elkészíthetők, mivel először létrehozzák az adatkártyákat, és viszonylag könnyű együttműködni az adatokkal.
Erős modell, ezért a nagy cégek kedvelik	Nem olyan erős, de az adattárház kibővíthető, és létrehozható az adatkártyák száma
Idő, költség és karbantartás magas	Az idő, a költség és a karbantartás alacsony.

Data Marts

A Data Mart egy olyan tároló elem is, amelyet az egyes hatóságok egy adott funkcióval vagy egy vállalattal kapcsolatos adatainak tárolására használnak.
Az Data mart összegyűjti az adatokat a Data Warehouse-ból, és így mondhatjuk, hogy az data mart az információ részhalmazát tárolja a Data Warehouse-ban.
Az adattáblák rugalmasak és kicsik.

3. Adattárház

A Data Warehouse a teljes Data Warehouse Architecture központi alkotóeleme.
Adattárként szolgál az információk tárolására.
Nagy mennyiségű adat tárolódik az Adattárházban.
Ezt az információt számos technológia használja, például a Big Data, amelyek megkövetelik az információ nagy részhalmazainak elemzését.
A Data Mart a Data Warehouse modellje.

Az adattárház-architektúra különböző rétegei

Négy különböző típusú réteg létezik, amelyek mindig jelen vannak az Data Warehouse Architecture-ben.

1. Adatforrás réteg

Az adatforrás réteg az a réteg, ahol a forrásból származó adatok találkoznak, majd a kívánt műveletekhez továbbítják a többi rétegre.
Az adatok bármilyen lehetnek.
A forrásadatok lehetnek adatbázisok, táblázatok vagy bármilyen más típusú szöveges fájl.
A forrás adatok bármilyen formátumban lehetnek. Nem várhatjuk el, hogy azonos formátumú adatokat kapjunk, mivel a források nagyon különböznek egymástól.
A valós életben a forrásadatok néhány példája lehet
Naplófájlok az egyes alkalmazásokról vagy munkahelyekről, vagy a munkaadók belépéséről a vállalatban.
Felmérési adatok, tőzsdei adatok stb.
A webböngésző adatai és még sok más.

2. Adatfázis-réteg

A következő lépések az adatfázis-rétegben zajlanak.

1. Adatkivonás

A forrásréteg által kapott adatok továbbadódnak a szakaszos rétegbe, ahol a beszerzett adatokkal az első folyamat az extrakció.

2. Leszállási adatbázis

A kinyert adatokat ideiglenesen tárolja a leszállási adatbázisban.
Az adatok kinyerése után beolvassa az adatokat.

3. Megállóhely

Az adatokat a leszállási adatbázisban veszik, és több minőségi ellenőrzést és szakaszos műveletet hajtanak végre a megállási területen.
A struktúrát és a sémát szintén azonosítják, és kiigazításokat végeznek a rendezetlen adatokban, ily módon megkísérelve megteremteni a megszerzett adatok közötti egységességet.
A hely vagy az adatok felállítása közvetlenül az átalakítás és a változtatások előtt egy további előnye, amely nagyon fontosvá teszi az átmeneti folyamatot.
Megkönnyíti az adatfeldolgozást.

4. ETL

Ez egy kinyerés, átalakítás és terhelés.
Az ETL eszközöket az adatok integrálására és feldolgozására használják, ahol a logikát meglehetősen nyers, de kissé rendezett adatokra alkalmazzák.
Ezeket az adatokat az előírt analitikus jelleg szerint nyerik ki, és olyan adatokká alakítják át, amelyeket megfelelőnek tartanak az adattárházban történő tároláshoz.
Az átalakítás után az adatokat vagy inkább egy információt végül betöltjük az adattárházba.
Néhány példa az ETL eszközökre: Informatica, SSIS stb.

3. Adattárolási réteg

A feldolgozott adatokat az Adattárház tárolja.
Ezeket az adatokat megtisztítják, átalakítják és meghatározott struktúrával készítik el, és ezáltal lehetőséget adnak a munkaadók számára, hogy az üzleti igények szerint felhasználják az adatokat.
Az architektúra megközelítésétől függően az adatokat a Data Warehouse, valamint az Data Marts tárolja. Az adatleírásokat a későbbi szakaszokban tárgyaljuk.
Néhányukban működési adattároló is található.

4. Adatbemutató réteg

Ebben a rétegben a felhasználók kapcsolatba léphetnek az adattárházban tárolt adatokkal.
Lekérdezéseket és számos eszközt alkalmazunk az adatok alapján különböző típusú információk megszerzésére.
Az információ az adatok grafikus ábrázolásán keresztül jut el a felhasználóhoz.
A jelentési eszközöket használják az üzleti adatok megszerzésére, és az üzleti logikát különféle információk gyűjtésére is alkalmazzák.
A metaadatok és a rendszer műveletei, valamint a teljesítmény szintén ezen a rétegen vannak fenntartva és megnézve.

Következtetés

Az Data Warehouse szempontjából fontos szempont a hatékonysága. A hatékony adattárház létrehozásához az üzleti elemzési keretrendszer néven ismert keretet építünk fel. Négyféle nézet létezik az adattárház tervezésével kapcsolatban.

1. Felülről lefelé nézet: Ez a nézet csak az adattárház kiválasztásához szükséges speciális információkat teszi lehetővé.

2. Adatforrás nézet: Ez a nézet az összes információt mutatja az adatforrástól az átalakítás és tárolás módjáig.

3. Adatraktár nézet: Ez a nézet az adattárházban található információkat mutatja a ténytáblákon és a mérettáblázatokon keresztül.

4. Üzleti lekérdezés nézet: Ez egy olyan nézet, amely az adatokat a felhasználó szempontjából mutatja.

Ajánlott cikkek

Ez egy útmutató az Adattárház architektúrájához. Itt megvitattuk az adattárház-architektúra nézetek, rétegek és rétegek különféle típusait. A további javasolt cikkeken keresztül további információkat is megtudhat -

Karrier az adattárolásban
Hogyan működik a JavaScript?
Adatraktári interjúkérdések
Mi az a Panda?

Data Warehouse Architecture - Rétegek és építészet különféle típusai

Tartalomjegyzék:

Bevezetés az adattárház architektúrájába