Bevezetés a csillagrendszerbe

A csillag séma a legegyszerűbb megközelítés és dimenziós modell, ahol a függvénytáblák, méretek és tények szervezett módon vannak elrendezve, és leginkább az üzleti intelligencia és az adattárolás területén alkalmazzák. A csillag sémáját úgy alakítják ki, hogy minden tényt elrendeznek a csillaghoz hasonló méretekkel. A tény végtelen eredmény, például értékesítési adatok és bejelentkezési számok. A dimenzió referenciaadatok gyűjtése, beleértve a tényeket, például a dátumot, a termékkel és az ügyfelekkel kapcsolatos részleteket. A csillag séma az adattárolás, az Online Analytical Processing adatkocka és az ad-hoc lekérdezések hatalmas adatkérdezéseire van optimalizálva.

Hogyan készíthetünk csillag sémát?

Itt a felhasználó az entitás-kapcsolati modell átalakításával hozza létre a csillagrendszert. Az entitás-kapcsolati modellek túl bonyolultak ahhoz, hogy megmagyarázzák a funkcionális mennyiségeket és attribútumokat, így a következők szerint egyszerűsítik a dimenziós csillagsémát:

  • Keresse meg a vállalati eljárást entitás-kapcsolati nézetből, és megértse a modellt, amely többdimenziós modellekre osztható. Az entitás-kapcsolat üzleti adatokból áll.
  • Találjon sok-sok táblát az entitáskapcsolatban, amely megmagyarázza a vállalati eljárást, és konvertálja azokat dimenziós modell valóságtáblákká. Ez a táblázat adatokat tartalmaz a ténytábláról és a dimenziós tábláról, numerikus értékekkel és egyedi kulcsattribútumokkal.
  • Ennek a folyamatnak az a célja, hogy megkülönböztesse az információcsere-alapú információs táblákat vagy az információt törölt táblákat. Szükség van tehát sok-sok kapcsolat kialakítására. Például az ERP adatbázisban vannak számlák részletei, amelyek az átváltási táblázat. A frissített és frissített részletek csere alapú táblázatok. Most összehasonlítva mindkét táblát, kiderült, hogy az adatok valóban statikusak.
  • A valóságtábla egy dimenziós modell reprezentációja, amely a véges mérések között sok-sok hálózatot mutat. Ez azt eredményezi, hogy az idegen kulcsok a valóság táblázatokban sokszínűek, és ez egy megszámlálható kapcsolat. e táblázat nagy része cserealapú táblák alá tartozik
  • A csillag séma megtervezésének utolsó lépése a vonatkozó táblák normalizálása mérési táblázatokké. A kötelező kulcs duplikátum készítése. Ez a kulcs a valóság táblázaton alapul, amely elősegíti a jobb megértést. Keresse meg a dátumot és az időt az entitás-kapcsolatok tervezéséből, és szűrje be a dimenziós táblát. A dátumok dátum- és időbélyegzőként kerülnek mentésre. A dátumdimenziós oszlop az évet, a hónapot vagy a dátumot vagy az időt ábrázolja

Példa: Az idődimenziós tábla TIMEID, Quartername, QuarterNo, MonthName, MonthNo, DayName, DayofMonth, DayOfWeek formátumú táblázatokkal rendelkezik, amelyek a dimenziós táblák fontos kritériumai lehetnek. Hasonlóképpen, az összes tábla egyedi azonosítóval és attribútumokkal rendelkezik. A lekérdezési nyelvek, például az SQL, alkalmazhatók az adatbányászatban, az adattárházban és az elemzésben.

A kockadefiníció szintaxisa:

Define cube (cube-name)(dimension-list): (measure-list)

A kockákat különböző szintű riasztások kezelésére használják, és a lekérdezés megválaszolásához szükséges válaszidő minimális. Előre gyártott kivitelben kapható, és a szükséges helyzetekben is alkalmazható. A Star séma létrehozása nagyon egyszerű és hatékony alkalmazás, és adaptálható is. A ténytábla és a dimenziós táblázat kitöltése kötelező, amely csillagként alakul ki, és SQL lekérdezésekkel vagy futó kóddal formálható. Ez a kialakítás az adatok jobb megértése és könnyebb lekérése érdekében készült.

A csillag séma jellemzői

1. A Star séma gyors összesítéseket és számításokat nyújt, mint például az összes eladott tétel és a bevétel jövedelme minden hónap végén. Ezeket a részleteket és a folyamatot a követelményeknek megfelelően szűrhetjük meg a megfelelő lekérdezések megfogalmazásával.

2. Képes kiszűrni az adatokat a normalizált adatokból, és biztosítja az adattárolási igényeket. A normalizált táblázathoz kapcsolódó információk több dimenzió lapon vannak egymásra rakva. Az egyes ténytáblákhoz egyedi kulcsot generálnak az egyes sorok azonosításához.

3. A ténytábla a konkrét események mérése, beleértve a véges számértékeket, és a dimenziós táblázatokhoz kapcsolódó idegen kulcsokból áll. Ez a táblázat az atomi szintű tényleges értékekkel van kialakítva, és lehetővé teszi több rekord tárolását egyszerre. Három különféle ténytáblázat létezik.

4. A tranzakciós ténytáblák bizonyos események, például ünnepi események, értékesítési események adatait tartalmazzák.

5. Az adott időszakokra vonatkozó tények rögzítése, mint például a számlainformációk minden negyedév végén.

6. Egy bizonyos időszakon át gyorsan aggregálódó táblákat felhalmozó pillanatkép táblázatoknak hívnak.

7. A dimenziós táblázatok részletes attribútum-adatokat, a ténytáblában található rekordokat tartalmaznak. A mérettáblázat változatos lehet. A dimenziós táblákat elsősorban az idő és a dátum dimenziós táblázataként, a termék- és a megrendelés dimenziós táblázataként, az alkalmazotti és a számla adataiként a táblázatokként, a földrajz és a helyek dimenziós táblázataként használják. Ezeket a táblákat egyetlen egész adattípushoz rendelték, amely az elsődleges kulcs másodpéldánya.

8. A felhasználó az igényeinek megfelelően megtervezheti asztalát. Például, ha szüksége van egy értékesítési dimenziós táblára, amely tartalmazza a termék- és az ügyfélkulcsot, a dátum- és az időkulcsot, akkor a jövedelemszerzési kulcsot. Ha az üzletember keretet készít egy termékdimenziós táblát olyan kulcsfontosságú attribútumokkal, mint a szín, a vásárolt cikk dátuma, a promóciós kulcs és az ügyfélkulcs.

Előnyök

  • Egyszerű logikával van kialakítva, és lekérdezésekkel könnyű kinyerni az adatokat a tranzakciós folyamatból.
  • Közös jelentési logikával rendelkezik, amelyet dinamikusan implicitálnak.
  • A Star séma növeli a teljesítményt a jelentési alkalmazások számára.
  • Csillagos séma, amelyet az Online Tranzakciós folyamat által alkalmazott kockák adagolása fejlesztett ki annak érdekében, hogy a kockák hatékonyan működjenek.

hátrányok

  • Nagy integritású és magasan normalizált állapotú. Ha a felhasználó nem frissíti az értékeket, akkor a teljes folyamat összeomlik. A védelem és a biztonság a határig nem megbízható. Nem olyan rugalmas, mint egy analitikai modell, és nem terjeszti elő hatékony támogatását számos kapcsolatra.
  • A csillag séma az adatbázisban kerül alkalmazásra az adatok gyorsabb helyreállításának vezérlésére. A lekérdezés a teljes adatbázis keresése helyett a szükség kiválasztására szolgál. A szűrt és a kiválasztott adatok különböző esetekben alkalmazhatók. Ezért ez a csillag séma egy egyszerű modell, amelyet könnyen alkalmaznak.

Ajánlott cikk

Ez egy útmutató a Mi az a csillagrendszer? Itt tárgyaljuk a csillagrendszer bevezetését és jellemzőit, valamint előnyeit és hátrányait. A további javasolt cikkeken keresztül további információkat is megtudhat -

  1. A ténytáblázat áttekintése
  2. Csillagos séma vs hópehely séma | Legfontosabb különbségek
  3. Adattárház modellezése típusokkal
  4. Előnyökkel rendelkező AWS adatbázisok
  5. AWS Data Pipeline

Kategória: