Bevezetés a csillagrendszerbe
A csillag séma a legegyszerűbb megközelítés és dimenziós modell, ahol a függvénytáblák, méretek és tények szervezett módon vannak elrendezve, és leginkább az üzleti intelligencia és az adattárolás területén alkalmazzák. A csillag sémáját úgy alakítják ki, hogy minden tényt elrendeznek a csillaghoz hasonló méretekkel. A tény végtelen eredmény, például értékesítési adatok és bejelentkezési számok. A dimenzió referenciaadatok gyűjtése, beleértve a tényeket, például a dátumot, a termékkel és az ügyfelekkel kapcsolatos részleteket. A csillag séma az adattárolás, az Online Analytical Processing adatkocka és az ad-hoc lekérdezések hatalmas adatkérdezéseire van optimalizálva.
Hogyan készíthetünk csillag sémát?
Itt a felhasználó az entitás-kapcsolati modell átalakításával hozza létre a csillagrendszert. Az entitás-kapcsolati modellek túl bonyolultak ahhoz, hogy megmagyarázzák a funkcionális mennyiségeket és attribútumokat, így a következők szerint egyszerűsítik a dimenziós csillagsémát:
- Keresse meg a vállalati eljárást entitás-kapcsolati nézetből, és megértse a modellt, amely többdimenziós modellekre osztható. Az entitás-kapcsolat üzleti adatokból áll.
- Találjon sok-sok táblát az entitáskapcsolatban, amely megmagyarázza a vállalati eljárást, és konvertálja azokat dimenziós modell valóságtáblákká. Ez a táblázat adatokat tartalmaz a ténytábláról és a dimenziós tábláról, numerikus értékekkel és egyedi kulcsattribútumokkal.
- Ennek a folyamatnak az a célja, hogy megkülönböztesse az információcsere-alapú információs táblákat vagy az információt törölt táblákat. Szükség van tehát sok-sok kapcsolat kialakítására. Például az ERP adatbázisban vannak számlák részletei, amelyek az átváltási táblázat. A frissített és frissített részletek csere alapú táblázatok. Most összehasonlítva mindkét táblát, kiderült, hogy az adatok valóban statikusak.
- A valóságtábla egy dimenziós modell reprezentációja, amely a véges mérések között sok-sok hálózatot mutat. Ez azt eredményezi, hogy az idegen kulcsok a valóság táblázatokban sokszínűek, és ez egy megszámlálható kapcsolat. e táblázat nagy része cserealapú táblák alá tartozik
- A csillag séma megtervezésének utolsó lépése a vonatkozó táblák normalizálása mérési táblázatokké. A kötelező kulcs duplikátum készítése. Ez a kulcs a valóság táblázaton alapul, amely elősegíti a jobb megértést. Keresse meg a dátumot és az időt az entitás-kapcsolatok tervezéséből, és szűrje be a dimenziós táblát. A dátumok dátum- és időbélyegzőként kerülnek mentésre. A dátumdimenziós oszlop az évet, a hónapot vagy a dátumot vagy az időt ábrázolja
Példa: Az idődimenziós tábla TIMEID, Quartername, QuarterNo, MonthName, MonthNo, DayName, DayofMonth, DayOfWeek formátumú táblázatokkal rendelkezik, amelyek a dimenziós táblák fontos kritériumai lehetnek. Hasonlóképpen, az összes tábla egyedi azonosítóval és attribútumokkal rendelkezik. A lekérdezési nyelvek, például az SQL, alkalmazhatók az adatbányászatban, az adattárházban és az elemzésben.
A kockadefiníció szintaxisa:
Define cube (cube-name)(dimension-list): (measure-list)
A kockákat különböző szintű riasztások kezelésére használják, és a lekérdezés megválaszolásához szükséges válaszidő minimális. Előre gyártott kivitelben kapható, és a szükséges helyzetekben is alkalmazható. A Star séma létrehozása nagyon egyszerű és hatékony alkalmazás, és adaptálható is. A ténytábla és a dimenziós táblázat kitöltése kötelező, amely csillagként alakul ki, és SQL lekérdezésekkel vagy futó kóddal formálható. Ez a kialakítás az adatok jobb megértése és könnyebb lekérése érdekében készült.
A csillag séma jellemzői
1. A Star séma gyors összesítéseket és számításokat nyújt, mint például az összes eladott tétel és a bevétel jövedelme minden hónap végén. Ezeket a részleteket és a folyamatot a követelményeknek megfelelően szűrhetjük meg a megfelelő lekérdezések megfogalmazásával.
2. Képes kiszűrni az adatokat a normalizált adatokból, és biztosítja az adattárolási igényeket. A normalizált táblázathoz kapcsolódó információk több dimenzió lapon vannak egymásra rakva. Az egyes ténytáblákhoz egyedi kulcsot generálnak az egyes sorok azonosításához.
3. A ténytábla a konkrét események mérése, beleértve a véges számértékeket, és a dimenziós táblázatokhoz kapcsolódó idegen kulcsokból áll. Ez a táblázat az atomi szintű tényleges értékekkel van kialakítva, és lehetővé teszi több rekord tárolását egyszerre. Három különféle ténytáblázat létezik.
4. A tranzakciós ténytáblák bizonyos események, például ünnepi események, értékesítési események adatait tartalmazzák.
5. Az adott időszakokra vonatkozó tények rögzítése, mint például a számlainformációk minden negyedév végén.
6. Egy bizonyos időszakon át gyorsan aggregálódó táblákat felhalmozó pillanatkép táblázatoknak hívnak.
7. A dimenziós táblázatok részletes attribútum-adatokat, a ténytáblában található rekordokat tartalmaznak. A mérettáblázat változatos lehet. A dimenziós táblákat elsősorban az idő és a dátum dimenziós táblázataként, a termék- és a megrendelés dimenziós táblázataként, az alkalmazotti és a számla adataiként a táblázatokként, a földrajz és a helyek dimenziós táblázataként használják. Ezeket a táblákat egyetlen egész adattípushoz rendelték, amely az elsődleges kulcs másodpéldánya.
8. A felhasználó az igényeinek megfelelően megtervezheti asztalát. Például, ha szüksége van egy értékesítési dimenziós táblára, amely tartalmazza a termék- és az ügyfélkulcsot, a dátum- és az időkulcsot, akkor a jövedelemszerzési kulcsot. Ha az üzletember keretet készít egy termékdimenziós táblát olyan kulcsfontosságú attribútumokkal, mint a szín, a vásárolt cikk dátuma, a promóciós kulcs és az ügyfélkulcs.
Előnyök
- Egyszerű logikával van kialakítva, és lekérdezésekkel könnyű kinyerni az adatokat a tranzakciós folyamatból.
- Közös jelentési logikával rendelkezik, amelyet dinamikusan implicitálnak.
- A Star séma növeli a teljesítményt a jelentési alkalmazások számára.
- Csillagos séma, amelyet az Online Tranzakciós folyamat által alkalmazott kockák adagolása fejlesztett ki annak érdekében, hogy a kockák hatékonyan működjenek.
hátrányok
- Nagy integritású és magasan normalizált állapotú. Ha a felhasználó nem frissíti az értékeket, akkor a teljes folyamat összeomlik. A védelem és a biztonság a határig nem megbízható. Nem olyan rugalmas, mint egy analitikai modell, és nem terjeszti elő hatékony támogatását számos kapcsolatra.
- A csillag séma az adatbázisban kerül alkalmazásra az adatok gyorsabb helyreállításának vezérlésére. A lekérdezés a teljes adatbázis keresése helyett a szükség kiválasztására szolgál. A szűrt és a kiválasztott adatok különböző esetekben alkalmazhatók. Ezért ez a csillag séma egy egyszerű modell, amelyet könnyen alkalmaznak.
Ajánlott cikk
Ez egy útmutató a Mi az a csillagrendszer? Itt tárgyaljuk a csillagrendszer bevezetését és jellemzőit, valamint előnyeit és hátrányait. A további javasolt cikkeken keresztül további információkat is megtudhat -
- A ténytáblázat áttekintése
- Csillagos séma vs hópehely séma | Legfontosabb különbségek
- Adattárház modellezése típusokkal
- Előnyökkel rendelkező AWS adatbázisok
- AWS Data Pipeline