Bevezetés a Cassandra adatmodellezésbe

Az óriási információmennyiség elleni küzdelem érdekében új adatkezelési technológiák jelentek meg. Ezek a technikák különböznek a hagyományos relációs adatbázis megközelítésektől. Ezeket együttesen NoSQL-nek nevezzük. A Cassandra az egyik széles körben ismert NoSQL adatbázis. Más népszerű NoSQL adatbázis-termékek közé tartozik a MongoDB, Riak, Redis, Neo4j stb. Ebben a témakörben a Cassandra Data Modeling-ról tanulunk.

Ezek a NoSQL adatbázisok kiküszöbölik a relációs adatbázis által feltárt hiányosságokat, ha óriási kötetet tartalmaznak, amely szervezett, félig szervezett és nem strukturált információkat tartalmaz. A web-alkalmazások méretezhetősége és teljesítménye, az alacsonyabb költségek és az agilis szoftverfejlesztés támogatása néhány előnye. A Cassandra működő nyílt forráskódú platform az Apache Software Foundation-ben, következésképpen Apache Cassandra néven is ismert. A Cassandra óriási mennyiségű szervezett, félig szervezett és nem strukturált adatot képes felügyelni egy nagy elosztott fürtben, több központ között. Nagy skálázhatóságot, nagy teljesítményt nyújt, és támogatja a rugalmas modellt.

Az adatmodellezés az áramlás és a struktúra megértése, amelyet a szoftver fejlesztéséhez kell használni. Azonosítja a fő objektumokat, azok jellemzőit és a többi objektumhoz fűződő kapcsolatot. Ez gyakran az első lépés és a legfontosabb lépés bármilyen szoftver létrehozásában. Csakúgy, mint az építész tervrajza, az adatmodell egy szoftverfejlesztő. Ez nemcsak a struktúra elemzésében segít, hanem lehetővé teszi a később esetlegesen felmerülő funkcionális vagy műszaki nehézségek előrejelzését.

A hagyományos adatmodellezés folyamata a fogalmi adatmodellezéssel kezdődik. Ezt a fogalmi adatmodellt ezután hozzákapcsolják egy relációs adatmodellhez, amely végül relációs adatbázis-sémát állít elő. Ebben a folyamatban az elsődleges dolog az adatválogatás, amelyet korreláció alapján végeznek megértés és lekérdezés alapján.

Az adatmodellezés a Cassandra-ban eltér a relációs adatbázisban alkalmazott modellezéstől. A relációs adatok modellezése kizárólag a fogalmi adatmodellre épül. Amely az SQL-t használja a műveletek beolvasására és végrehajtására. A Cassandra CQL-t (Cassandra Query Language) használ, amelynek SQL szintaxisa hasonló. Az adatmodellezés Cassandrában az adatok megszervezésével és az objektumokkal való kapcsolat megértésével kezdődik. Itt a billentyűtér analóg egy olyan adatbázishoz, amely különféle rekordokat és táblázatokat tartalmaz. A klaszternek több billentyűtér lehet. Különböző csomópontok kapcsolódnak egy fürt létrehozásához. A billentyűtér szintjén meghatározhatjuk az attribútumokat, például a replikációs tényezőt.

Táblázat modell

A Cassandra-ban lévő táblázat értelmezése teljesen eltér a meglévő fogalomtól. A CQL táblázat partíciók csoportjának tekinthető, oszlopcsaládnak, amely azonos szerkezetű sorokat tartalmaz. Minden partíció egyedi partíciókulccsal rendelkezik, és minden sor tartalmaz opcionális szinguláris fürtkulcsot. A partíció és a fürtkulcs kombinációját elsődleges kulcsnak nevezzük, amelyet a táblázat egy sorának azonosítására használunk. A klaszterkulccsal ellátott táblázatok több soros partíciókkal rendelkeznek, míg a fürtözött kulcs nélküli táblák csak egysoros partíciókkal rendelkeznek.

Lekérdezési modell

A Casandra folyamata egy koncepcionális adatmodelltől kezdődik, az alkalmazás munkafolyamatával együtt, amelyet bemenetekként adnak a logikai adatmodell megszerzéséhez és végül a fizikai adatmodell megszerzéséhez.

A felhasználói lekérdezéseket az alkalmazás munkafolyamata határozza meg. A fogalmi adatmodellezést használják a különféle entitások és attribútumaik közötti kapcsolat rögzítésére. Ez az ER modell neve.

Logikai adatok modellezése

A Cassandra adatmodellezési módszer alapja a logikus adatmodellezés. A fogalmi adatmodellt egy alkalmazás munkafolyamatában meghatározott lekérdezések alapján egy logikai adatmodellre vonják le. Ezt a lekérdezésvezérelt, a logikai leképezés fogalmát adatmodellezési elvek, leképezési szabályok és leképezési minták határozzák meg.

Adatmodellezési elvek

A következő négy alapelv alapot ad a fogalmi és logikai adatmodellek leképezéséhez.

  1. Ismerje meg adatait: Az adatok helyes megszervezéséhez az entitásokat, attribútumokat és kapcsolataikat közismertnek kell lenni a fogalmi adatmodell kialakításához.
  2. Ismerje meg a lekérdezéseket: Az adatok hatékony szervezéséhez lekérdezéseket használnak. A végrehajtandó legjobb lehetőség a partíció lekérdezésenként.
  3. Adatok fészkelése: Az azonos típusú több entitás ismert kritérium alapján történő együttes szervezéséhez az adatok fészkelését használják. Több entitás lekérésére szolgál egy partícióból.
  4. Adatok sokszorosítása: Mindig jobb, ha az adatok másolása megtörténik a Cassandra csatlakozásaival, mivel ez elősegíti az azonos adatok különböző lekérdezéseinek hatékony támogatását.

Az adatmodellezési alapelvek alapján meghatározásra kerülnek a feltérképezési szabályok a fogalmi adatmodellről logikai adatmodellre történő átmenet végrehajtásához

Leképezési szabályok:

  1. Entitások és kapcsolatok: Az entitás és kapcsolati típusok táblázatokhoz, míg az entitások és kapcsolatok táblázatsorokhoz térképeznek.
  2. Egyenlőség-keresési attribútumok: Az egyenlőség-keresési attribútumokat az elsődleges kulcsot tartalmazó oszlopokban használják az egyenlőség-keresésben való részvételhez.
  3. Egyenlőtlenség keresési attribútumai: Az egyenlőtlenség keresési attribútumait az elsődleges kulcsot tartalmazó oszlopokban is használják, hogy különböző keresési eredményeket hozzanak létre.
  4. Rendelési attribútum: A rendelési attribútumot az adatok csoportosítására használják egy meghatározott sorrendben
  5. Fő jellemző: Ez a tulajdonság segít azonosítani az egyedi sorokat

A fenti leképezési szabályok alapján olyan leképezési mintákat tervezünk, amelyek az adatbázis-tervezés automatizálásának alapjául szolgálnak. Az adott lekérdezés és a fogalmi adatmodell révén mindegyik minta meghatározza a séma végső körvonalait.

Fizikai modell

Ha a logikai modell a helyén van, a fizikai modell kidolgozása meglehetősen egyszerű. A fizikai adatmodell az adatbázisban lévő adatokat képviseli. Az adattípusok hozzárendelése után becsüljük meg a partíció méretét és tesztelést végezzünk a modell elemzése érdekében a jobb optimalizálás érdekében.

Összegzésképpen elmondhatjuk, hogy ha hatalmas mennyiségű és sokféle adat áll rendelkezésre elemzésre és feldolgozásra. Olyan megközelítést kell választani, amely hatékonyan kinyeri az elemzendő adatokat. A Cassandra nagy méretezhetőségével és hatalmas adatok tárolásának képességével gyors információkeresést kínál az adatmodellek kialakításához összetett struktúrákhoz. A Cassandra adatmodellezése és annak összes funkcionalitása az alábbiak szerint fedhető le. Itt egy lekérdezésvezérelt fogalmi adattervet készítünk, és a vázolt leképezési szabályok és leképezési minták segítségével lehetővé teszi a fogalmi modellről a logikai modellre való áttérést. Ezután leírunk egy fizikai modellt, hogy teljesen egyedi mentális képet kapjunk a tervről.

Ajánlott cikkek

Ez egy útmutató a Cassandra Data Modeling-hoz. Itt tárgyaljuk a Táblázatmodellt, Lekérdezési modellt, Logikai adatmodellezést és az Adatmodellezési alapelveket. Lehet, hogy megnézi a következő cikkeket is, ha többet szeretne megtudni -

  1. Adatmodellek a DBMS-ben
  2. Mi az adatmodellezés?
  3. Adattárház modellezése
  4. Adatanalitikai interjú kérdései
  5. A MySQL 6 legfontosabb csatlakozási típusa példákkal

Kategória: