Bevezetés az ETL interjú kérdései és válaszai

Az ETL az Extract-Transform-Load kifejezést jelenti. Ez az Adatraktár rendszer alapja, ahol az adatokat a különféle forrásokból nyerik ki, majd az adatokat átalakítják, ahol az adatokat végrehajtják vagy feldolgozzák, hogy az adatok minősége, következetessége megfelelő bemutatási formátumban, majd végül a Az adatok adattárházba kerülnek bemutató formátumban, így elősegítik a végfelhasználót az információk könnyű megszerzésében és a döntés meghozatalában.

Az alábbiakban látható a 2019 legfontosabb ETL interjúkérdések, amelyeket gyakran kérdeznek egy interjúban

Ha az ETL-hez kapcsolódó állást keres, fel kell készülnie a 2019. évi ETL interjúkérdésekre. Bár minden interjú különbözik, és a munka mértéke szintén különbözik, segíthetünk nekünk a legfontosabb ETL interjúkérdések és válaszok kérdésében, amelyek segítenek abban, hogy megtegye az ugrást, és sikeres legyen az interjúban.

1. rész - ETL interjúkérdések (alapvető)

Ez az első rész az ETL interjúval kapcsolatos alapvető kérdéseket és válaszokat tartalmazza

1. Bontsa ki az ETL rendszert az adattárházban? Magyarázd

Válasz:
Az Extract-Transform-Load (ETL) rendszer képezi az adattárház alapját. A megfelelően megtervezett ETL rendszer kivonja az adatokat a forrásrendszerekből, betartja az adatminőségi és konzisztencia standardokat, megerősíti az adatokat, hogy külön források együttesen használhatóak legyenek, és végül adatokat szolgáltat prezentációra kész formátumban, hogy az alkalmazásfejlesztők alkalmazásokat építhessenek és a végfelhasználók döntéseket hozhat.

2. Az ETL rendszer jelentősége az adatraktárban?

Válasz :
Eltávolítja a hibákat és kijavítja a hiányzó adatokat. Biztosítja az adatokba vetett bizalom dokumentált mértékeit. Rögzíti a transznacionális adatok áramlását a megőrzés céljából. Beállítja a több forrásból származó adatok együttes felhasználását. Az adatokat strukturálja úgy, hogy a végfelhasználói eszközök használhatók legyenek.

3. Mi a napi folyamat az ETL rendszerben?

Válasz :
Készítse el az ETL folyamatok fejlesztési / tesztelési / gyártási csomagját. Ismerje meg a különféle hátsó szobában lévő adatszerkezetek kompromisszumait, beleértve a sima fájlokat, a normalizált sémákat, az XML sémákat és a csillagcsatlakozási (dimenziós) sémákat. Elemezze és bontsa ki a forrásadatokat. Építsen átfogó adattisztító alrendszert. Az adatokat strukturálja dimenziós sémákba a leghatékonyabb végfelhasználókhoz történő továbbításhoz, üzleti intelligencia eszközökhöz, adatbányászati ​​eszközökhöz, OLAP kockákhoz és analitikus alkalmazásokhoz. Hatékonyan továbbítsa az adatokat a magasan központosított és alaposan elosztott adattárházakba, ugyanazokkal a technikákkal. Az optimális teljesítmény érdekében hangolja be a teljes ETL-folyamatot.

Menjünk a következő ETL interjúkérdésekhez.

4. Adat formátumai az ETL rendszerben?

Válasz :
Az ETL-ben különböző adatformátumok léteznek, ezek közül néhány lapos fájlok, XML-adatkészletek, független DBMS-munka táblák, normalizált entitás / kapcsolat (E / R) sémák és dimenziós adatmodellek.

5. Adat profilozása az ETL rendszerben?

Válasz :
Az adatok profilozása az adatforrás minőségének, terjedelmének és kontextusának szisztematikus vizsgálata az ETL-rendszer felépítésének lehetővé tétele érdekében. Az egyik szélsőséges esetben egy nagyon tiszta adatforrás, amelyet az adattárházba történő megérkezés előtt jól karbantartottak, minimális átalakítást és emberi beavatkozást igényel, hogy közvetlenül a végső dimenziós táblázatokba és ténytáblákba töltse be.

6. Mi az ETL validátor?

Válasz :
Az ETL Validator egy olyan adattesztelő eszköz, amely jelentősen leegyszerűsíti az adatintegrációs, az adattárház és az adatáttelepítési projektek tesztelését. Szabadalmaztatott ELV-architektúránkat használja az adatok kinyerésére, betöltésére és érvényesítésére adatforrásokból, például adatbázisokból, sík fájlokból, XML, Hadoop és BI rendszerekből.

2. rész - ETL interjúkérdések (haladó)

Vessen egy pillantást az ETL interjú kérdéseire.

7. Milyen műveletek történnek az ETL rendszerben?

Válasz :
A következő három művelet: Kivonja az adatokat a transznacionális rendszertől, amely lehet Oracle, Microsoft vagy bármilyen más relációs adatbázis, átalakítja az adatokat adattisztító műveletek végrehajtásával. A betöltés az adatok beírása a cél adatbázisba.

8. Nevezze meg a piacon leginkább használt ETL eszközöket?

Válasz:
Különböző ETL eszközöket használnak a piacon, de a nedvesen előnyben részesített ETL eszközök közül néhányat használnak
• Oracle Warehouse Builder (OWB)
• SAP Data Services.
• IBM Infosphere Information Server.
• SAS adatkezelés.
• Power Center Informatica.
• Elixir repertoár az Data ETL-hez.
• Adatáttelepítő (IBI)
• SQL Server integrációs szolgáltatások (SSIS)

9. Melyek az ETL-csapat szerepei és felelőssége?

Válasz:
Az ETL-csoport legmagasabb szintű szerepe az adattárház hátsó részének felépítése.
• Az adatok leghatékonyabb továbbítása a végfelhasználói eszközökhöz
• Érték hozzáadása az adatokhoz a tisztítás és a megfelelő lépések során
• Az adatok származékának védelme és dokumentálása
• Adatok kinyerése az eredeti forrásokból
• Minőségbiztosítási és -tisztítási adatok
• A címkék és az elérni kívánt adatok mérése az adatokban
• konzisztencia az eredeti források között
• Adatok továbbítása fizikai formátumban, amelyet a lekérdező eszközök használhatnak,
• Jelentésírók és műszerfalak.

Menjünk a következő ETL interjúkérdésekhez.

10. Mi a hatásvizsgálat szerepe az ETL rendszerben?

Válasz:
A hatásvizsgálat megvizsgálja az objektumhoz társított metaadatokat (ebben az esetben egy táblát vagy oszlopot), és meghatározza, hogy milyen hatással van az objektum szerkezetének vagy tartalmának változása. Az adatátállási objektumok megváltoztatása megszakíthatja azokat az folyamatokat, amelyek elengedhetetlenek az adattárház megfelelő betöltéséhez. Az adatátmeneti objektumok ad-hoc módosításának engedélyezése hátrányosan érinti a projekt sikerét. Miután létrehoztunk egy táblát az átmeneti területen, el kell végezni egy hatásvizsgálatot, mielőtt bármilyen változtatást elvégeznénk benne. Számos ETL eszközgyártó rendelkezik hatásvizsgálat funkcióval, de ezt a funkciót gyakran figyelmen kívül hagyják az ETL termékbiztonsági koncepciója során, mert egy hátsó funkció és
Nem igazán fontos, amíg az adattár nem működik és nem kezd működni, és nem kezd fejlődni.

11. Hogyan dolgozza fel a rögzített hosszúságú lapos fájlt?

Válasz:
A rögzített hosszúságú fájl elrendezésnek tartalmaznia kell a fájl nevét, ahol a mező kezdődik; hossza; és annak adattípusa (általában szöveg vagy szám). Időnként a véghelyzet kerül megadásra. Ha nem, akkor minden mező véghelyzetét ki kell számítania a kezdő pozíciója és a hossza alapján, ha azt az ETL-eszköz előírja. A legtöbb ETL eszközben valószínűleg egyszer kell manuálisan beírnia a sima fájl fájlrendezését. Az elrendezés beírása után az eszköz emlékszik az elrendezésre, és elvárja, hogy ugyanaz az elrendezés legyen minden alkalommal, amikor interakcióba lép a tényleges lapos fájllal. Ha a fájl elrendezése megváltozik, vagy az adatok eltolódnak a hozzárendelt pozícióktól, az ETL-folyamatot be kell programozni a kudarcra. Rögzített hosszúságú sima fájlok feldolgozásakor próbálja meg ellenőrizni, hogy a fájlban lévő adatok helyesek-e. A pozíciók gyors ellenőrzésével ellenőrizze a dátum (vagy az idő) mezőjét, hogy megbizonyosodjon arról, hogy érvényes dátum. Ha a pozíciók eltolódnak, akkor a dátummező valószínűleg alfabetikus karaktereket vagy logikát nem mutató számokat tartalmaz. Más, nagyon specifikus tartományokkal rendelkező mezők ugyanúgy tesztelhetők. Az XML konkrétabb érvényesítési képességeket kínál. Ha az adatok érvényesítése vagy következetesség problémát jelent, próbálja meggyőzni az adatszolgáltatót az adatok XML-formátumban történő továbbításáról.

12. Miért valós idejű ETL az adattárházban?

Válasz:
Az adattárháznak szüksége van egy megrázkódhatatlan adatkészlet biztosításához az üzleti döntéshozók számára, megbízható információs alapot biztosítva a felállásra. A pislákoló adatbázisokkal szembeni aktuális jelentéstétel céljából az üzleti felhasználókat az üzleti tevékenységet folytató termelési alkalmazásokhoz irányították. Ezért a felhasználóknak el kellett menniük az adattárházba, hogy történelmi képet kapjanak arról, hogy mi történt a tegnapi üzleti életben, és sok OLTP-rendszeren át kellett keresniük képet a mai eseményről. Az üzleti felhasználók soha nem fogadták el teljesen ezt a megosztást. Az adattáraknak természetesen folyamatos ügyfélinformációkra van szükségük egy műveletből, ám az operációs rendszerek egyre inkább az adattárházak gazdagításán alapszanak. Ezért kiszámítható, hogy a szervezetek megkezdték az építészeti alternatívák kutatását, amelyek támogathatják az általánosabb integrációs forgatókönyveket, amelyek az operatív adatokat az alkalmazások között mozgatják, és egyidejűleg a raktárba és a raktárból egyre nagyobb sürgősséggel mozgatják.

Ajánlott cikkek

Ez egy útmutató az ETL interjúkérdések és válaszok listájához, így a jelölt könnyen meg tudja oldani ezeket az ETL interjúkérdéseket. A következő cikkeket is megnézheti további információkért -

  1. Azure Paas vs Iaas - Jellemzők
  2. 9 Csodálatos MapReduce interjúkérdések és válaszok
  3. A 11 legnépszerűbb RDBMS interjú kérdés és válasz
  4. 10 legfélelmetesebb PHP interjú kérdés a tapasztalt személyek számára
  5. Ismerje meg az öt legfontosabb hasznos DBA-interjú kérdést és választ

Kategória: