Bevezetés a Talend Open Studio-ba
A Talend az Open Studio alkalmazást kínálja, amely nyílt forráskódú az adatintegrációhoz. Több mint 800 komponenst tartalmaz különféle integrációs célokra. Töltse le a Talend Open Studio-t a https://www.talend.com/download/ webhelyről
Az adatintegráció azt jelenti, hogy a különböző forrásokból származó adatokat egyesítik, és egyetlen nézetbe egyesítik, és így értelmes adatokhoz jutnak, amelyek elősegítik a vállalat vagy szervezet üzleti tevékenységének javítását az adatok elemzése révén. Az integráció elősegíti az adatok beszerzését, az adatok megtisztítását és a szükséges átalakításokat stb., Majd az adattárba történő betöltését.
Mi a Talend?
A Talend egy ETL eszköz, amelyet az adatok integrálására használnak. A Talend megoldást kínál az adatok előkészítésére, az adatok minőségére, az adatok integrálására és a nagy adatokra. Itt néhány elemet tárgyalunk. Az alábbiakban látható példa megkönnyítése érdekében egy sim operátor hatalmas adatokkal rendelkezik a tervekről, az ügyfelekről, a sim részleteiről stb. Ezek az adatok hatalmasak, tehát a nagy adatokat is felhasználják az integrációban.
Vevő Sim vásárlása kormányzati azonosító segítségével
A nevét AB C-nek nevezték el
címe Chennai, Chennai
telefonszám: 1234567890
Az adatok integrálása után
Keresztnév: AB
Vezetéknév: C
Cím: Chennai, India
Telefonszám: +911234567890
Az adatok megtisztulnak és valami értelmesebbé alakulnak.
Előnyök
- Üzleti trendek elemzése az adatintegráció segítségével
- Az adatok egyesítése egyetlen rendszerbe
- Időmegtakarítás, hatékonyabb és kevesebb átdolgozás
- Egyszerű jelentés generálás - a BI eszközök használják
- Adatok karbantartása és beillesztése az adattárházba és az adatkártyák
Alkalmazás
Az alábbiakban említjük a következő alkalmazásokat
1. Együttműködés a Talenddel
- Győződjön meg arról, hogy a Java telepítve van és a környezeti változók be vannak-e állítva.
- Töltse le a nyílt forráskódú szoftvert a Talend webhelyről és telepítse a szoftvert.
- Hozzon létre egy új projektet, és fejezze be a telepítést
- A Talend megnyílik a designer fülön.
- A Talend egy eclipse alapú eszköz, és az összetevőket el lehet húzni a palettáról, vagy rákattinthat, és beírhatja az összetevők nevét.
2. Az első feladat Fájl olvasása
- Keresse meg a tFileinputdelimited összetevőt. Ezt az összetevőt az elválasztott fájlok olvasására használják.
- Helyezze a tfileinputdelimited komponenst. Keresse meg a tlogrow-t, és helyezze el a munkatervezőbe.
- Kattintson a jobb gombbal a tfileinputdelimited elemre, válassza a sor-> main elemet, és húzzon egy sort a tlogrow-hoz.
- A komponensben a fül kiválasztja az olvasni kívánt fájl elérési útját, és a sor elválasztót jelöli \ n néven. Ha a fájlban elválasztó van, említheti a határolót.
- Kattintson a sémára, és adja meg az oszloptípus részleteit, vagy elolvashatja az egész sort karakterlánccal, egyetlen oszloppal, és a határoló értékének üresnek kell lennie.
- A fejléc és a lábléc is kihagyható.
- A tlogrow összetevőben válassza ki, hogy miként látja az adatokat. Táblázat vagy egysoros formátum.
- A tlogrow a kimenetet jeleníti meg a futókonzolban.
- A tfileinputdelimited és a tlogrow összekapcsolása után futtassa a feladatot a Run fülről.
- A nyomtatott konzolban láthatja a fájl tartalmát.
3. Egy második munka a Tmap segítségével
- Olvassa el a fájlt és szűrje le különféle kimeneti fájlokba.
- Olvassa el a tfileinputdelimited komponensben lévő fájlt, rekordként egy oszlop sémával.
- Tmap-összetevő - Ez az elem segít az adatok átalakításában olyan beépített funkciókkal, mint a keresés, csatlakozások stb.
- A tmap-ben hozzon létre két output1 és out2 kimenetet.
- Az Out1 szűrőben adja hozzá a 3. sor.record.tartalmat („talend”), és húzza a rekordot az out1-re.
- Húzza a rekordvonalat más out2-re.
- A tmap-ből vegye ki a fő sorokat, és csatlakozzon két tfileoutputdelimited-hez.
- out1 link az egyik tfileoutputdelimited1 fájlhoz1.txt, és out2 a másik tfileoutputdelimited2 fájlhoz2.txt.
- A txt rekordok tartalmazzák a talend-et.
- A txt más névvel rendelkező rekordokkal rendelkezik.
4. Beépített és tároló
- A beépített eszköz azt jelenti, hogy minden alkalommal meg kell állítania az adatbázishoz való kapcsolódás sémáját vagy részleteit.
- A tároló hasznos lehet a részletek mentésében a metaadatokba, így ugyanazokat az adatokat minden alkalommal újra felhasználhatja, anélkül, hogy minden alkalommal manuálisan beírná az adatokat. A metaadatokban fájlsémákat, adatbázis-kapcsolatokat, Hadoop-kapcsolatot, kaptárkapcsolatot, s3-kapcsolatot és még sok másot menthet.
A Talend Open Studio alkotóelemei
Az alábbiakban bemutatjuk a Talend Open Studio alábbi összetevőit
1. tFileList
- Ez az összetevő felsorolja a megadott fájlmaszk mintával rendelkező könyvtárban vagy mappában lévő fájlokat.
2. tMysqlConnection
- Ezt az összetevőt a mysql adatbázishoz való kapcsolódáshoz használják.
- A Mysql-összetevők ezt a kapcsolatot használhatják az adatbázishoz történő kapcsolódás egyszerű beállításához.
3. tMysqlinput
- Ez az összetevő elősegíti a mysql adatbázis lekérdezés futtatását és a táblázat vagy oszlopok beolvasását. Ez az összetevő a lekérdezések kiválasztására és a részletek beolvasására szolgál.
4. tMysqlOutput
- Ez az összetevő az adatok beszúrására vagy frissítésére szolgál a Mysql adatbázisban.
5. tprejob
- Ez az összetevő az első, amely végrehajtja a feladatot, és összekapcsolható más komponensekkel, ha a subjob ok rendben van.
6. tpostjob
- Ez az összetevő utoljára hajtja végre a feladatot. Ezt összekapcsolhatja a kapcsolatra szoros összetevőkkel.
7. tlogcatcher
- Ez az összetevő elkapja a figyelmeztetést és a hibákat a munkában.
- A hibakezelési technikában használt legfontosabb alkotóelem.
- A hibanaplókat ezen összetevő segítségével lehet írni, a tfileoutputdelimited mellett.
- Több mint 800 alkatrész van.
Kontextusváltozó
- A környezeti változók olyan változók, amelyek bárhol felhasználhatók a feladatban.
- Értékeket tárol, és továbbadható egy másik feladatra is, trun összetevő használatával.
- A kontextusváltozók felhasználása esetén megváltoztathatjuk az értéket különböző célokra.
- Például rendelkezhetünk értékkészlettel a fejlesztési kontextuscsoporthoz és más, a termelési kontextusértékekkel.
- Ilyen módon nem kell megváltoztatnunk a feladatot, csak elegendő a környezet paramétereinek megváltoztatása.
Munka felépítése
- Munka felépítéséhez kattintson a jobb gombbal a feladatra, és válassza a Munka felépítése lehetőséget.
- Az összeállítási feladatot a TAC-ban importálhatja.
- A Talend Felügyeleti konzolban ütemeznie kell egy feladatot a feladatkészlet-függőség kiváltására is.
- A feladatot a Nexus tárházból is el lehet importálni egy műtárgy segítségével.
Hozzon létre egy feladatot a TAC-ban
- Nyitott munkavezető a TAC-ban
- Kattintson az új feladatokra, és válassza ki a normál vagy tárgyi feladatokat.
- Importálja a készített munkát, vagy válasszon a nexus közül.
- Válassza ki a job szervert, amelyben a talend futni fog.
- Mentse el a feladatot.
- Most telepítheti és futtathatja a munkát.
Következtetés - Talend Open Studio
„Egyszerűsítse az ETL-t és az ELT-t a vezető ingyenes, nyílt forráskódú ETL-eszközzel a nagy adatok számára.” - a nyitott stúdió címkéje. A Talend Bigdata számos összetevővel rendelkezik a hatalmas adatok kezelésére. Normál, Bigdata, Bigdata streaming jobok a Talendben elérhető különféle típusú munkák. A Bigdata feladatok létrehozhatók egy szikra vagy térképkezelő keretben.
Ajánlott cikkek
Ez a Talend Open Studio útmutatója. Itt tárgyaljuk a Talend Open Studio előnyeit, alkalmazásait és összetevőit. Lehet, hogy megnézi a következő cikkeket is, ha többet szeretne megtudni -
- Útmutató a Talend adatintegrációhoz
- Fontos Talend interjúkérdések
- Talend vs Mulesoft: Különbségek
- Talend vs Pentaho: 8 hasznos összehasonlítás a tanuláshoz