Mi a kaptár?
A kaptár adattípusának megértése előtt először megvizsgáljuk a kaptárot. A kaptár a Hadoop adattárolási technikája. A Hadoop a Big data platform adattárolási és feldolgozási szegmense. Kaptár megtartja pozícióját a folytatott adatfeldolgozási technikákkal kapcsolatban. Mint más folytatási környezetekhez, a kaptár folytatható lekérdezésekkel is. A kaptár által kínált legfontosabb feladatok az adatelemzés, az ad-hoc lekérdezés és a tárolt adatok késleltetési szempontból történő összefoglalása, a lekérdezések nagyobb összeget érnek el.
Kaptár adattípusai
Az adattípusok két típusba sorolhatók:
- Primitív adattípusok
- Kollektív adattípusok
1. Primitív adattípusok
Elsődleges eszközök az ősi és a régi. az összes primitívként felsorolt adattípus örökségű. az alább felsorolt fontos primitív adattípus-területek:
típus | Méret (byte) | Példa |
tinyint | 1 | 20 |
smallint | 2 | 20 |
Int | 4 | 20 |
bigint | 8 | 20 |
logikai | Logikai igaz / hamis | HAMIS |
Kettős | 8 | 10, 2222 |
Úszó | 4 | 10, 2222 |
Húr | Karakterek sorozata | ABCD |
Időbélyeg | Egész / float / string | 2012.02.03. 12: 34: 56: 1234567 |
Dátum | Egész / float / string | 2019/02/03 |
A kaptár adattípusai a JAVA használatával valósulnak meg
Például: A Java Int itt használható az Int adattípus megvalósításához.
- A HIVE nem támogatja a karakter tömböket.
- A kaptár elválasztókra támaszkodik a mezők elválasztására, a kaptár a Hadoop-nal történő koordinációval lehetővé teszi az írási teljesítmény és az olvasási teljesítmény növelését.
- Az egyes oszlopok hosszának megadása nem várható el a kaptár adatbázisában.
- A karakterláncok betűjeleket megfogalmazhatunk akár dupla idézőjelek (”) egyszeres idézőjelek (') között.
- A kaptár újabb verziójában a Varchar típusok kerülnek bevezetésre és ezek span-specifikátort alkotnak (1. és 65535 közepette), tehát egy karakterlánc esetében ez a legnagyobb értéktartomány, amelybe belefér. Ha egy ezt a hosszot meghaladó értéket illesztenek be, akkor az értékek jobb szélső elemeit levágják. A karakter hossza felbontás, a karakterlánc által vezérelt kódpontok számával.
- Az összes egész literál (TINYINT, SMALLINT, BIGINT) alapvetõen INT adattípusnak tekinthetõ, és csak a hossza haladja meg a tényleges int szintet, amelybõl átalakul BIGINT vagy bármilyen más megfelelõ típus.
- A tizedes literál megadott értékeket és kiemelkedő gyűjtést biztosít a lebegőpontos értékekhez, a DOUBLE típushoz képest. Itt a numerikus értékeket a pontos formájukon tárolják, de kettős esetén nem pontosan számértékekként tárolják.
Dátumérték-leadási folyamat
Casting végre | Eredmény |
leadott (dátum dátumként) | Ugyanaz a dátumérték |
leadott (időbélyegző dátumként) | A helyi időzónát használják itt az év / hónap / dátum értékek értékelésére, és kinyomtatják a kimeneten. |
leadott (string mint dátum) | A leadás eredményeként a megfelelő dátumértéket kérjük, de gondoskodnunk kell arról, hogy a karakterlánc „ÉÉÉÉ-HH-NN” formátumban legyen. |
leadva (dátum időbélyegként) | A jelenlegi helyi időzóna szerint ehhez az casting folyamathoz időbélyeg-értéket kell létrehozni |
leadott (dátum húrként) | ÉÉÉÉ-HH-NN alakul ki az év / hónap / dátum értékre, és a kimenet string formátumú lesz. |
2. Adatgyűjtési típusok
A kaptárban négy gyűjtési adattípus található, amelyeket összetett adattípusnak is neveznek.
- SOR
- TÉRKÉP
- STRUCT
- UNIONTYPE
1. ARRAY: Általános típusú elemek sorozata, amelyek indexálhatók és az index értéke nullától kezdődik.
Kód:
array ('anand', 'balaa', 'praveeen');
2. TÉRKÉP: Ezek olyan elemek, amelyek deklarálása és beolvasása kulcs-érték párok felhasználásával történik.
Kód:
'firstvalue' -> 'balakumaran', 'lastvalue' -> 'pradeesh' is represented as map('firstvalue', 'balakumaran', 'last', 'PG'). Now 'balakumaran ' can be retrived with map('first').
3. SZERKEZET: A C-hez hasonlóan, az építmény olyan adattípus, amely felsorolja a jelölt mezők halmazát, és bármilyen más adattípus lehet.
Kód:
For a column D of type STRUCT (Y INT; Z INT) the Y field can be retrieved by the expression DY
4. UNIONTYPE: Az Unió a megadott adattípusok bármelyikét megtarthatja.
Kód:
CREATE TABLE test(col1 UNIONTYPE )
CREATE TABLE test(col1 UNIONTYPE )
Kimenet:
Az alábbiakban felsoroljuk a komplex adattípusokban használt különféle elválasztókat,
Delimiter | Kód | Leírás |
\ n | \ n | Rekord vagy sorhatároló |
A (Ctrl + A) | \ 001 | Mezőhatároló |
B (Ctrl + B) | \ 002 | SZERKEZETEK ÉS ARRÁK |
C (Ctrl + C) | \ 003 | a MAP |
Példa komplex adattípusokra
Az alábbiakban bemutatjuk a komplex adattípusokat:
1. A TÁBLÁZAT LÉTREHOZÁSA
Kód:
create table store_complex_type (
emp_id int,
name string,
local_address STRUCT,
country_address MAP,
job_history array)
row format delimited fields terminated by ', '
collection items terminated by ':'
map keys terminated by '_';
2. MINTA TÁBLÁZATI ADATOK
Kód:
100, Shan, 4th : CHN : IND : 600101, CHENNAI_INDIA, SI : CSC
101, Jai, 1th : THA : IND : 600096, THANJAVUR_INDIA, HCL : TM
102, Karthik, 5th : AP : IND : 600089, RENIKUNDA_INDIA, CTS : HCL
3. AZ ADATOK TÖRLÉSE
Kód:
load data local inpath '/home/cloudera/Desktop/Hive_New/complex_type.txt' overwrite into table store_complex_type;
4. AZ ADATOK ÁTTEKINTÉSE
Kód:
select emp_id, name, local_address.city, local_address.zipcode, country_address('CHENNAI'), job_history(0) from store_complex_type where emp_id='100';
Összegzés - kaptár adattípusai
Ha relációs DB-vel vagyunk, és a Sequel összekapcsolja a HIVE-t, a szokásos SQL-adatbázisok minden lényeges tulajdonságát nagyon kifinomult módon kínálja, ami ezt teszi a Hadoop hatékonyabb strukturált adatfeldolgozó egységei közé.
Ajánlott cikkek
Ez egy útmutató a kaptár adattípusához. Itt a kaptáradat-típusok két típusát tárgyaljuk megfelelő példákkal. Megnézheti más kapcsolódó cikkeket is, ha többet szeretne megtudni -
- Mi a kaptár?
- Kaptár Alternatívák
- Kaptár beépített funkciói
- Kaptárinterjúval kapcsolatos kérdések
- PL / SQL adattípusok
- Példák a Python beépített funkcióira
- Különböző típusú SQL adatok példákkal