Mi a kaptár?

A kaptár adattípusának megértése előtt először megvizsgáljuk a kaptárot. A kaptár a Hadoop adattárolási technikája. A Hadoop a Big data platform adattárolási és feldolgozási szegmense. Kaptár megtartja pozícióját a folytatott adatfeldolgozási technikákkal kapcsolatban. Mint más folytatási környezetekhez, a kaptár folytatható lekérdezésekkel is. A kaptár által kínált legfontosabb feladatok az adatelemzés, az ad-hoc lekérdezés és a tárolt adatok késleltetési szempontból történő összefoglalása, a lekérdezések nagyobb összeget érnek el.

Kaptár adattípusai

Az adattípusok két típusba sorolhatók:

  • Primitív adattípusok
  • Kollektív adattípusok

1. Primitív adattípusok

Elsődleges eszközök az ősi és a régi. az összes primitívként felsorolt ​​adattípus örökségű. az alább felsorolt ​​fontos primitív adattípus-területek:

típus Méret (byte) Példa
tinyint 1 20
smallint 2 20
Int 4 20
bigint 8 20
logikai Logikai igaz / hamis HAMIS
Kettős 8 10, 2222
Úszó 4 10, 2222
Húr Karakterek sorozata ABCD
Időbélyeg Egész / float / string 2012.02.03. 12: 34: 56: 1234567
Dátum Egész / float / string 2019/02/03

A kaptár adattípusai a JAVA használatával valósulnak meg

Például: A Java Int itt használható az Int adattípus megvalósításához.

  • A HIVE nem támogatja a karakter tömböket.
  • A kaptár elválasztókra támaszkodik a mezők elválasztására, a kaptár a Hadoop-nal történő koordinációval lehetővé teszi az írási teljesítmény és az olvasási teljesítmény növelését.
  • Az egyes oszlopok hosszának megadása nem várható el a kaptár adatbázisában.
  • A karakterláncok betűjeleket megfogalmazhatunk akár dupla idézőjelek (”) egyszeres idézőjelek (') között.
  • A kaptár újabb verziójában a Varchar típusok kerülnek bevezetésre és ezek span-specifikátort alkotnak (1. és 65535 közepette), tehát egy karakterlánc esetében ez a legnagyobb értéktartomány, amelybe belefér. Ha egy ezt a hosszot meghaladó értéket illesztenek be, akkor az értékek jobb szélső elemeit levágják. A karakter hossza felbontás, a karakterlánc által vezérelt kódpontok számával.
  • Az összes egész literál (TINYINT, SMALLINT, BIGINT) alapvetõen INT adattípusnak tekinthetõ, és csak a hossza haladja meg a tényleges int szintet, amelybõl átalakul BIGINT vagy bármilyen más megfelelõ típus.
  • A tizedes literál megadott értékeket és kiemelkedő gyűjtést biztosít a lebegőpontos értékekhez, a DOUBLE típushoz képest. Itt a numerikus értékeket a pontos formájukon tárolják, de kettős esetén nem pontosan számértékekként tárolják.

Dátumérték-leadási folyamat

Casting végre Eredmény
leadott (dátum dátumként) Ugyanaz a dátumérték
leadott (időbélyegző dátumként) A helyi időzónát használják itt az év / hónap / dátum értékek értékelésére, és kinyomtatják a kimeneten.
leadott (string mint dátum) A leadás eredményeként a megfelelő dátumértéket kérjük, de gondoskodnunk kell arról, hogy a karakterlánc „ÉÉÉÉ-HH-NN” formátumban legyen.
leadva (dátum időbélyegként) A jelenlegi helyi időzóna szerint ehhez az casting folyamathoz időbélyeg-értéket kell létrehozni
leadott (dátum húrként) ÉÉÉÉ-HH-NN alakul ki az év / hónap / dátum értékre, és a kimenet string formátumú lesz.

2. Adatgyűjtési típusok

A kaptárban négy gyűjtési adattípus található, amelyeket összetett adattípusnak is neveznek.

  • SOR
  • TÉRKÉP
  • STRUCT
  • UNIONTYPE

1. ARRAY: Általános típusú elemek sorozata, amelyek indexálhatók és az index értéke nullától kezdődik.

Kód:

array ('anand', 'balaa', 'praveeen');

2. TÉRKÉP: Ezek olyan elemek, amelyek deklarálása és beolvasása kulcs-érték párok felhasználásával történik.

Kód:

'firstvalue' -> 'balakumaran', 'lastvalue' -> 'pradeesh' is represented as map('firstvalue', 'balakumaran', 'last', 'PG'). Now 'balakumaran ' can be retrived with map('first').

3. SZERKEZET: A C-hez hasonlóan, az építmény olyan adattípus, amely felsorolja a jelölt mezők halmazát, és bármilyen más adattípus lehet.

Kód:

For a column D of type STRUCT (Y INT; Z INT) the Y field can be retrieved by the expression DY

4. UNIONTYPE: Az Unió a megadott adattípusok bármelyikét megtarthatja.

Kód:

CREATE TABLE test(col1 UNIONTYPE ) CREATE TABLE test(col1 UNIONTYPE )

Kimenet:

Az alábbiakban felsoroljuk a komplex adattípusokban használt különféle elválasztókat,

Delimiter Kód Leírás
\ n \ n Rekord vagy sorhatároló
A (Ctrl + A) \ 001 Mezőhatároló
B (Ctrl + B) \ 002 SZERKEZETEK ÉS ARRÁK
C (Ctrl + C) \ 003 a MAP

Példa komplex adattípusokra

Az alábbiakban bemutatjuk a komplex adattípusokat:

1. A TÁBLÁZAT LÉTREHOZÁSA

Kód:

create table store_complex_type (
emp_id int,
name string,
local_address STRUCT,
country_address MAP,
job_history array)
row format delimited fields terminated by ', '
collection items terminated by ':'
map keys terminated by '_';

2. MINTA TÁBLÁZATI ADATOK

Kód:

100, Shan, 4th : CHN : IND : 600101, CHENNAI_INDIA, SI : CSC
101, Jai, 1th : THA : IND : 600096, THANJAVUR_INDIA, HCL : TM
102, Karthik, 5th : AP : IND : 600089, RENIKUNDA_INDIA, CTS : HCL

3. AZ ADATOK TÖRLÉSE

Kód:

load data local inpath '/home/cloudera/Desktop/Hive_New/complex_type.txt' overwrite into table store_complex_type;

4. AZ ADATOK ÁTTEKINTÉSE

Kód:

select emp_id, name, local_address.city, local_address.zipcode, country_address('CHENNAI'), job_history(0) from store_complex_type where emp_id='100';

Összegzés - kaptár adattípusai

Ha relációs DB-vel vagyunk, és a Sequel összekapcsolja a HIVE-t, a szokásos SQL-adatbázisok minden lényeges tulajdonságát nagyon kifinomult módon kínálja, ami ezt teszi a Hadoop hatékonyabb strukturált adatfeldolgozó egységei közé.

Ajánlott cikkek

Ez egy útmutató a kaptár adattípusához. Itt a kaptáradat-típusok két típusát tárgyaljuk megfelelő példákkal. Megnézheti más kapcsolódó cikkeket is, ha többet szeretne megtudni -

  1. Mi a kaptár?
  2. Kaptár Alternatívák
  3. Kaptár beépített funkciói
  4. Kaptárinterjúval kapcsolatos kérdések
  5. PL / SQL adattípusok
  6. Példák a Python beépített funkcióira
  7. Különböző típusú SQL adatok példákkal

Kategória: