Az R adatkeret áttekintése

Az adatkeretek az azonos hosszúságú vektorok listáját jelentik. A mátrix és az adatkeret közötti különbség azonban az, hogy az adatkeretek különféle típusú adatokat fogadnak el. (Karakter, numerikus stb.) Ebben a témában megismerjük az R Data Frame-et.

Az adatkeretek használatának előnyei

  • Elosztott adatgyűjtés és szervezés.
  • Jobb optimalizálású, mint egy relációs adatbázis.
  • Különböző, heterogén adatokkal rendelkezik.

Adatkeret létrehozása R-ben

Adatkeretet hozunk létre. Az alábbiakban bemutatjuk az adatkeret deklarálásának példáját.

Data_frame <- data.frame (variable 1, variable 2, variable n…)

A fenti példában nem határoztuk meg a változókat. Most nézzük meg, hogyan rendelünk értékeket a változókhoz, és tároljuk azokat az adatkeretben.

Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
print(Data_frame)

Kimenet:

Szám alfa logikai

1 2 x IGAZ

2 3 y TRUE

3 4 z HAMIS

Az adatkeret felépítése

Ha meg akarjuk tudni egy adott adatkeret szerkezetét. Használhatjuk az alábbi funkciót.

Csillag ()

str(Data_frame)

Kimenet:

Szám: num 2 3 4

alfa: w / 3 tényező: „x”, „y”, „z”: 1 2 3

Booleans: logi TRUE TRUE FALSE

Specifikus adatok kinyerése az adatkeretből

1. Az Oszlop név használata

Egy adatkészletet kinyerhetünk az adatkeretből.

A fenti példánkból csak az első oszlopot vonjuk ki az adatkeretből, amely a Szám.

Data_ frame <- data. Frame(Number)

Kimenet:

Szám

1 2

2 3

3 4

2. A sorok használata

Kibonthatjuk az adatokat a sorokból, az alábbiak szerint.

Tegyük fel, hogy csak a Szám oszlop két sorát akarjuk kinyomtatni.

Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
print(Data_frame)
output <- Data_frame(1:2, ) print(output)

Kimenet:

Szám alfa logikai

1 2 x IGAZ

2 3 y TRUE

3 4 z HAMIS

------------

Szám alfa logikai

1 2 x IGAZ

2 3 y TRUE

Megfigyelhetjük az első és a második kimenet különbségét.

3. Meghatározott sorok és oszlopok kinyomtatása

Külön sorokat és oszlopokat is kinyomtathatunk.

Az alábbi példában az első és a második sort, oszlopot nyomtatjuk ki

Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
print(Data_frame)
output <- Data_frame(c(1, 2), c(1, 2)) print(output)

Kimenet:

Szám alfa logikai

1 2 x IGAZ

2 3 y TRUE

3 4 z HAMIS

-------------

Alfa szám

1 2 x

2 3 év

4. További oszlop hozzáadása az adatkerethez

Felvehetünk egy további oszlopot az értékekkel együtt az adatkeretbe.

Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
Data_frame$class <- c("A", "B", "C")
out <- Data_frame
print(out)

Kimenet:

Szám alfa logikai osztály

1 2 x IGAZ A

2 3 y TRUE B

3 4 z HAMIS C

5. Sor hozzáadása az adatkerethez

Az rbind funkcióval új sort adunk a meglévő adatkerethez.

Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
Data_frame$class <- c("A", "B", "C")
out <- rbind(Data_frame, c(5, "x", FALSE, "D"))
print(out)

Kimenet:

Szám alfa logikai osztály

1 2 x IGAZ A

2 3 y TRUE B

3 4 z HAMIS C

4 5 x FALSE D

6. Mindkét adatkeret kombinálása

Két adatkeretet kombinálhatunk egyetlen kimenet előállításához.

Két adatkeret kombinálásához ugyanannak az oszlopnak kell lennie az adatkeretekhez.

Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame1 <- data.frame(Number, alpha, Booleans)
print(Data_frame1)
Number <- c(4, 5, 6)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame2 <- data.frame(Number, alpha, Booleans)
print(Data_frame2)
out <- rbind(Data_frame1, Data_frame2)
print(out)

Kimenet:

Szám alfa logikai
1 2 x IGAZ
2 3 y TRUE
3 4 z HAMIS
--------------
Szám alfa logikai
1 4 x IGAZ
2 5 y igaz
3 6 z HAMIS

--------------

Szám alfa logikai
1 2 x IGAZ
2 3 y TRUE
3 4 z HAMIS
4 4 x IGAZ
5 5 y TRUE
6 6 z HAMIS

Az adatkeretek ellenőrzése

Az alábbiakban bemutatjuk az adatkeretek ellenőrzésének különböző módjait, és információkat nyújtunk az adatkeretekről, akárcsak a fenti csillag funkciót.

1. Nevek - megadja a változók nevét az adatkeretben

Szintaxis : names(data frame name)

Példa

Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
names(Data_frame)

kimenet : (1) “Szám” “alfa” “Booleans”

2. Összegzés - az adatkeret statisztikáit nyújtja.

Szintaxis: summary(data frame name)

Példa

Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
summary(Data_frame)

Kimenet:

Szám alfa logikai
Min. : 2, 0 x: 1 Üzemmód: logikus
1. negyedév: 2, 5 év y: 1 HAMIS: 1
Medián: 3, 0 z: 1 IGAZ: 2
Átlag: 3, 0 NA: 0
3. negyedév: 3.5
Max. : 4, 0

3. Fej - az első néhány sor adatait szolgáltatja.

Szintaxis: Head( name of the data frame)

Példa

Number <- c(2, 3, 4, 5, 6, 7, 8, 9, 10, 11)
alpha <- c("x", "y", "z", "a", "b", "c", "d", "f", "g", "j")
Booleans <- c(TRUE, TRUE, FALSE, TRUE, FALSE, FALSE, FALSE, FALSE, FALSE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
head(Data_frame)

Kimenet:

Szám alfa logikai
1 2 x IGAZ
2 3 y TRUE
3 4 z HAMIS
4 5 a IGAZ
5 6 b HAMIS
6 7 c HAMIS

4. Tail - kinyomtatja az adatkeretben az utolsó néhány sort.

Szintaxis: tail( name of the data frame)

Number <- c(2, 3, 4, 5, 6, 7, 8, 9, 10, 11)
alpha <- c("x", "y", "z", "a", "b", "c", "d", "f", "g", "j")
Booleans <- c(TRUE, TRUE, FALSE, TRUE, FALSE, FALSE, FALSE, FALSE, FALSE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
tail(Data_frame)

Kimenet:

Szám alfa logikai
5 6 b HAMIS
6 7 c HAMIS
7 8 d HAMIS
8 9 f FALSE
9 10 g HAMIS
10 11 j HAMIS

Következtetés

Az adatkeretek fontos fogalom az R programozásban. Könnyű, mégis erőteljesen módosítható és könnyen hozzáférhető adatkészleteket hozhat létre. Csakúgy, mint a mátrix, az adatkészletek sorokon és oszlopneveken keresztül is elérhetők, az adatok hozzáadásával és eltávolításával.

Ajánlott cikkek

Ez egy útmutató az R Data Frame-hez. Itt az adatkeret létrehozása az R-ben a struktúrával és a specifikus adatok kinyerése az adatkeretből. Lehet, hogy megnézi a következő cikkeket is, ha többet szeretne megtudni -

  1. Adattípusok C-ben
  2. Adattudományi karrier
  3. Big Data Technologies
  4. Adattudományi platform
  5. Java logikai

Kategória: