Az R adatkeret áttekintése
Az adatkeretek az azonos hosszúságú vektorok listáját jelentik. A mátrix és az adatkeret közötti különbség azonban az, hogy az adatkeretek különféle típusú adatokat fogadnak el. (Karakter, numerikus stb.) Ebben a témában megismerjük az R Data Frame-et.
Az adatkeretek használatának előnyei
- Elosztott adatgyűjtés és szervezés.
- Jobb optimalizálású, mint egy relációs adatbázis.
- Különböző, heterogén adatokkal rendelkezik.
Adatkeret létrehozása R-ben
Adatkeretet hozunk létre. Az alábbiakban bemutatjuk az adatkeret deklarálásának példáját.
Data_frame <- data.frame (variable 1, variable 2, variable n…)
A fenti példában nem határoztuk meg a változókat. Most nézzük meg, hogyan rendelünk értékeket a változókhoz, és tároljuk azokat az adatkeretben.
Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
print(Data_frame)
Kimenet:
Szám alfa logikai
1 2 x IGAZ
2 3 y TRUE
3 4 z HAMIS
Az adatkeret felépítése
Ha meg akarjuk tudni egy adott adatkeret szerkezetét. Használhatjuk az alábbi funkciót.
Csillag ()
str(Data_frame)
Kimenet:
Szám: num 2 3 4
alfa: w / 3 tényező: „x”, „y”, „z”: 1 2 3
Booleans: logi TRUE TRUE FALSE
Specifikus adatok kinyerése az adatkeretből
1. Az Oszlop név használata
Egy adatkészletet kinyerhetünk az adatkeretből.
A fenti példánkból csak az első oszlopot vonjuk ki az adatkeretből, amely a Szám.
Data_ frame <- data. Frame(Number)
Kimenet:
Szám
1 2
2 3
3 4
2. A sorok használata
Kibonthatjuk az adatokat a sorokból, az alábbiak szerint.
Tegyük fel, hogy csak a Szám oszlop két sorát akarjuk kinyomtatni.
Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
print(Data_frame)
output <- Data_frame(1:2, ) print(output)
Kimenet:
Szám alfa logikai
1 2 x IGAZ
2 3 y TRUE
3 4 z HAMIS
------------
Szám alfa logikai
1 2 x IGAZ
2 3 y TRUE
Megfigyelhetjük az első és a második kimenet különbségét.
3. Meghatározott sorok és oszlopok kinyomtatása
Külön sorokat és oszlopokat is kinyomtathatunk.
Az alábbi példában az első és a második sort, oszlopot nyomtatjuk ki
Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
print(Data_frame)
output <- Data_frame(c(1, 2), c(1, 2)) print(output)
Kimenet:
Szám alfa logikai
1 2 x IGAZ
2 3 y TRUE
3 4 z HAMIS
-------------
Alfa szám
1 2 x
2 3 év
4. További oszlop hozzáadása az adatkerethez
Felvehetünk egy további oszlopot az értékekkel együtt az adatkeretbe.
Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
Data_frame$class <- c("A", "B", "C")
out <- Data_frame
print(out)
Kimenet:
Szám alfa logikai osztály
1 2 x IGAZ A
2 3 y TRUE B
3 4 z HAMIS C
5. Sor hozzáadása az adatkerethez
Az rbind funkcióval új sort adunk a meglévő adatkerethez.
Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
Data_frame$class <- c("A", "B", "C")
out <- rbind(Data_frame, c(5, "x", FALSE, "D"))
print(out)
Kimenet:
Szám alfa logikai osztály
1 2 x IGAZ A
2 3 y TRUE B
3 4 z HAMIS C
4 5 x FALSE D
6. Mindkét adatkeret kombinálása
Két adatkeretet kombinálhatunk egyetlen kimenet előállításához.
Két adatkeret kombinálásához ugyanannak az oszlopnak kell lennie az adatkeretekhez.
Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame1 <- data.frame(Number, alpha, Booleans)
print(Data_frame1)
Number <- c(4, 5, 6)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame2 <- data.frame(Number, alpha, Booleans)
print(Data_frame2)
out <- rbind(Data_frame1, Data_frame2)
print(out)
Kimenet:
Szám alfa logikai
1 2 x IGAZ
2 3 y TRUE
3 4 z HAMIS
--------------
Szám alfa logikai
1 4 x IGAZ
2 5 y igaz
3 6 z HAMIS
--------------
Szám alfa logikai
1 2 x IGAZ
2 3 y TRUE
3 4 z HAMIS
4 4 x IGAZ
5 5 y TRUE
6 6 z HAMIS
Az adatkeretek ellenőrzése
Az alábbiakban bemutatjuk az adatkeretek ellenőrzésének különböző módjait, és információkat nyújtunk az adatkeretekről, akárcsak a fenti csillag funkciót.
1. Nevek - megadja a változók nevét az adatkeretben
Szintaxis : names(data frame name)
Példa
Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
names(Data_frame)
kimenet : (1) “Szám” “alfa” “Booleans”
2. Összegzés - az adatkeret statisztikáit nyújtja.
Szintaxis: summary(data frame name)
Példa
Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
summary(Data_frame)
Kimenet:
Szám alfa logikai
Min. : 2, 0 x: 1 Üzemmód: logikus
1. negyedév: 2, 5 év y: 1 HAMIS: 1
Medián: 3, 0 z: 1 IGAZ: 2
Átlag: 3, 0 NA: 0
3. negyedév: 3.5
Max. : 4, 0
3. Fej - az első néhány sor adatait szolgáltatja.
Szintaxis: Head( name of the data frame)
Példa
Number <- c(2, 3, 4, 5, 6, 7, 8, 9, 10, 11)
alpha <- c("x", "y", "z", "a", "b", "c", "d", "f", "g", "j")
Booleans <- c(TRUE, TRUE, FALSE, TRUE, FALSE, FALSE, FALSE, FALSE, FALSE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
head(Data_frame)
Kimenet:
Szám alfa logikai
1 2 x IGAZ
2 3 y TRUE
3 4 z HAMIS
4 5 a IGAZ
5 6 b HAMIS
6 7 c HAMIS
4. Tail - kinyomtatja az adatkeretben az utolsó néhány sort.
Szintaxis: tail( name of the data frame)
Number <- c(2, 3, 4, 5, 6, 7, 8, 9, 10, 11)
alpha <- c("x", "y", "z", "a", "b", "c", "d", "f", "g", "j")
Booleans <- c(TRUE, TRUE, FALSE, TRUE, FALSE, FALSE, FALSE, FALSE, FALSE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
tail(Data_frame)
Kimenet:
Szám alfa logikai
5 6 b HAMIS
6 7 c HAMIS
7 8 d HAMIS
8 9 f FALSE
9 10 g HAMIS
10 11 j HAMIS
Következtetés
Az adatkeretek fontos fogalom az R programozásban. Könnyű, mégis erőteljesen módosítható és könnyen hozzáférhető adatkészleteket hozhat létre. Csakúgy, mint a mátrix, az adatkészletek sorokon és oszlopneveken keresztül is elérhetők, az adatok hozzáadásával és eltávolításával.
Ajánlott cikkek
Ez egy útmutató az R Data Frame-hez. Itt az adatkeret létrehozása az R-ben a struktúrával és a specifikus adatok kinyerése az adatkeretből. Lehet, hogy megnézi a következő cikkeket is, ha többet szeretne megtudni -
- Adattípusok C-ben
- Adattudományi karrier
- Big Data Technologies
- Adattudományi platform
- Java logikai