Bevezetés az adatkeretekbe R
Az adatkeret egy 2D (kétdimenziós) tömbszerű struktúra, amelyben különféle adattípusok, például karakterek, numerikus stb. Vannak elfogadva. Az adatkeret egy lista részhalmaza, amelynek minden összetevője azonos hosszúságú. Alapvetően az adatkeret egy táblázat, amelyben minden oszlop egy változó értékeit tartalmazza, és minden sor egy-egy értékkészletet tartalmaz minden oszlopból.
Vannak az adatkeret néhány jellemzője.
- Az oszlop neve kötelező
- A sorneveknek egyedinek kell lenniük
- Az egyes oszlopok számának azonosnak kell lennie
Az adatkeretek létrehozásának lépései R
Kezdjük az alább ismertetett adatkeret létrehozásával,
1. lépés: Hozzon létre egy osztály adatkeretét az iskolában.
Kód:
tenthclass = data.frame(roll_number = c(1:5), Name = c("John", "Sam", "Casey", "Ronald", "Mathew"),
Marks = c(77, 87, 45, 68, 95), stringsAsFactors = FALSE)
print(tenthclass)
Amikor ezt a kódot futtatjuk, egy ilyen adatkeretet kapunk.
Kimenet:
Ebben a példában az adatkeret nagyon kicsi, de a valós életben a probléma kezelésekor rengeteg adatunk van. Tehát az adatok szerkezetének megértéséhez átadjuk a Str () függvényt.
2. lépés: Az alábbi sort adjuk hozzá kódunkhoz.
Kód:
Str(tenthclass)
A teljes kód futtatása után kimenetet kapunk.
Kimenet:
A fenti kimenet azt jelenti, hogy 5 megfigyeléssel rendelkezünk 3 változóról. Ezután elmagyarázza az egyes változók adattípusát. Mint a példánkban, a tekercs száma egész szám, a név karakter és a jelek számozva vannak.
Ha megértjük az adatok szerkezetét, akkor átadjuk az alább említett kódot az adatok statisztikai megértése érdekében.
3. lépés: Most egy összefoglaló () függvényt fogunk használni
Kód:
summary(tenthclass)
Kimenet:
Az összefoglaló az adatok jobb megértését szolgálja. Azt fogja mondani, hogy medián, kvartilis, Max és Min értéket jelent. Ezek a dolgok segítenek nekünk jobb döntéshozatalban.
Hogyan lehet adatokat kinyerni az adatkeretekből R-ben?
Itt folytatjuk a fenti esetet. Tegyük fel, hogy szeretnénk tudni a tizedik osztályos tanuló nevét, csak a nevét. Szóval hogyan fogjuk kinyerni?
Adatkeretünk így néz ki.
roll_number névjegyek
1 1 John 77
2 2 Sam 87
3 3 Casey 45
4 4 Ronald 68
5 5 Mathew 95
Annak érdekében, hogy csak a nevet outputként kapjuk, átadjuk a következő kódot.
Kód:
onlyname = tenthclass$Name
print(onlyname)
Kimenet:
Ha megtöri a kódot, akkor csak behelyezzük a dollárjelet az adatkeretünk és a változó neve közé, amelyet kimenetként akarunk használni.
Most vegyük figyelembe a helyzetet: a tanár mindent tudni akar a 2. tekercsről, például hogy mi a neve és mennyit szerzett.
Itt mindenre szükségünk van a 2. tekercstől, így továbbadjuk az alább említett kódot.
Kód:
result_rollnumber2 = tenthclass(c(2), c(1:3)) print(result_rollnumber2)
Kimenet:
Bontsa ki az Adatkeretek részben
Az adatkeret növelhető és csökkenthető az oszlopok és sorok hozzáadásával vagy törlésével.
1. Adjon hozzá sort
Két adatkeretünk van. Az egyik adatkeret a tizedik A osztályba tartozik, a másik az a keret a tizedik B osztályba tartozik. Ezek a különböző szakaszok egyetlen osztályba egyesülnek.
1. példa: 10 A osztály
Kód:
tenthclass_sectionA = data.frame(roll_number = c(1:5),
Name = c("John", "Sam", "Casey", "Ronald", "Mathew"),
Marks = c(77, 87, 45, 68, 95), stringsAsFactors = FALSE)
print(tenthclass_sectionA)
Kimenet:
2. példa: 10 B osztály
Kód:
tenthclass_sectionB = data.frame(roll_number = c(6:10), Name = c("Ria", "Justin", "Bon", "Tim", "joe"),
Marks = c(68, 98, 54, 68, 42), stringsAsFactors = FALSE)
print(tenthclass_sectionB)
Kimenet:
3. példa: rbind () függvény
Most össze kell vonnunk mindkét osztályt egyetlen osztályba. Az rbind () függvényt használjuk itt. Az új sor hozzáadásakor az egyetlen korlátozás az, hogy az új sorokat a meglévő adatkerettel megegyező struktúrába kell hoznunk.
Kód:
new_tenthclass = rbind(tenthclass_sectionA, tenthclass_sectionB)
print(new_tenthclass)
Kimenet:
2. Adjon hozzá oszlopot
Most fontolja meg egy esetet, ahol a 10. osztály minden egyes tanulójának vércsoport-adatait hozzá kell adnunk. Új oszlopot adunk hozzá és „Blood_group” -nak nevezzük.
Adatkeretünk így néz ki.
Kód:
tenthclass = data.frame(roll_number = c(1:5), Name = c("John", "Sam", "Casey", "Ronald", "Mathew"),
Marks = c(77, 87, 45, 68, 95), stringsAsFactors = FALSE)
print(tenthclass)
Kimenet:
Kód:
tenthclass$Blood_group = c("O", "AB", "B+", "A+", "AB")
print(tenthclass)
Kimenet:
Törölje a sort és az oszlopot az adatkeretből
A sor és az oszlop törléséhez az adatkeretből a következő kód implementációt használjuk.
1. Törölje az oszlopot
Kód:
print(tenthclass)
Kimenet:
Ebben az adatkeretben, ha törölnünk kell a vércsoport-változót (a jobb szélső oszlop), akkor átadjuk az alábbi kódot.
Kód:
tenthclass$Blood_group = NULL
print(tenthclass)
Kimenet:
A NULL parancs megkerülésével közvetlenül eltávolíthatjuk a változót az adatkeretünkből.
2. Törölje a sort
Kód:
print(tenthclass)
Kimenet:
Most fontolja meg egy olyan helyzetet, ahol nincs szükségünk János jelölésére, tehát el kell távolítani a legfelső sort.
Kód:
tenthclass = tenthclass(-1, ) print(tenthclass)
Kimenet:
Frissítse az adatokat az adatkeretben
Kód:
print(tenthclass)
Kimenet:
Tegyük fel, hogy Sam 98 pontot kapott, de adatkereteink szerint 87-et kapunk. Tehát átadhatjuk az alábbi kódot annak kijavításához.
Kód:
tenthclass$Marks(2) = 98
print(tenthclass)
Kimenet:
Következtetés
Az adatkeretek a problémameghatározás nagyon gyakori formája. Ez egy azonos számú sor egyedi változó-azonosítókkal rendelkező változójának listája. Ez a cikk segítséget nyújt abban, hogy megismerjük, hogyan adhatunk hozzá sort, oszlopot, törölhetünk sort, törölhetünk egy oszlopot az adatkeretből, valamint arról, hogyan lehet frissíteni az adatokat az adatkeretben.
Ajánlott cikkek
Ez az útmutató az R-es adatkeretekhez. Itt tárgyaljuk az adatkeretek létrehozásának különféle lépéseit és az R-ben lévő adatok kinyerését az adatkeretekből. A következő cikkeket megnézheti további információkért is -
- Az 5 legfontosabb adattípus az R-ben
- A hasznos R csomagok listája
- R CSV fájlok
- R programfunkciók - Fontosság
- R tényező előnyökkel