Adatkeretek az R-ben Hogyan lehet adatokat kinyerni az adatkeretekből R-ben?

Tartalomjegyzék:

Anonim

Bevezetés az adatkeretekbe R

Az adatkeret egy 2D (kétdimenziós) tömbszerű struktúra, amelyben különféle adattípusok, például karakterek, numerikus stb. Vannak elfogadva. Az adatkeret egy lista részhalmaza, amelynek minden összetevője azonos hosszúságú. Alapvetően az adatkeret egy táblázat, amelyben minden oszlop egy változó értékeit tartalmazza, és minden sor egy-egy értékkészletet tartalmaz minden oszlopból.

Vannak az adatkeret néhány jellemzője.

  • Az oszlop neve kötelező
  • A sorneveknek egyedinek kell lenniük
  • Az egyes oszlopok számának azonosnak kell lennie

Az adatkeretek létrehozásának lépései R

Kezdjük az alább ismertetett adatkeret létrehozásával,

1. lépés: Hozzon létre egy osztály adatkeretét az iskolában.

Kód:

tenthclass = data.frame(roll_number = c(1:5), Name = c("John", "Sam", "Casey", "Ronald", "Mathew"),
Marks = c(77, 87, 45, 68, 95), stringsAsFactors = FALSE)
print(tenthclass)

Amikor ezt a kódot futtatjuk, egy ilyen adatkeretet kapunk.

Kimenet:

Ebben a példában az adatkeret nagyon kicsi, de a valós életben a probléma kezelésekor rengeteg adatunk van. Tehát az adatok szerkezetének megértéséhez átadjuk a Str () függvényt.

2. lépés: Az alábbi sort adjuk hozzá kódunkhoz.

Kód:

Str(tenthclass)

A teljes kód futtatása után kimenetet kapunk.

Kimenet:

A fenti kimenet azt jelenti, hogy 5 megfigyeléssel rendelkezünk 3 változóról. Ezután elmagyarázza az egyes változók adattípusát. Mint a példánkban, a tekercs száma egész szám, a név karakter és a jelek számozva vannak.

Ha megértjük az adatok szerkezetét, akkor átadjuk az alább említett kódot az adatok statisztikai megértése érdekében.

3. lépés: Most egy összefoglaló () függvényt fogunk használni

Kód:

summary(tenthclass)

Kimenet:

Az összefoglaló az adatok jobb megértését szolgálja. Azt fogja mondani, hogy medián, kvartilis, Max és Min értéket jelent. Ezek a dolgok segítenek nekünk jobb döntéshozatalban.

Hogyan lehet adatokat kinyerni az adatkeretekből R-ben?

Itt folytatjuk a fenti esetet. Tegyük fel, hogy szeretnénk tudni a tizedik osztályos tanuló nevét, csak a nevét. Szóval hogyan fogjuk kinyerni?

Adatkeretünk így néz ki.

roll_number névjegyek

1 1 John 77

2 2 Sam 87

3 3 Casey 45

4 4 Ronald 68

5 5 Mathew 95

Annak érdekében, hogy csak a nevet outputként kapjuk, átadjuk a következő kódot.

Kód:

onlyname = tenthclass$Name
print(onlyname)

Kimenet:

Ha megtöri a kódot, akkor csak behelyezzük a dollárjelet az adatkeretünk és a változó neve közé, amelyet kimenetként akarunk használni.

Most vegyük figyelembe a helyzetet: a tanár mindent tudni akar a 2. tekercsről, például hogy mi a neve és mennyit szerzett.

Itt mindenre szükségünk van a 2. tekercstől, így továbbadjuk az alább említett kódot.

Kód:

result_rollnumber2 = tenthclass(c(2), c(1:3)) print(result_rollnumber2)

Kimenet:

Bontsa ki az Adatkeretek részben

Az adatkeret növelhető és csökkenthető az oszlopok és sorok hozzáadásával vagy törlésével.

1. Adjon hozzá sort

Két adatkeretünk van. Az egyik adatkeret a tizedik A osztályba tartozik, a másik az a keret a tizedik B osztályba tartozik. Ezek a különböző szakaszok egyetlen osztályba egyesülnek.

1. példa: 10 A osztály

Kód:

tenthclass_sectionA = data.frame(roll_number = c(1:5),
Name = c("John", "Sam", "Casey", "Ronald", "Mathew"),
Marks = c(77, 87, 45, 68, 95), stringsAsFactors = FALSE)
print(tenthclass_sectionA)

Kimenet:

2. példa: 10 B osztály

Kód:

tenthclass_sectionB = data.frame(roll_number = c(6:10), Name = c("Ria", "Justin", "Bon", "Tim", "joe"),
Marks = c(68, 98, 54, 68, 42), stringsAsFactors = FALSE)
print(tenthclass_sectionB)

Kimenet:

3. példa: rbind () függvény

Most össze kell vonnunk mindkét osztályt egyetlen osztályba. Az rbind () függvényt használjuk itt. Az új sor hozzáadásakor az egyetlen korlátozás az, hogy az új sorokat a meglévő adatkerettel megegyező struktúrába kell hoznunk.

Kód:

new_tenthclass = rbind(tenthclass_sectionA, tenthclass_sectionB)
print(new_tenthclass)

Kimenet:

2. Adjon hozzá oszlopot

Most fontolja meg egy esetet, ahol a 10. osztály minden egyes tanulójának vércsoport-adatait hozzá kell adnunk. Új oszlopot adunk hozzá és „Blood_group” -nak nevezzük.

Adatkeretünk így néz ki.

Kód:

tenthclass = data.frame(roll_number = c(1:5), Name = c("John", "Sam", "Casey", "Ronald", "Mathew"),
Marks = c(77, 87, 45, 68, 95), stringsAsFactors = FALSE)
print(tenthclass)

Kimenet:

Kód:

tenthclass$Blood_group = c("O", "AB", "B+", "A+", "AB")
print(tenthclass)

Kimenet:

Törölje a sort és az oszlopot az adatkeretből

A sor és az oszlop törléséhez az adatkeretből a következő kód implementációt használjuk.

1. Törölje az oszlopot

Kód:

print(tenthclass)

Kimenet:

Ebben az adatkeretben, ha törölnünk kell a vércsoport-változót (a jobb szélső oszlop), akkor átadjuk az alábbi kódot.

Kód:

tenthclass$Blood_group = NULL
print(tenthclass)

Kimenet:

A NULL parancs megkerülésével közvetlenül eltávolíthatjuk a változót az adatkeretünkből.

2. Törölje a sort

Kód:

print(tenthclass)

Kimenet:

Most fontolja meg egy olyan helyzetet, ahol nincs szükségünk János jelölésére, tehát el kell távolítani a legfelső sort.

Kód:

tenthclass = tenthclass(-1, ) print(tenthclass)

Kimenet:

Frissítse az adatokat az adatkeretben

Kód:

print(tenthclass)

Kimenet:

Tegyük fel, hogy Sam 98 pontot kapott, de adatkereteink szerint 87-et kapunk. Tehát átadhatjuk az alábbi kódot annak kijavításához.

Kód:

tenthclass$Marks(2) = 98
print(tenthclass)

Kimenet:

Következtetés

Az adatkeretek a problémameghatározás nagyon gyakori formája. Ez egy azonos számú sor egyedi változó-azonosítókkal rendelkező változójának listája. Ez a cikk segítséget nyújt abban, hogy megismerjük, hogyan adhatunk hozzá sort, oszlopot, törölhetünk sort, törölhetünk egy oszlopot az adatkeretből, valamint arról, hogyan lehet frissíteni az adatokat az adatkeretben.

Ajánlott cikkek

Ez az útmutató az R-es adatkeretekhez. Itt tárgyaljuk az adatkeretek létrehozásának különféle lépéseit és az R-ben lévő adatok kinyerését az adatkeretekből. A következő cikkeket megnézheti további információkért is -

  1. Az 5 legfontosabb adattípus az R-ben
  2. A hasznos R csomagok listája
  3. R CSV fájlok
  4. R programfunkciók - Fontosság
  5. R tényező előnyökkel