Bevezetés a Boxplot címkékbe R-ben

A Boxplot címkék segítik az elosztott adatok R-ben történő megjelenítését. A grafikon az átlagot, a mediánt és a varianciát ábrázolja. Az értékeket a boxplot () funkció bemeneteként adják meg. A Boxplot () függvény létrehozza a boxplotot az adott bemeneti adatok segítségével. A Boxplot létrehozható különálló változókhoz vagy csoportokhoz.

A boxplot gráf ábrázolása

  • Öt értékű bemenetre van szükségünk, mint például átlag, szórás, medián, első és harmadik kvartilis.
  • Annak felismerése, hogy vannak-e eltérések az adatokban.
  • Tervezze meg a modellt az adatok ábrázolására.

Paraméterek a boxplot () függvény alatt

  1. képlet: Ez a paraméter lehetővé teszi a numerikus értékek több csoportba öntését.
  2. Data :: Bemeneti adatok, amelyek adatkeretet vagy listát tartalmaznak.
  3. Alkészlet: Opcionális vektorparaméter a részhalmaz megadásához a rajzoláshoz.
  4. xlab: x tengelyes megjegyzés
  5. ylab: y tengely kommentár.
  6. range: range meghatározza a plot kiterjesztéseket.
  7. művelet: adja meg, mi történik, ha null érték van. Vagy ne vegye figyelembe a választ vagy az értéket.

Véletlenszerű adatok létrehozása

Az rnorm () függvény segítségével véletlenszerű mintaadatokat hozhatunk létre.

Most használjuk az rnorm () elemet 10 értékű véletlenszerű mintadatok létrehozásához.

data<-data.frame(Stat1=rnorm(10, mean=3, sd=2))

A fenti parancs 10 véletlenszerű értéket generál 3-as átlaggal és szórással = 2, és tárolja az adatkeretben.

Az adatok kinyomtatásakor az alábbi kimenetet kapjuk.

Stat1

1 2.662022

2 2, 184315

3 5, 974787

4 4.536203

5 4, 808296

6 3, 817232

7 1, 135339

8 1, 583991

9 3.308994

10 4.649170

Ugyanazt a bemenetet (adatot) konvertálhatjuk a plotplot függvénnyé, amely létrehozza a diagramot.

További értékeket adunk az adatokhoz, és megnézjük, hogyan változik a diagram.

data<-data.frame(Stat1=rnorm(10, mean=3, sd=2),
Stat2=rnorm(10, mean=4, sd=1),
Stat3=rnorm(10, mean=6, sd=0.5),
Stat4=rnorm(10, mean=3, sd=0.5))
boxplot(data)

További véletlenszerű értékek hozzáadása és egy grafikon ábrázolása.

Az alábbiakban találhatók az adatváltozóban tárolt értékek.

1. ÁLLAPOT2. ÁLLAM3. ÁLLAM4. STAT
3.7954654, 218645.8275852.157315
0.9117264, 091196.2608112, 26594
3.7078283, 359875, 889453.714557
0.1157724, 51235.9348582, 40645
0.6975562, 159456, 811472.571304
5.1292313, 26986.2500683.025175
5.4041014, 389395.6700612, 9901
1.4550663, 130595.6923232, 69693
0.8686365, 423115.4154352.674768
2, 141133, 907286.2060592.806656

Az alábbiakban a boxplot gráf látható 40 értékkel. 1-7 szám van az y tengelyen és stat1 és stat4 az x tengelyen.

Az x tengelyen a szöveg igazítását megváltoztathatjuk egy másik, las = 2 nevű paraméter használatával.

Az R Boxplot címkék grafikonjának elemzése

A bemenetet megadtuk az adatkeretben, és meglátjuk a fenti diagramot.

Az adatok megértéséhez nézzük meg a stat1 értékeket.

A diagram mind az öt értéket képviseli. A legalacsonyabb értékkel kezdve, majd a harmadik kvartilis, az átlag, az első kvartilis és a minimális értékkel kezdve.

A fenti ábra vízszintesen igazítja a szöveget az x tengelyen.

A szín megváltoztatása

A fenti példák mindegyikében fekete-fehérben láttuk a cselekményt. Nézzük meg, hogyan lehet megváltoztatni a cselekmény színét.

A col = color paramétert hozzáadhatjuk a boxplot () függvényhez.

data<-data.frame(Stat1=rnorm(10, mean=3, sd=2),
Stat2=rnorm(10, mean=4, sd=1),
Stat3=rnorm(10, mean=6, sd=0.5),
Stat4=rnorm(10, mean=3, sd=0.5))
boxplot(data, las=2, col="red")
data

Az alábbiakban pirosul láthatjuk a grafikon kimenetet.

Ugyanazon fenti kóddal több színt is hozzáadhatunk a cselekményhez.

data<-data.frame(Stat1=rnorm(10, mean=3, sd=2),
Stat2=rnorm(10, mean=4, sd=1),
Stat3=rnorm(10, mean=6, sd=0.5),
Stat4=rnorm(10, mean=3, sd=0.5))
boxplot(data, las=2, col=c("red", "blue", "green", "yellow")
data

Címkék hozzáadása

Címkéket adhatunk az xlab, ylab paraméterekkel a boxplot () függvényben.

data<-data.frame(Stat1=rnorm(10, mean=3, sd=2),
Stat2=rnorm(10, mean=4, sd=1),
Stat3=rnorm(10, mean=6, sd=0.5),
Stat4=rnorm(10, mean=3, sd=0.5))
boxplot(data, las=2, xlab="statistics", ylab="random numbers", col=c("red", "blue", "green", "yellow"))
data

A fő paraméter használatával hozzáadhatunk címet a diagramhoz.

data<-data.frame(Stat1=rnorm(10, mean=3, sd=2),
Stat2=rnorm(10, mean=4, sd=1),
Stat3=rnorm(10, mean=6, sd=0.5),
Stat4=rnorm(10, mean=3, sd=0.5))
boxplot(data, las=2, xlab="statistics", ylab="random numbers", main="Random relation", notch=TRUE, col=c("red", "blue", "green", "yellow"))
data

A Notch paraméter a diagram jobb érthetőségét szolgálja. Mivel az stat1 és stat4 mediánjai nem egyeznek meg a fenti grafikonon.

A dobozkészlet előnyei és hátrányai

Előnyök

  • A boxplot címkékkel könnyű a nagy mennyiségű adat összegzése.
  • Megjeleníti a tengely tartományát és az adatok eloszlását.
  • Szimmetriát és ferde állapotot jelöl
  • Segít azonosítani az adatokban szereplő outliereket.

hátrányok

  • Csak numerikus adatokhoz használható.
  • Ha eltérések vannak az adatokban, akkor a doboz ábrája nem lehet pontos.

Megjegyzés:

  1. A grafikonokat megfelelően fel kell címkézni.
  2. A mérlegek fontosak; A skálák megváltoztatása eltérő képet adhat az adatokról.
  3. Az adatok és a helyes skálák összehasonlításának következetesnek kell lennie

Következtetés - R Boxplot címkék

Az adatcsoportosítást a boxplots segítségével megkönnyíti. A Box plot több változót és különféle optimalizálást támogat. A skálákat adatok szerint is változtathatjuk.

A boxplots különféle adatváltozók vagy halmazok összehasonlítására használható.

A boxplot könnyen használható és kényelmes. Következetes adatokra és megfelelő címkékre van szükségünk. A dobozkészleteket gyakran használják az adattudományban és még az értékesítési csapatok is az adatok csoportosítása és összehasonlítása céljából. A Boxplot betekintést nyújt az adatok potenciáljához és az optimalizálásokhoz, amelyeket meg lehet tenni az értékesítés növelése érdekében.

A Boxplot érdekes módszer az adatok tesztelésére, amely betekintést nyújt az adatok hatására és potenciáljára.

Ajánlott cikkek

Ez az útmutató az R Boxplot címkékhez. Itt a Paraméterek a boxplot () függvény alatt tárgyaljuk, hogy hogyan lehet véletlenszerű adatokat létrehozni, megváltoztatva a szín- és grafikonelemzést, valamint az Előnyeket és Hátrányokat. A következő cikkben további információkat is megnézhet -

  1. Az adatok megjelenítésének típusai
  2. Adattárház megvalósítása
  3. Adattudományi technikák
  4. Mi az Data Cube?

Kategória: