Bevezetés a Boxplot címkékbe R-ben
A Boxplot címkék segítik az elosztott adatok R-ben történő megjelenítését. A grafikon az átlagot, a mediánt és a varianciát ábrázolja. Az értékeket a boxplot () funkció bemeneteként adják meg. A Boxplot () függvény létrehozza a boxplotot az adott bemeneti adatok segítségével. A Boxplot létrehozható különálló változókhoz vagy csoportokhoz.
A boxplot gráf ábrázolása
- Öt értékű bemenetre van szükségünk, mint például átlag, szórás, medián, első és harmadik kvartilis.
- Annak felismerése, hogy vannak-e eltérések az adatokban.
- Tervezze meg a modellt az adatok ábrázolására.
Paraméterek a boxplot () függvény alatt
- képlet: Ez a paraméter lehetővé teszi a numerikus értékek több csoportba öntését.
- Data :: Bemeneti adatok, amelyek adatkeretet vagy listát tartalmaznak.
- Alkészlet: Opcionális vektorparaméter a részhalmaz megadásához a rajzoláshoz.
- xlab: x tengelyes megjegyzés
- ylab: y tengely kommentár.
- range: range meghatározza a plot kiterjesztéseket.
- művelet: adja meg, mi történik, ha null érték van. Vagy ne vegye figyelembe a választ vagy az értéket.
Véletlenszerű adatok létrehozása
Az rnorm () függvény segítségével véletlenszerű mintaadatokat hozhatunk létre.
Most használjuk az rnorm () elemet 10 értékű véletlenszerű mintadatok létrehozásához.
data<-data.frame(Stat1=rnorm(10, mean=3, sd=2))
A fenti parancs 10 véletlenszerű értéket generál 3-as átlaggal és szórással = 2, és tárolja az adatkeretben.
Az adatok kinyomtatásakor az alábbi kimenetet kapjuk.
Stat1
1 2.662022
2 2, 184315
3 5, 974787
4 4.536203
5 4, 808296
6 3, 817232
7 1, 135339
8 1, 583991
9 3.308994
10 4.649170
Ugyanazt a bemenetet (adatot) konvertálhatjuk a plotplot függvénnyé, amely létrehozza a diagramot.
További értékeket adunk az adatokhoz, és megnézjük, hogyan változik a diagram.
data<-data.frame(Stat1=rnorm(10, mean=3, sd=2),
Stat2=rnorm(10, mean=4, sd=1),
Stat3=rnorm(10, mean=6, sd=0.5),
Stat4=rnorm(10, mean=3, sd=0.5))
boxplot(data)
További véletlenszerű értékek hozzáadása és egy grafikon ábrázolása.
Az alábbiakban találhatók az adatváltozóban tárolt értékek.
1. ÁLLAPOT | 2. ÁLLAM | 3. ÁLLAM | 4. STAT |
3.795465 | 4, 21864 | 5.827585 | 2.157315 |
0.911726 | 4, 09119 | 6.260811 | 2, 26594 |
3.707828 | 3, 35987 | 5, 88945 | 3.714557 |
0.115772 | 4, 5123 | 5.934858 | 2, 40645 |
0.697556 | 2, 15945 | 6, 81147 | 2.571304 |
5.129231 | 3, 2698 | 6.250068 | 3.025175 |
5.404101 | 4, 38939 | 5.670061 | 2, 9901 |
1.455066 | 3, 13059 | 5.692323 | 2, 69693 |
0.868636 | 5, 42311 | 5.415435 | 2.674768 |
2, 14113 | 3, 90728 | 6.206059 | 2.806656 |
Az alábbiakban a boxplot gráf látható 40 értékkel. 1-7 szám van az y tengelyen és stat1 és stat4 az x tengelyen.
Az x tengelyen a szöveg igazítását megváltoztathatjuk egy másik, las = 2 nevű paraméter használatával.
Az R Boxplot címkék grafikonjának elemzése
A bemenetet megadtuk az adatkeretben, és meglátjuk a fenti diagramot.
Az adatok megértéséhez nézzük meg a stat1 értékeket.
A diagram mind az öt értéket képviseli. A legalacsonyabb értékkel kezdve, majd a harmadik kvartilis, az átlag, az első kvartilis és a minimális értékkel kezdve.
A fenti ábra vízszintesen igazítja a szöveget az x tengelyen.
A szín megváltoztatása
A fenti példák mindegyikében fekete-fehérben láttuk a cselekményt. Nézzük meg, hogyan lehet megváltoztatni a cselekmény színét.
A col = color paramétert hozzáadhatjuk a boxplot () függvényhez.
data<-data.frame(Stat1=rnorm(10, mean=3, sd=2),
Stat2=rnorm(10, mean=4, sd=1),
Stat3=rnorm(10, mean=6, sd=0.5),
Stat4=rnorm(10, mean=3, sd=0.5))
boxplot(data, las=2, col="red")
data
Az alábbiakban pirosul láthatjuk a grafikon kimenetet.
Ugyanazon fenti kóddal több színt is hozzáadhatunk a cselekményhez.
data<-data.frame(Stat1=rnorm(10, mean=3, sd=2),
Stat2=rnorm(10, mean=4, sd=1),
Stat3=rnorm(10, mean=6, sd=0.5),
Stat4=rnorm(10, mean=3, sd=0.5))
boxplot(data, las=2, col=c("red", "blue", "green", "yellow")
data
Címkék hozzáadása
Címkéket adhatunk az xlab, ylab paraméterekkel a boxplot () függvényben.
data<-data.frame(Stat1=rnorm(10, mean=3, sd=2),
Stat2=rnorm(10, mean=4, sd=1),
Stat3=rnorm(10, mean=6, sd=0.5),
Stat4=rnorm(10, mean=3, sd=0.5))
boxplot(data, las=2, xlab="statistics", ylab="random numbers", col=c("red", "blue", "green", "yellow"))
data
A fő paraméter használatával hozzáadhatunk címet a diagramhoz.
data<-data.frame(Stat1=rnorm(10, mean=3, sd=2),
Stat2=rnorm(10, mean=4, sd=1),
Stat3=rnorm(10, mean=6, sd=0.5),
Stat4=rnorm(10, mean=3, sd=0.5))
boxplot(data, las=2, xlab="statistics", ylab="random numbers", main="Random relation", notch=TRUE, col=c("red", "blue", "green", "yellow"))
data
A Notch paraméter a diagram jobb érthetőségét szolgálja. Mivel az stat1 és stat4 mediánjai nem egyeznek meg a fenti grafikonon.
A dobozkészlet előnyei és hátrányai
Előnyök
- A boxplot címkékkel könnyű a nagy mennyiségű adat összegzése.
- Megjeleníti a tengely tartományát és az adatok eloszlását.
- Szimmetriát és ferde állapotot jelöl
- Segít azonosítani az adatokban szereplő outliereket.
hátrányok
- Csak numerikus adatokhoz használható.
- Ha eltérések vannak az adatokban, akkor a doboz ábrája nem lehet pontos.
Megjegyzés:
- A grafikonokat megfelelően fel kell címkézni.
- A mérlegek fontosak; A skálák megváltoztatása eltérő képet adhat az adatokról.
- Az adatok és a helyes skálák összehasonlításának következetesnek kell lennie
Következtetés - R Boxplot címkék
Az adatcsoportosítást a boxplots segítségével megkönnyíti. A Box plot több változót és különféle optimalizálást támogat. A skálákat adatok szerint is változtathatjuk.
A boxplots különféle adatváltozók vagy halmazok összehasonlítására használható.
A boxplot könnyen használható és kényelmes. Következetes adatokra és megfelelő címkékre van szükségünk. A dobozkészleteket gyakran használják az adattudományban és még az értékesítési csapatok is az adatok csoportosítása és összehasonlítása céljából. A Boxplot betekintést nyújt az adatok potenciáljához és az optimalizálásokhoz, amelyeket meg lehet tenni az értékesítés növelése érdekében.
A Boxplot érdekes módszer az adatok tesztelésére, amely betekintést nyújt az adatok hatására és potenciáljára.
Ajánlott cikkek
Ez az útmutató az R Boxplot címkékhez. Itt a Paraméterek a boxplot () függvény alatt tárgyaljuk, hogy hogyan lehet véletlenszerű adatokat létrehozni, megváltoztatva a szín- és grafikonelemzést, valamint az Előnyeket és Hátrányokat. A következő cikkben további információkat is megnézhet -
- Az adatok megjelenítésének típusai
- Adattárház megvalósítása
- Adattudományi technikák
- Mi az Data Cube?