Bevezetés a hisztogramba R

Ebben a cikkben az R megvalósítás és testreszabás alapvető hisztogramjával kezdjük. A hisztogram fontos szerepet játszik az adatok elemzésében az adatok megjelenítésében. Az R programozás egy speciális környezet a statisztikai számításhoz és az adattudomány alapjai. Az R programozásban az adatkészletek és a funkciók csomagokba vannak csoportosítva. A legtöbb vizuális elemző program a hisztogramokat használja, és alapértelmezésként a tálca szélességét használja. Ezek lehetővé teszik az adatok betekintésének gyors megismerését, amely az adattudományban elsődleges szerepet játszik. Itt egy hisztogramot építünk R parancsok felhasználásával.

Mi a Histogram?

A hisztogram egy adatkészlet-eloszlás képi ábrázolása, amellyel könnyen elemezhetjük, melyik tényező nagyobb adatmennyiséggel és a legkevesebb adattal. Más szavakkal, a hisztogram lehetővé teszi kumulatív frekvencia-diagramok elvégzését az x és az y tengelyen. Valójában a hisztogramok mind csoportosított, akár nem csoportosított adatokat vesznek fel. A csoportosított adatok hisztogramját az osztályhatárok figyelembe vételével állíthatjuk elő, míg a nem csoportosított adatokhoz a csoportosított frekvenciaeloszlást kell kialakítani. Segítik az adatok köre és helyének hatékony elemzését. A hisztogramok néhány általános szerkezetét alkalmazzák, mint például normál, ferde, szikladag az adatterjesztés során.

A sávokkal ellentétben a diagram hisztogramján nincs hézag a sávok között, és az itt szereplő sávokat tálcáknak nevezzük, amelyekkel az adatok azonos időközönként jelennek meg. Hisztogram Folyamatosan változót vesz fel, és intervallumokra osztva választja ki a megfelelő tálca szélességet. A sávdiagram és a hisztogram közötti legnagyobb különbség az, hogy az előbbi nominális adatkészleteket használ a diagram ábrázolására, míg a hisztogram a folyamatos adatkészleteket ábrázolja. R a hist () függvényt használja hisztogramok készítéséhez. Ez a hist () függvény értékvektorot használ a hisztogram ábrázolásához. A hisztogram a folytonos értékek x tengelyének sorozatából áll, az y tengely az x tengelyben az adatok gyakori értékeit ábrázolja a magasság változási sávokkal.

Szintaxis:

A hisztogram létrehozásának szintaxisa:

hist (v, main, xlab, xlim, ylim, breaks, col, border)
where v – vector with numeric values
main – denotes title of the chart
col – sets color
border -sets border color to the bar
xlab - description of x-axis
xlim - denotes to specify range of values on x-axis
ylim – specifies range values on y-axis
break – specifies the width of each bar.

Hisztogram készítése R-ben

Az elemzéshez a cél hisztogramnak beépített adatkészletre van szüksége az R. R.-be történő importáláshoz, és könyvtárainak különféle grafikus csomagjai és funkciói vannak. Itt svájci és légi utasok adatkészletét használjuk. Az adott adatérték hisztogramjának kiszámításához a hist () függvényt használja a $ jel mellett az adat bizonyos oszlopának kiválasztásához az adatkészletből egy hisztogram létrehozásához.

A következő példa kiszámítja az adatok értékének hisztogramját a Swiss nevű adatkészlet vizsgálata oszlopban.

1. példa: Hozzunk létre egy egyszerű hisztogramot

Kód:

hist (swiss $Examination)

Kimenet:

A Hist létrehozása egy svájci adatkészlethez oszlopvizsgálattal. ez egyszerűen csak egy frekvenciát és x tengelyt ábrázol.

2. példa: Histogram további érvekkel

A hisztogramok jobb megértése érdekében további érveket kell hozzáadnunk a hist függvényhez a diagram megjelenítésének optimalizálása érdekében. Ha x és y címkét változtat az értékek tartományára, akkor az xlim és ylim argumentumok hozzáadódnak a függvényhez.

Példa:

hist (Air Passengers, xlim=c (150, 600), ylim=c (0, 35))
In the above example x limit varies from 150 to 600 and Y – 0 to 35.
// Adding breaks
hist (AirPassengers,
main="Histogram with more Arg",
xlab="Name List",
border="Green",
col="Orange",
xlim=c (100, 600),
ylim=c(0, 40),
breaks=5)

Kimenet:

A fenti kód ábrázolja a Légi utasok adatkészlet értékeinek hisztogramját, címet kap: „Histogram for more arg”, az x tengelyes címke „Névlista”, zöld szegéllyel és sárga színnel a sávokhoz, korlátozva a érték 100-tól 600-ig, az y tengelyre 2-re nyomtatva, és a tálca szélességét 5-ig növeli.

Két különböző szín hozzáadása a sávhoz

hist (swiss$Examination, col=c ("violet”, "Chocolate2"), xlab="Examination”, las =1, main=" color histogram")

Kimenet:

További sávok hozzáadása a hisztogramhoz

hist (swiss$Education, breaks=40, col="violet", xlab="Education", main=" Extra bar histogram")

Kimenet:

3. példa: Hisztogram R-ben egy értéket ad vissza

Air <- AirPassengers
hist (Air)
h <- hist (Air)
h
$breaks

Kimenet:

4. példa: A Break érvelés használata a tálca szélességének megváltoztatásához

Ha a szélesség között több töréspont van, akkor inkább az értéket használja a c () függvényben.

hist (AirPassengers, breaks=c (100, seq (200, 700, 150)))

Kimenet:

A fenti ábra a sáv szélességét veszi át a sorozatértékeken keresztül.

5. példa: A normál eloszlási görbe végrehajtása a hisztogramban

Az adatértékekhez a „svájci” adatkészletet használjuk grafikon rajzolásához. Itt a függvénygörbe () szolgál az elosztási vonal megjelenítésére.

Kód:

curve (dnorm(x, mean=mean(swiss$Education), sd=sd(swiss$Education)), add=TRUE, col="red")

Kimenet:

6. példa: A valószínűségi eloszlás ábrázolása

hist (AirPassengers,
main="Histogram ",
xlab="Passengers",
border="Yellow",
col="pink",
xlim=c(100, 600),
las=2,
breaks=6,
prob = TRUE)

Sűrűség diagramok létrehozása a hisztogramban R-ben

A változó eloszlását a függvénysűrűség () felhasználásával hozzuk létre. Az alábbiakban látható az mtcars adatkészlet. A sűrűségábrák segítenek az alak eloszlásában.

density () // this function returns the density of the data
library(ggplot2)
d <- density (mtcars $qsec)
plot (d, main=" Density of Miles Per second")
polygon (d, col="orange",>

Kimenet:

Using Line () function
hist (swiss$Examination, freq = FALSE, col=c ("violet”, "Chocolate2"),
xlab="Examination”, las =1, main=" Line Histogram")
lines(density(swiss$Examination), lwd = 4, col = "red")

A következő hisztogram R-ben mutatja a magasságot mint vizsgálatot az x tengelyen, és a sűrűséget az y tengelyen ábrázoljuk.

Kimenet:

Következtetés

Ez az egész hisztogramra vonatkozik, és pontosan a hisztogram a legegyszerűbb módszer az adatok megértésére. Mint láttuk egy hisztogramon, egy, több diagramot rajzolhatunk, a tálca szélességének, a tengelykorrekciónak, a színek megváltoztatásának, stb. Felhasználásával. A hisztogram segít az adatok különböző alakjainak megjelenítésében. Végül láttuk, hogy a hisztogram lehetővé teszi az adatkészletek elemzését, és a középpontokat használják az osztály címkéiként. A hisztogram segíti az intervallumok megváltoztatását az adatok kibővített leírásának elkészítéséhez, és különösen a numerikus adatokkal működik. a hisztogramok inkább előnyösek az elemzésben, mivel előnyeik, hogy nagy adatsort jelenítenek meg. A kimenet alapján vizuálisan eltorzíthatjuk az adatokat, és könnyen feltehetünk néhány feltevést.

Ajánlott cikkek

Ez egy útmutató volt az R. hisztogramon. Itt példákkal tárgyaltuk a koncepciót, a szintaxist és a Histogram létrehozása az R-ben. A következő cikkeket is megnézheti további információkért -

  1. Hisztogram példák
  2. Karrier az R programozásban
  3. Gantt-diagram a Tableau-ban
  4. Karrier a számítógépes programozásban
  5. Hogyan hozhatunk létre egy vonaldiagramot R-ben?

Kategória: