Bevezetés a Scatterplotba R

  • R egy nyílt forráskódú programozási nyelv, amelyet az adatok statisztikájához és az elemzéshez használnak. Az adattudomány növekvő népszerűségével az R szintén népszerűvé vált. Elsősorban az adatstatisztikusok és az adatbányászok használják az értékes adatok kinyerésére. R egy értelmezett nyelv, és parancssori felülettel rendelkezik, de számos grafikus felhasználói felület elérhető a fejlesztő munkáinak megkönnyítésére. Az R nagy könyvtárak széles választékát kínálja statisztikák és grafikai technikák végrehajtására. R statikus grafikákat kínál; ez lehetővé teszi a felhasználó számára, hogy rétegezett grafikát készítsen. Így kiadványminőségű grafikonokat készít, és jobban ábrázolja az információkat.
  • Az R hatalmas könyvtárat kínál a grafikus megvalósításhoz, de a legnépszerűbb a „ggplot2”. A GGPlot2 a „Grafika grammája” megvalósítása, amely egyszerűvé teszi a bonyolult grafikonok létrehozását. Programozási felületet biztosít a változók, azok helyzetének, a grafikon színének, a grafikon típusának és más megjelenítési tulajdonságok meghatározására. Ez lehetővé teszi, hogy lépésről lépésre grafikonokat készítsen, lehetővé téve rétegek létrehozását a nagy rugalmasság és a kiadványminőség érdekében.
  • Az egyik ilyen típusú grafikon a Scatterplot R.-ben. Scatterplot in R, más néven szórási diagram, amely egy olyan típusú grafikon, amely megmutatja a két változó közötti korrelációt. Megmutatja az adatpontokat pontok formájában. Meghúzható egy folyamatos független változó és egy másik változó között, amely az előző változótól függ, vagy két folyamatos független változótól. A korreláció lehet pozitív, negatív vagy semleges. Ha a grafikon lejtése bal alsó és jobb felső sarokban van, akkor a korreláció pozitív. Ha a meredekség balról balra és jobbra alul van, akkor a korreláció negatív, vagyis más szavakkal az egyik változó értékének növekedése csökken egy másik változó értékében.

Szintaxis: Az R-ben sok csomag van grafikonok számára, ezért sok funkció van egy Scatterplot létrehozására R-ben. A legalapvetőbb és legegyszerűbb funkció a

telek (x, y)

hol

x a vízszintes tengelyt vagy a független folyamatos változót jelöli.

y a függőleges tengelyt vagy a függő változót jelöli.

Számos más paraméter is ábrázolja a függvényt, hogy a grafikon könnyen érthető legyen.

Az alábbiakban néhány a meghatározással:

  • main: hozzáad egy címet a grafikonhoz
  • xlab: adjunk hozzá egy címkét az x tengelyhez
  • ylab: címkét ad az y tengelyhez
  • xlim: meghatározza az x tengely tartományát
  • ylim: meghatározza az y tengely tartományát
  • pch: jelzi a pontok alakját a szórt grafikonon
  • cex: jelzi a pontok méretét
  • col: meghatározza a pontok színét

Az Scatterplot in R létrehozható a ggplot2 csomag használatával is. Ehhez először telepítenünk kell és be kell töltenünk a ggplot2 csomagot. Miután hozzáadta a csomagot az alábbi aktuális munkamenethez, felhasználható Scatterplot létrehozására R-ben.

ggplot (adatkészlet, aes (x, y, szín, alak)) + geom_poin () + laboratóriumok (x, y, cím)

hol

  • az adatkészlet az az adatkészlet, amelyhez scatterplot kell létrehozni.
  • Az aes () egy esztétikai leképezés egy grafikonon. Azt írja le, hogy a változók hogyan vannak leképezve a grafikonon.
  • x a vízszintes tengely vagy a független folyamatos változó.
  • y a függőleges tengely vagy a függő változó.
  • a szín az, hogy színt adjon a pontokhoz a csoportosító változó alapján.
  • az alakot az alak csoportosító változó alapján történő beállításához használják.
  • A + jel azt jelzi, hogy a parancs folytatódik.
  • A geom_point () függvény a szórási grafikon számára.
  • laboratóriumok (x, y, cím): adjunk hozzá x címkét, y címkét és címet a grafikonhoz.

Hozzon létre Scatterplot In R-ben

Scatterplot létrehozásához az R-ben először be kell töltenie az adatkészletet. Itt az R. által biztosított adatkészletet (mtcars) használjuk. Először az alábbi parancs segítségével töltsük be az adatkészletet az aktuális munkamenetbe

adatok (Iris)

Miután az adatkészlet betöltődött, tekintse meg az adatokat, hogy megértse az adatok típusát és az abban található oszlopokat az alábbi paranccsal.

írisz

Miután megismerte az adatok alapos megértését, lehetővé teszi egy egyszerű scatterplot létrehozását a plot funkció segítségével

telek (írisz $ Sepal.hossz, írisz $ Sepal.Szélesség, xlim = c (4.0, 9.0), ylim = c (2.0, 5.0))

Címkék hozzáadása a grafikon olvashatóságához

plot (írisz $ Sepal.Length, írisz $ Sepal.Width, xlim = c (4.0, 9.0), ylim = c (2.0, 4.0), xlab = “Sepal Length”, ylab = “Sepal Width”, main = “szélesség vs hossz ”)

További paraméter hozzáadása a grafikon vonzóbbá tételéhez

plot (írisz $ Sepal.Length, írisz $ Sepal.Width, xlim = c (4.0, 9.0), ylim = c (2.0, 4.0), xlab = “Sepal Length”, ylab = “Sepal Width”, main = “szélesség vs hosszúság ”, pch = 8, cex = 1, 5, col = 6)

Ezen a kétdimenziós grafikonon kívül mátrix- és 3D-görbék is létrehozhatók R-ben.

Scatterplot mátrixok

Ha egy adatkészletben kettőnél több változó van, és meg akarjuk találni az egyes változók korrelációját az összes többi változóval, akkor a scatterplot mátrixot használjuk. A scatterplot mátrix legalapvetőbb és legegyszerűbb parancsa:

pár (~ Sepal.hossz + Sepal.Szélesség + virágszirom.hossz + virágszirom.Szélesség, adatok = írisz, main = „Scatterplot mátrix”)

A fenti grafikon a súly, mpg, dsp és a henger közötti korrelációt mutatja.

Scatterplot 3D

Időnként a háromdimenziós grafikon jobban megérti az adatokat. Mivel ez az R több csomagot tartalmaz, ezek egyike a „scatterplot3d”. Az alábbiakban közöljük azokat a parancsokat, amelyek segítségével telepíthetjük a „scatterplot3d” fájlt az R munkaterületre, és betölthetjük azt az aktuális munkamenetbe

install.packages ( „scatterplot3d”)

Library (scatterplot3d)

A könyvtár betöltése után az alábbi parancsok végrehajtása 3D-s scatterplot eredményez.

csatolja (írisz)

scatterplot3d (Sepal.Length, Sepal.Width, Petal.Length, main = “3D Scatterplot”)

Ezen kívül számos egyéb módszer is van a háromdimenziós létrehozásához. A felhasználók olyan részleteket is hozzáadhatnak, mint a szín, a címek, hogy a grafikon jobb legyen. A felhasználó interaktív 3D scatterplot is létrehozhat az „rgl” csomag által biztosított „plot3D (x, y, z)” funkció használatával. Ez a funkció létrehoz egy forgó 3D scatterplotot, amely egérrel elforgatható. Így teljes képet kap a változók közötti összefüggésről.

Következtetés

R az egyik leghíresebb nyelv az adattudósok által alkalmazott grafikai technikák megvalósításához. Széles csomagot és könyvtárat kínál a grafikához, valamint az adatok jobb megértéséhez. A „gglpot2”, „ggvis”, „rgl”, „plot3d”, „rács”, „animáció”, „gganimate”, „cairo” néhány olyan csomag, amelyeket R nyújt.

A szórt grafikon az adatok jobb megértésének legegyszerűbb módja. Ezzel a vizualizációval a felhasználó megismerheti, hogy a változók hogyan kapcsolódnak egymáshoz, hogy az egyik változó értékének megváltoztatása hogyan változtatja meg a többi változó értékét stb. A diagram lejtése a változók közötti pozitív és negatív kapcsolatról szól.

Ajánlott cikkek

Ez egy útmutató a Scatterplot R.-hez. Itt egy bevezetést, scatterplot mátrixokat, a scatterplot 3D-t tárgyalunk, hogyan lehet scatterplot létrehozni? megfelelő példákkal együtt. A további javasolt cikkeken keresztül további információkat is megtudhat -

  1. Mi az a GraphQL?
  2. Scrum-keret
  3. R interjú kérdése
  4. Bevezetés a binomiális eloszlásba R

Kategória: