Bevezetés az R csomagokba
A csomag funkciók és adatkészletek gyűjteménye. A csomagok javítják a programozási nyelv funkcionalitását. Ha adatbázisokat szeretnénk tárolni és feldolgozni (azaz az SQL-hez hasonló funkciókat adatkeretek segítségével), akkor használhatjuk a dplyr csomagot az R.-ban. A csomagok dokumentációt is tartalmaznak a függvények és az adatkészletek egy adott csomagban történő felhasználásáról.
Hol találunk csomagokat?
A csomagok az interneten különböző forrásokból érhetők el. Vannak bizonyos megbízható tárolók, ahonnan letölthetjük a csomagokat.
Itt található a két fontos adattár, amelyek online elérhetők.
- CRAN (Átfogó R Archívum Hálózat): Ez a hivatalos R közösség, amelynek FTP és webszervereinek hálózata tartalmazza az R. legfrissebb kódját és dokumentációját. Mielőtt online csomagjait közzéteszi, egy tesztsorozaton megy keresztül, amely megfelel a CRAN irányelveinek. .
- GitHub: A GitHub egy másik híres adattár, de nem kifejezetten az R. számára. Az online közösség megoszthatja csomagjait másokkal, és a verziókezeléshez is jól használható. A GitHub nyílt forráskódú, és nincs felülvizsgálati folyamata.
A hasznos R csomagok listája
Több csomag található az R-ben, és letölthető a CRAN-ból vagy a GitHub-ból. Az alábbiakban bemutatjuk azokat a csomagokat, amelyek felhasználhatók meghatározott célokra.
1. Az adatok betöltése külső forrásokból
- Haven: R leolvassa és írja az adatokat a SAS-től.
- DBI: Kommunikáció létrehozása a relációs adatbázis és R között.
- RSQlite: Relációs adatbázisokból származó adatok olvasására szolgál.
2. Adatkezelés
- Dplyr: Olyan adatkezeléshez használható, mint az alkészítés, parancsikonokat biztosít az adatok eléréséhez és sql lekérdezéseket generál.
- Tidyr - az adatok apró formátumba történő konvertálására szolgál.
- stringr - a szövegkifejezések és a karakterláncok kezelése.
- lubridate- Az adatokkal és az idővel való munka.
3. Az adatok megjelenítése
- Rgl: 3D vizualizációk kidolgozása.
- ggvis: Grafika nyelvtan létrehozása és felépítése.
- googlevis: A Google megjelenítő eszközök használatához R-ben
4. Web alapú csomagok
- XML: XML dokumentumok olvasása és írása R-ben.
- Httpr: Munka a http-kapcsolatokkal.
- Jsonlite: A json adattáblázatok olvasása.
R csomagok beszerzése
Az R-ben lévő elérhető csomagokat az alábbi kód használatával ellenőrizhetjük.
- available.packages (): Körülbelül 5200 csomag érhető el a CRAN hálózatban.
A CRAN feladat nézeteivel csomagok csoportosítása egy adott téma alatt.
R csomagok telepítése
A csomagokat közvetlenül az IDE-n keresztül vagy parancsok segítségével telepíthetjük. A csomagok telepítéséhez az alábbi funkciót használjuk, és meghatározzuk a csomag nevét.
Szintaxis:
install.packages()
Kód:
install.packages(“ggplot2”)
A fenti kód telepíti a ggplot2 csomagot és az attól függő csomagokat, ha vannak.
Egyszerre több csomagot is telepíthetünk, ha a karakter vektor alatt megadjuk a csomag nevét.
Szintaxis:
install.packages(c(“package 1”, ”package 2”, ”package 3”))
Kód:
install.packages(c(“ggplot2”, ”slidify”, ”deplyr”))
Telepítés az R Studio használatával
Az R stúdió használatának előnye a GUI (grafikus felhasználói felület). Kiválaszthatjuk a telepítendő csomagokat és azok forrását.
Mehetünk az eszközökhöz -> Csomagok telepítése.
R csomagok betöltése
Az R csomag telepítése után be kell töltenünk őket az R csomagba, hogy megkezdhessük a telepített csomagok használatát.
Az alábbi függvényt használjuk a csomagok betöltésére.
Szintaxis:
library(package name)
Kód:
library(ggplot2)
Vannak bizonyos csomagok, amelyek betöltésekor megjelenítik az üzeneteket. Néhányan közülük nem. Az alábbi kód segítségével láthatjuk a telepített könyvtár részleteit.
Kód:
library(ggplot2)
search()
Kimenet:
“Csomag: rács” “csomag: ggplot2” “csomag: csinál”
“Csomag: kötött” “csomag: csúsztatható” “eszközök: rstudio”
Saját csomag készítése
Mielőtt létrehoznánk saját csomagot. Az alábbi ellenőrzőlistát szem előtt tartva kell tartanunk, mielőtt folytatnánk a csomag létrehozását.
- A kód szervezése az egyik legfontosabb dolog, amikor a kódot a csomagba írja. A kódjavítás helyett a kód helyének keresésével felét veszítjük, nem pedig a kód javítását. Tegye az összes fájlt egy könnyen elérhető mappába.
- A kód dokumentálása segít megérteni a kód célját. Amikor gyakran nem vizsgáljuk meg újra a kódot, elfelejtjük, miért írtuk a kódot egy bizonyos módon. Segíthet az embereknek abban is, hogy jobban megértsék a kódot, ha megosztják velük.
- A szkriptek megosztása e-mailben archaikus lett. Az egyszerű módszer a kód feltöltése és terjesztése a GitHub-on. Lehetséges, hogy visszajelzést kap, amely segíthet javítani a kódot.
Saját csomag létrehozásához telepítenünk kell a devtools csomagot.
Kód:
install.packages("devtools")
A dokumentáció elősegítéséhez az alábbi csomagot használhatjuk.
Kód:
install.packages("roxygen2")
A devtools csomag telepítése után. Készítheti saját csomagját.
Kód:
devtools::create ("packagename")
A „csomagnév” helyett megadhatja a kívánt nevet. Most hozzáadhatja funkcióit ehhez a csomaghoz.
Ugyanazt a fájlnevet hozhatja létre, mint a függvény nevét.
Szintaxis:
Devtools:create(“firstpackage”)
Terjesztő csomag
A devtools csomag használatával eloszthatja csomagját a githubon.
Az alábbi kódot használjuk csomagunk terjesztésére a githubon.
Kód:
devtools::install_github("yourusername/firstpackage")
Megadhatja a fent létrehozott github felhasználónevét és csomagnevét.
Itt található a csomaghoz szükséges fájlok
- Funkciók
- Dokumentáció
- Adat
Miután megszereztük a fenti fájlokat, örömmel tehetjük azt a lerakatba.
Ajánlott cikkek
Ez egy útmutató az R csomagokhoz. Itt tárgyaljuk a hasznos R csomagok listáját, a csomagok telepítését az R studio segítségével és a saját csomag készítését, stb. További tudnivalókat a következő cikkekben találhat -
- Mi az R programozási nyelv?
- Karrier az R programozásban
- R Programozás vs Python
- MySQL vs SQLite
- Az R csomagok listája