Bevezetés az R csomagok listájába

Az R programozási nyelvű csomag olyan egység, amely biztosítja a szükséges funkciókat, amelyek felhasználhatók az R környezetbe töltésével. Az R csomagok listája hasonló a C, C ++ vagy Java könyvtárhoz. Tehát alapvetően egy csomagnak számos funkciója lehet, például funkciók, állandók stb., Amelyek lehetővé teszik a felhasználó számára, hogy felhasználja őket egy adott probléma összefüggésében. R-ben egy szükséges csomag betölthető a könyvtár () függvény használatával. Ha nincs csomag, akkor az install.packages () függvény segítségével telepíthető. A csomagok a látszólag nehéz feladatokat megkönnyítik a kész funkcionalitások révén.

Mik az R csomagok?

Az R-ben sok csomag van, és egy csomag kiválasztása az alkalmazásától függ. Bár vannak olyan csomagok, amelyeket széles körben használnak az általuk nyújtott funkciók miatt, nem az a helyzet, hogy a többi csomag kevésbé fontos. A különféle csomagok célja eltérő; néhányuk statisztikai technikákkal kapcsolatos, mások vizualizációkkal stb.

A következő szakaszban néhány fontos csomagot vizsgálunk meg R-ben:

1. Autó

Ez a csomag az alkalmazott regresszió társa. Ez egy nagy csomag, amely különféle funkciókat biztosít a statisztikai elemzéshez. Ennek a csomagnak az R környezetbe történő importálása más kapcsolódó csomagokat, például MASS, statisztika, grafika stb. Importál. A csomag néhány funkciója az Anova, avPlots, Boxplot, carPalette, sűrűségábrák, infIndexPlot, lineáris hipotézis, logit, külső teszt, qqPlot, fennmaradó grafikonok, scatterplot, scatterplot mátrix stb. A csomag kiterjedt képességei kiértékelhetők az általa biztosított funkciók számából.

2. Javítás

A csomag grafikusan bemutatja a korrelációs mátrixot és egy konfidencia intervallumot. A csomag algoritmusokat is tartalmaz a mátrix átrendezéséhez. Számos lehetőség tartalmazza a szükséges színek, szöveges címkék, színcímkék, elrendezés stb. Kiválasztását. A Corrplot csomag különféle megjelenítési módszerei vagy paraméter-módszerei: „kör”, „négyzet”, „ellipszis”, „szám”, „árnyék”, „szín”., és a „pite”. A különféle lehetőségeket tartalmazó Corlplot függvény vizuálisan vonzó ábrázolást ad a különböző változók közötti korrelációra, amelyeket egyébként normál körülmények között, mint például a számok, nehéz értelmezni. A pozitív korrelációk kék színben jelennek meg, a negatív korreláció piros színnel. A szín intenzitása és a kör mérete arányos a korrelációs együtthatókkal.

3. DataExplorer

Ez a csomag az adatok automatikus feltárásával és kezelésével foglalkozik. Automatikus adatkutatási folyamatot biztosít analitikai feladatokhoz és prediktív modellezéshez. Ez elengedhetetlen, mivel lehetővé teszi a felhasználó számára az adatok megértését és a betekintés kibontását. Az elemzés minden változóját a csomag átvizsgálja és elemzi. Ezenkívül a csomag funkciókat kínál ezeknek a változóknak a megjelenítésére tipikus grafikus technikák alkalmazásával. Ezenkívül általános adatfeldolgozási módszereket is biztosít az adatok kezelésére és formázására.

4. Gmodels

A gmodels csomag különféle eszközöket kínál az R ábrázolásához. Különböző funkciókat tartalmaz, például a glh.test, amelyet egy regressziós modell általános lineáris hipotézisének tesztelésére, kinyomtatására vagy összegzésére használnak. A funkció teszi. az ellentétek az emberi olvashatósággal ellentéteket olyan formába alakítják, amelyre R a számításhoz szüksége van. A make.contrasts által visszaadott mátrix felhasználható érvként a modell funkcióinak kontraszt érveire. A coefFrame funkció illeszti a modellt az alcsoportok által definiált alcsoportokhoz , majd egy adatkeretet ad vissza egy sorral minden illesztéshez és egy oszlopot minden paraméterhez. A becsülhető függvény kiszámítja és teszteli az ellentéteket és az lm, glm, stb. Modell koefficiensek kontrasztjait és egyéb becsülhető lineáris függvényeit. A fit.contrast függvény kiszámítja és teszteli tetszőleges kontrasztot regressziós objektumokhoz.

5. Glottok

Ez a csomag a sokféle programozó eszköz segítségével biztosítja a megjelenítési funkciókat. A csomagban levő funkciók a számítás és ábrázolás fogalmán működnek. A csomag grafikus képességeit különféle funkciók mutatják be, mint például sávdiagram, boxplot2, col2hex, ci2d, hist2d, szövegtábla, mosogatókeret, léggömb-pilóta, plotCI, plot-eszközök stb. Ezek a funkciók lehetővé teszik a színhez kapcsolódó beállítások kezelését, szöveg és a megjelenítés egyéb bonyolult grafikai szempontjai. A statisztikai alapú megjelenítésben részt vevő komplex elemekkel is foglalkoznak, például az lmplot2, a maradékplot funkciók, amelyek lehetővé teszik a felhasználó számára, hogy a diagnosztikai grafikonokon keresztül részletes regressziós diagnosztikát vezessen. Ha több adatot kell ábrázolni ugyanabban a régióban, de külön tengelyekkel, akkor ez lehetséges a csomag túltervezés funkciójával.

6. Ggplot2

Ez az egyik nagyon híres csomag R-ben, amely kiterjedt vizuális képességeket biztosít, és még az összetett statisztikai és matematikai technikák eredményeit is bemutatja. A csomag számos funkcionálissága lehetővé teszi az elemző számára, hogy az adatokból a lehető leg interaktívabb betekintést nyerjen. A függvény R leírása egy „grafika deklaratív létrehozásának rendszere, amely a Grafika Grammatáján alapul”. Ez a grafika grammatika azt jelenti, hogy a felhasználónak el kell mondania a „ggplot2” -et arról, hogy a változókat hogyan kell hozzáérteni az esztétikához, tehát ez lényegében azt jelenti, hogy meg kell határozni, hogy mely grafikus aspektusokat kell használniuk, és a ggplot2 a részek alapján ennek megfelelően működik.

7. Lubridate

Ez az R csomag megkönnyíti a dátumokkal és időpontokkal való munkát. A kenőcsomag lehetővé teszi a dátum- és időadatok egyszerű kezelését. Számos elemzést végez, és megfelelő adatrendezést biztosít, sőt, a csomag elemzési funkciói sokféle formátumot és elválasztót kezelnek, ami egyszerűsíti az elemzési folyamatot. Az egyik figyelemre méltó tulajdonság az, hogy a csomag olyan funkciókat kínál, amelyek kezelik a dátumokat különböző időzónákkal.

8. Hmisc

Harrell Miscellaneous néven a Hmisc csomag számos olyan funkciót tartalmaz, amelyeket ki lehet használni az adatok elemzéséhez, a magas szintű grafika és a segédprogramok műveleteihez. Ez magában foglalja a minták méretének és teljesítményének kiszámítását, az adatkészletek importálását és kommentálását, a hiányzó értékek imputálását, a speciális táblafunkciók biztosítását, a változók csoportosítását, a karakterlánc manipulálását, az R objektumok HTML-kódrá konvertálását stb.

9. Rács

A csomag magas szintű adatmegjelenítő rendszert kínál, amelyet a Trellis grafika ihlette. Hangsúlyozza a többváltozós adatokat. A csomag nagyszerű megjelenítési képességei biztosítják a szükséges grafikai megoldást. A csomag néhány figyelemre méltó funkciója a B_07_cloud, amely elősegíti a 3D szórás diagram és a drótváz felületének ábrázolását; D_level. színek: a numerikus vagy kategorikus változót képviselő hamis színek kiszámításának funkciója; B_06_levelplot, egy függvény, amely szintjeket és kontúrjeleket generál; A_01_Lattice, a rácsos grafikai képességeket biztosító funkció. B_09_tmd egy olyan funkció, amely Tukey Mean - Difference Plot értéket generál; B_11_oneway, az egyirányú modellhez illeszkedő funkció. A csomag tehát széles funkcionalitást biztosít a megjelenítéshez különféle funkciókon keresztül.

10. MatrixModels

Ez a csomag lehetővé teszi a modellezést ritka és sűrű 'Mátrix' mátrixokkal. Ennek megvalósításához moduláris predikciót és választ, modul osztályokat használ. A csomag által biztosított összes funkció ugyanolyan fontos, néhány közülük az lm.fit.sparse, amely egy ritka lineáris modellek illesztési funkciója, aoldCoef, amely megoldja az együtthatókat és az együttható-növekedést, modellt. Mátrix, amely esetleg ritka tervezési vagy modell mátrixokat állít fel, glm4, amely illeszkedik az általánosított lineáris modellekhez.

11. Multcomp

A csomag lehetővé teszi a k ​​csoport többszörös összehasonlítását általánosított lineáris modellekben. Kilenc standard eljárás felsorolása, nevezetesen: Dunnet, Tukey, Sequen, AVE, Changepoint, Williams, Marcus, McDermott és Tetrade kapják a felhasználót, és a felhasználó kiválasztja az összehasonlításokat a követelmény alapján. Ezen felül ingyenes bemeneti felület is biztosított a kontrasztmátrix számára, amely lehetővé teszi a speciális összehasonlításokat. Figyelemre méltó tulajdonság az, hogy maga az összehasonlítás nem korlátozódik semmiféle olyan egyedi mintára, mint például kiegyensúlyozott vagy egyszerű, hanem a programokat úgy tervezték meg, hogy megfeleljenek a többszörös összehasonlításoknak az általános lineáris modellben, amely lehetővé teszi kovarianciákat, összefüggő eszközöket, hiányzó értékeket stb.

12. OpenMx

Ez a csomag alapvetően a kiterjesztett szerkezeti egyenlet modellezéssel foglalkozik. Funkciókat biztosít a szerkezeti egyenlet modellek létrehozásához. Ezeket a modelleket a programozás segítségével lehet manipulálni. A modellek meghatározhatók mátrixokkal vagy útvonalakkal, például LISREL vagy RAM. Néhány modelltípus több csoportot foglal magában, megerősítő tényezőt, keverék eloszlást, kategorikus küszöböt, differenciális illesztési funkciókat stb.

13. Plyr

Ez egy nagyon fontos csomag, amely az adatkezelés funkcióit biztosítja. Eszközöket biztosít az adatok felosztására, alkalmazására és kombinálására. Szerszámkészlettel rendelkezik, amely segít megoldani a közös problémákat. Például néha előfordulhat, hogy egy nagy feladatot kisebb feladatokra kell bontani, amelyek kezelhetők, majd mindegyik darabon működünk, majd végül összeszereljük az összes darabot.

14. Qcc

A csomag különféle minőség-elemzési funkcióknak köszönhetően szerez jelentőséget. Ez biztosítja a Shewhart minőség-ellenőrzési táblázatait a folyamatos, az attribútumok és az adatok számlálására. Fontos diagramok között szerepelnek a Cusum és az EWMA táblázatok, valamint a működési jellemzők görbéi. Ezenkívül folyamatképesség-elemzési funkciókat is kínál. A Pareto diagram, az ok-okozati diagram és a többváltozós vezérlő diagramok hasznos eszközök, amelyeket a csomag biztosít.

15. RandomForest

Ahogy a neve is sugallja, ez a csomag véletlenszerű erdő algoritmus felépítésére szolgál. A csomag Breiman véletlenszerű erdészeti algoritmusát valósítja meg, amely Beiman és Cutler eredeti FORTRAN kódján alapszik. Az algoritmust osztályozásra és regresszióra használják. A csomag felügyelet nélküli módban is használható az adatpontok közelségének felmérésére.

16. Psych

Ez egy speciális célú csomag. A csomag eljárást biztosít pszichológiai, pszichometrikus és személyiségkutatáshoz. A funkciók elsősorban többváltozós elemzésre szolgálnak, különféle többváltozós statisztikai technikák alkalmazásával.

Következtetés-R csomagok listája

Számos csomag van az R-ben, és egy csomag alkalmazása a követelményektől függ. Az R csomagok listája közösség nagyon gyorsan növekszik, és minden nap egy csomag hozzáadódik. A több csomag hasonló funkciókat biztosíthat, de a csomag kiválasztásának a gondos tanulmányozásán kell alapulnia.

Ajánlott cikkek

Ez egy útmutató az R csomagok listájához. Itt tárgyaljuk az R csomagok bevezetését és az R. néhány fontos csomagját. További információkért áttekintheti a többi javasolt cikket is -

  1. Java csomagok
  2. Mi a JNDI a Java-ban?
  3. JColorChooser
  4. R Programozás vs Python

Kategória: