Bevezetés az R-karakterlánc-funkciókba
Az R nyelv vagy az R karakterisztikus funkciók főként az adatok grafikus ábrázolására, az adatok statisztikai elemzésére és a jelentéskészítésre vonatkoznak. ez egy nyílt forráskódú nyelv. ennek a nyelvnek az elnevezési konvenciója a nyelv alapítóinak Ross Ihaka és Robert Gentleman első betűiből származik. Ez egy értelmezett programozási nyelv. Képes integrálni más különféle nyelvi eljárásokkal, nevezetesen a C ++, a Python, stb. Jelenleg az R az a világ, amelyet leginkább a programozási nyelv használ.
Az R karakterlánc funkciók jellemzői
Az R nyelv fő jellemzői az alábbiak,
- Finoman kidolgozott és nagyon egyszerű statisztikai nyelv.
- A tárolás és az adatkezelés nagyon hatékonyan beágyazódik az R-be.
- Számos osztályozott eszközt kínál, amelyek segítenek az adatok elemzésében
- R könyvtárakat is kínál az adatok grafikus ábrázolásához
R karakterlánc funkciók manipulálása
Az alábbiakban felsoroljuk az R karakterlánc-manipulációs funkciókat.
1. Grep () az R karakterlánc funkciókban
Az adatmintázat illesztésére szolgál, és a mintát egy másik karakterlánccal helyettesíti. A grep funkció többféle módon kifejezhető az R nyelvben: regexpr, gregexpr grep, grepl és regexec.
Pl .: grep (mintázat, x, figyelmen kívül hagyás. Eset = FALSE, perl = FALSE, érték = FALSE, rögzített = FALSE, használja a Byte = FALSE, invert = FALSE)
érvek:
- Minta - Karakterlánc, amely olyan szokásos kifejezést tart, amely feltételezhetően megegyezik az adott karaktervektorral.
- X, szöveg - olyan objektum, amelyet karakterként karaktervektorra lehet korlátozni.
- Figyelmen kívül hagyni. Nagybetűk - (Hamis - A minták illesztése a kis- és nagybetűk között érzéketlen, Igaz - A mintázat illesztés kis- és nagybetűk között érzékeny)
- Perl - A Perl-kompatibilis kifejezések meghatározásához különösen a regexprns-t kell használni.
- Érték - Ha a talált egyezés valódi, hamis eredményt ad,
- Használjon bájtot - Ha IGAZ, azután az egyeztetés bájt-byte-ig történik, nem pedig karakterről karakterre.
- Invertálás - Az indexeket adja vissza, ha igaz,
- Csere - A csere húr,
2. Nchar ()
A karakterek számának megszámlálására szolgál egy vektorban. Vektort vesz fel string formátumban argumentumként, és visszatér egy másik numerikus vektort, amely tartalmazza a karakterlánc számát.
Pl .: nchar (x, type = “karakterek”, allowNA = FALSE, keepNA = NA)
érvek:
- X - Vektor húr.
- Típus - A karakterlánc típusa, a három általánosan használt („byte”, „karakter”, „szélesség”) felhasználásával.
- AllowNA - azt jelzi, hogy a 'Nem alkalmazható' visszaadható-e kimenetként.
- KeepNA - Ha a „Nem alkalmazható” vissza kell adni, ha X nem található.
3.Substr ()
A karakter vektor alszöveg értékének kiválasztására szolgál.
Pl .: substr (x, start, stop)
érvek:
- X, szöveg - a vektor bérelő karakterlánc.
- Start, első - egész szám. Az elem kezdete, amelyet várhatóan cserélnek
- Stop, Utolsó - egész szám. itt a cserét a húr végén végezzük
4. strsplit () az R karakterlánc funkciókban
Egy létező vektor-karakterláncot több részstringre osztására használnak a benne található alsó karakterlánc-egyezések szerint
Pl .: strsplit (x, split, fix = FALSE, perl = FALSE, useBytes = FALSE)
érvek:
- X - Karaktervektor, amelyet szétválnak.
- Split - Karaktervektor, amely elválasztóként működik.
- Rögzített - egyenlő osztást eredményez, ha igaznak tekintik
- Perl - Használjon Perl-kompatibilis regexpeket?
- UseBytes - ha valóban átadja, akkor byte byte byte egyeztetést indít el karakter-karakter egyeztetés helyett
5. Regexpr ()
A grep mellett a regexpr megadja azt az indexet, ahol érvényes egyezés kezdődik, és a megfelelő húrhossz, ha nem található egyezés, -1 érték kerül visszatérítésre.
Pl .: regexpr (minta, szöveg, ignore.case = FALSE, perl = FALSE, fix = FALSE, useBytes = FALSE)
érvek:
- Minta - Karakterlánc, amely olyan szokásos kifejezést tart, amely állítólag egyenlő az adott karaktervektorral.
- X - Karakter vektor
- Ignore.case - (Hamis - A minták illesztése a kis- és nagybetűk között érzéketlen, True - A szóhasználat-illesztés kis- és nagybetűk között érzékeny)
- Perl - A Perl-kompatibilis kifejezések meghatározásához különösen a regexprns-t kell használni
- Érték - Ha a talált egyezés valódi, hamis eredményt ad
- UseBytes - Ha IGAZ, azután az illesztés byte byte byte helyett karakterről karakterre történik.
- Invert - Az indexeket adja vissza, ha igaz
6. Gregexpr () az R karakterlánc funkciókban
A gregexpr nyújt hasonló hosszúságú listát ad vissza, mint egy szöveg, amelynek minden eleme hasonló formájú, mint a regexpr visszatérési értéke, azzal a különbséggel, hogy minden (diszjunkt) egyezés előzetes helyzetét megadjuk.
Szintaxis: gregexpr (minta, szöveg, ignore.case = FALSE, perl = FALSE, rögzített = FALSE, useBytes = FALSE, kivonat = FALSE)
érvek:
- Minta - Karakterlánc, amely olyan szokásos kifejezést tart, amely feltételezhetően megegyezik az adott karaktervektorral.
- X - Karakter vektor
- Ignore.case - (Hamis - A minták illesztése a kis- és nagybetűk között érzéketlen, Igaz - A minták illesztése a kis- és nagybetűk között érzékeny)
- Perl - A Perl-kompatibilis kifejezések meghatározásához különösen a regexprns-t kell használni
- Érték - Ha a talált egyezés valódi, hamis eredményt ad
- UseBytes - Ha IGAZ, azután az illesztés byte byte byte helyett karakterről karakterre történik.
- Invert - Az indexeket adja vissza, ha igaz
- Kivonat - Ha egy logikai jelzés egyezik, akkor az alsó rész kivonatát készítjük és visszaküldjük
7. Regexec ()
Az R karakterlánc-függvényekben szereplő regexec () nagyon hasonlít a regexpr () -re, kivéve, ha az indexek zárójelbe tették a megfelelő al-kifejezéseket
Szintaxis: regexec (minta, szöveg, ignore.case = FALSE, perl = FALSE, fix = FALSE, useBytes = FALSE)
érvek:
- Minta - Karakterlánc, amely olyan szokásos kifejezést tart, amely feltételezhetően megegyezik az adott karaktervektorral.
- X - Karakter vektor
- Ignore.case - (Hamis - A minták illesztése a kis- és nagybetűk között érzéketlen, True - A szóhasználat-illesztés kis- és nagybetűk között érzékeny)
- Perl - A Perl-kompatibilis kifejezések meghatározásához különösen a regexprns-t kell használni
- Érték - Ha a talált egyezés valódi, hamis eredményt ad
- UseBytes - Ha IGAZ, azután az illesztés byte byte byte helyett karakterről karakterre történik.
- Invert - Az indexeket adja vissza, ha igaz
Ajánlott cikkek
Ez egy útmutató az R karakterlánc funkciókhoz. Itt megvitattuk az R karakterlánc funkcióinak fogalmát, tulajdonságait, manipulálását példákkal és érvekkel. A további javasolt cikkeken keresztül további információkat is megtudhat -
- JavaScript karakterlánc-funkciók
- Oracle String funkciók
- T-SQL karakterlánc funkciók
- VBScript karakterlánc funkciók
- Regex funkciók a Pythonban (példa)