R karakterlánc funkciók - Az R karakterisztika funkciójának manipulálása példákkal

Bevezetés az R-karakterlánc-funkciókba

Az R nyelv vagy az R karakterisztikus funkciók főként az adatok grafikus ábrázolására, az adatok statisztikai elemzésére és a jelentéskészítésre vonatkoznak. ez egy nyílt forráskódú nyelv. ennek a nyelvnek az elnevezési konvenciója a nyelv alapítóinak Ross Ihaka és Robert Gentleman első betűiből származik. Ez egy értelmezett programozási nyelv. Képes integrálni más különféle nyelvi eljárásokkal, nevezetesen a C ++, a Python, stb. Jelenleg az R az a világ, amelyet leginkább a programozási nyelv használ.

Az R karakterlánc funkciók jellemzői

Az R nyelv fő jellemzői az alábbiak,

Finoman kidolgozott és nagyon egyszerű statisztikai nyelv.
A tárolás és az adatkezelés nagyon hatékonyan beágyazódik az R-be.
Számos osztályozott eszközt kínál, amelyek segítenek az adatok elemzésében
R könyvtárakat is kínál az adatok grafikus ábrázolásához

R karakterlánc funkciók manipulálása

Az alábbiakban felsoroljuk az R karakterlánc-manipulációs funkciókat.

1. Grep () az R karakterlánc funkciókban

Az adatmintázat illesztésére szolgál, és a mintát egy másik karakterlánccal helyettesíti. A grep funkció többféle módon kifejezhető az R nyelvben: regexpr, gregexpr grep, grepl és regexec.

Pl .: grep (mintázat, x, figyelmen kívül hagyás. Eset = FALSE, perl = FALSE, érték = FALSE, rögzített = FALSE, használja a Byte = FALSE, invert = FALSE)

érvek:

Minta - Karakterlánc, amely olyan szokásos kifejezést tart, amely feltételezhetően megegyezik az adott karaktervektorral.
X, szöveg - olyan objektum, amelyet karakterként karaktervektorra lehet korlátozni.
Figyelmen kívül hagyni. Nagybetűk - (Hamis - A minták illesztése a kis- és nagybetűk között érzéketlen, Igaz - A mintázat illesztés kis- és nagybetűk között érzékeny)
Perl - A Perl-kompatibilis kifejezések meghatározásához különösen a regexprns-t kell használni.
Érték - Ha a talált egyezés valódi, hamis eredményt ad,
Használjon bájtot - Ha IGAZ, azután az egyeztetés bájt-byte-ig történik, nem pedig karakterről karakterre.
Invertálás - Az indexeket adja vissza, ha igaz,
Csere - A csere húr,

2. Nchar ()

A karakterek számának megszámlálására szolgál egy vektorban. Vektort vesz fel string formátumban argumentumként, és visszatér egy másik numerikus vektort, amely tartalmazza a karakterlánc számát.

Pl .: nchar (x, type = “karakterek”, allowNA = FALSE, keepNA = NA)

érvek:

X - Vektor húr.
Típus - A karakterlánc típusa, a három általánosan használt („byte”, „karakter”, „szélesség”) felhasználásával.
AllowNA - azt jelzi, hogy a 'Nem alkalmazható' visszaadható-e kimenetként.
KeepNA - Ha a „Nem alkalmazható” vissza kell adni, ha X nem található.

3.Substr ()

A karakter vektor alszöveg értékének kiválasztására szolgál.

Pl .: substr (x, start, stop)

érvek:

X, szöveg - a vektor bérelő karakterlánc.
Start, első - egész szám. Az elem kezdete, amelyet várhatóan cserélnek
Stop, Utolsó - egész szám. itt a cserét a húr végén végezzük

4. strsplit () az R karakterlánc funkciókban

Egy létező vektor-karakterláncot több részstringre osztására használnak a benne található alsó karakterlánc-egyezések szerint

Pl .: strsplit (x, split, fix = FALSE, perl = FALSE, useBytes = FALSE)

érvek:

X - Karaktervektor, amelyet szétválnak.
Split - Karaktervektor, amely elválasztóként működik.
Rögzített - egyenlő osztást eredményez, ha igaznak tekintik
Perl - Használjon Perl-kompatibilis regexpeket?
UseBytes - ha valóban átadja, akkor byte byte byte egyeztetést indít el karakter-karakter egyeztetés helyett

5. Regexpr ()

A grep mellett a regexpr megadja azt az indexet, ahol érvényes egyezés kezdődik, és a megfelelő húrhossz, ha nem található egyezés, -1 érték kerül visszatérítésre.

Pl .: regexpr (minta, szöveg, ignore.case = FALSE, perl = FALSE, fix = FALSE, useBytes = FALSE)

érvek:

Minta - Karakterlánc, amely olyan szokásos kifejezést tart, amely állítólag egyenlő az adott karaktervektorral.
X - Karakter vektor
Ignore.case - (Hamis - A minták illesztése a kis- és nagybetűk között érzéketlen, True - A szóhasználat-illesztés kis- és nagybetűk között érzékeny)
Perl - A Perl-kompatibilis kifejezések meghatározásához különösen a regexprns-t kell használni
Érték - Ha a talált egyezés valódi, hamis eredményt ad
UseBytes - Ha IGAZ, azután az illesztés byte byte byte helyett karakterről karakterre történik.
Invert - Az indexeket adja vissza, ha igaz

6. Gregexpr () az R karakterlánc funkciókban

A gregexpr nyújt hasonló hosszúságú listát ad vissza, mint egy szöveg, amelynek minden eleme hasonló formájú, mint a regexpr visszatérési értéke, azzal a különbséggel, hogy minden (diszjunkt) egyezés előzetes helyzetét megadjuk.

Szintaxis: gregexpr (minta, szöveg, ignore.case = FALSE, perl = FALSE, rögzített = FALSE, useBytes = FALSE, kivonat = FALSE)

érvek:

Minta - Karakterlánc, amely olyan szokásos kifejezést tart, amely feltételezhetően megegyezik az adott karaktervektorral.
X - Karakter vektor
Ignore.case - (Hamis - A minták illesztése a kis- és nagybetűk között érzéketlen, Igaz - A minták illesztése a kis- és nagybetűk között érzékeny)
Perl - A Perl-kompatibilis kifejezések meghatározásához különösen a regexprns-t kell használni
Érték - Ha a talált egyezés valódi, hamis eredményt ad
UseBytes - Ha IGAZ, azután az illesztés byte byte byte helyett karakterről karakterre történik.
Invert - Az indexeket adja vissza, ha igaz
Kivonat - Ha egy logikai jelzés egyezik, akkor az alsó rész kivonatát készítjük és visszaküldjük

7. Regexec ()

Az R karakterlánc-függvényekben szereplő regexec () nagyon hasonlít a regexpr () -re, kivéve, ha az indexek zárójelbe tették a megfelelő al-kifejezéseket

Szintaxis: regexec (minta, szöveg, ignore.case = FALSE, perl = FALSE, fix = FALSE, useBytes = FALSE)

érvek:

Minta - Karakterlánc, amely olyan szokásos kifejezést tart, amely feltételezhetően megegyezik az adott karaktervektorral.
X - Karakter vektor
Ignore.case - (Hamis - A minták illesztése a kis- és nagybetűk között érzéketlen, True - A szóhasználat-illesztés kis- és nagybetűk között érzékeny)
Perl - A Perl-kompatibilis kifejezések meghatározásához különösen a regexprns-t kell használni
Érték - Ha a talált egyezés valódi, hamis eredményt ad
UseBytes - Ha IGAZ, azután az illesztés byte byte byte helyett karakterről karakterre történik.
Invert - Az indexeket adja vissza, ha igaz

Ajánlott cikkek

Ez egy útmutató az R karakterlánc funkciókhoz. Itt megvitattuk az R karakterlánc funkcióinak fogalmát, tulajdonságait, manipulálását példákkal és érvekkel. A további javasolt cikkeken keresztül további információkat is megtudhat -

JavaScript karakterlánc-funkciók
Oracle String funkciók
T-SQL karakterlánc funkciók
VBScript karakterlánc funkciók
Regex funkciók a Pythonban (példa)

R karakterlánc funkciók - Az R karakterisztika funkciójának manipulálása példákkal

Tartalomjegyzék:

Bevezetés az R-karakterlánc-funkciókba

Az R karakterlánc funkciók jellemzői

R karakterlánc funkciók manipulálása

1. Grep () az R karakterlánc funkciókban

2. Nchar ()

3.Substr ()

4. strsplit () az R karakterlánc funkciókban

5. Regexpr ()

6. Gregexpr () az R karakterlánc funkciókban

7. Regexec ()

Ajánlott cikkek

Hozzáférés-módosítók Java - Különböző típusú Java hozzáférés-módosítók

Fiók alapú marketing - A fiókalapú marketing top 10 lépése

Abszolút érték Excelben (képlet, példák) Hogyan lehet használni az abszolút értéket?

Hozzáférés-módosítók a PHP-ben Ismerje meg a PHP 6 legfontosabb hozzáférési módosítóját

A 15 legnépszerűbb számviteli interjúval kapcsolatos kérdés és válasz (Frissítve 2019-re)

SEO interjú kérdései 10 SEO interjúval kapcsolatos kérdés és válasz

Miért SEO fontos a digitális marketing - edu CBA

15 leggyakoribb és leghatékonyabb mítoszok tudni SEO

SEO mítoszok - 5 hatékony SEO követési tipp és 8 SEO mítosz.

Érzékelő készülék - Mi az érzékelő eszköz? és 5 típusa

Data Scientist vs Data Mining - Hasznos 7 összehasonlítás, amit tudni kell

Data Scientist vs Data Engineer - 7 csodálatos összehasonlítás

3 legjobb adatkarrier adattudós és adatmérnök vs statisztikus számára

Data Scientist vs Software Engineer - Hasznos 8 összehasonlítás

Adattudós vs. gépi tanulás - melyik a jobb