Bevezetés az R-karakterlánc-funkciókba

Az R nyelv vagy az R karakterisztikus funkciók főként az adatok grafikus ábrázolására, az adatok statisztikai elemzésére és a jelentéskészítésre vonatkoznak. ez egy nyílt forráskódú nyelv. ennek a nyelvnek az elnevezési konvenciója a nyelv alapítóinak Ross Ihaka és Robert Gentleman első betűiből származik. Ez egy értelmezett programozási nyelv. Képes integrálni más különféle nyelvi eljárásokkal, nevezetesen a C ++, a Python, stb. Jelenleg az R az a világ, amelyet leginkább a programozási nyelv használ.

Az R karakterlánc funkciók jellemzői

Az R nyelv fő jellemzői az alábbiak,

  • Finoman kidolgozott és nagyon egyszerű statisztikai nyelv.
  • A tárolás és az adatkezelés nagyon hatékonyan beágyazódik az R-be.
  • Számos osztályozott eszközt kínál, amelyek segítenek az adatok elemzésében
  • R könyvtárakat is kínál az adatok grafikus ábrázolásához

R karakterlánc funkciók manipulálása

Az alábbiakban felsoroljuk az R karakterlánc-manipulációs funkciókat.

1. Grep () az R karakterlánc funkciókban

Az adatmintázat illesztésére szolgál, és a mintát egy másik karakterlánccal helyettesíti. A grep funkció többféle módon kifejezhető az R nyelvben: regexpr, gregexpr grep, grepl és regexec.

Pl .: grep (mintázat, x, figyelmen kívül hagyás. Eset = FALSE, perl = FALSE, érték = FALSE, rögzített = FALSE, használja a Byte = FALSE, invert = FALSE)

érvek:

  • Minta - Karakterlánc, amely olyan szokásos kifejezést tart, amely feltételezhetően megegyezik az adott karaktervektorral.
  • X, szöveg - olyan objektum, amelyet karakterként karaktervektorra lehet korlátozni.
  • Figyelmen kívül hagyni. Nagybetűk - (Hamis - A minták illesztése a kis- és nagybetűk között érzéketlen, Igaz - A mintázat illesztés kis- és nagybetűk között érzékeny)
  • Perl - A Perl-kompatibilis kifejezések meghatározásához különösen a regexprns-t kell használni.
  • Érték - Ha a talált egyezés valódi, hamis eredményt ad,
  • Használjon bájtot - Ha IGAZ, azután az egyeztetés bájt-byte-ig történik, nem pedig karakterről karakterre.
  • Invertálás - Az indexeket adja vissza, ha igaz,
  • Csere - A csere húr,

2. Nchar ()

A karakterek számának megszámlálására szolgál egy vektorban. Vektort vesz fel string formátumban argumentumként, és visszatér egy másik numerikus vektort, amely tartalmazza a karakterlánc számát.

Pl .: nchar (x, type = “karakterek”, allowNA = FALSE, keepNA = NA)

érvek:

  • X - Vektor húr.
  • Típus - A karakterlánc típusa, a három általánosan használt („byte”, „karakter”, „szélesség”) felhasználásával.
  • AllowNA - azt jelzi, hogy a 'Nem alkalmazható' visszaadható-e kimenetként.
  • KeepNA - Ha a „Nem alkalmazható” vissza kell adni, ha X nem található.

3.Substr ()

A karakter vektor alszöveg értékének kiválasztására szolgál.

Pl .: substr (x, start, stop)

érvek:

  • X, szöveg - a vektor bérelő karakterlánc.
  • Start, első - egész szám. Az elem kezdete, amelyet várhatóan cserélnek
  • Stop, Utolsó - egész szám. itt a cserét a húr végén végezzük

4. strsplit () az R karakterlánc funkciókban

Egy létező vektor-karakterláncot több részstringre osztására használnak a benne található alsó karakterlánc-egyezések szerint

Pl .: strsplit (x, split, fix = FALSE, perl = FALSE, useBytes = FALSE)

érvek:

  • X - Karaktervektor, amelyet szétválnak.
  • Split - Karaktervektor, amely elválasztóként működik.
  • Rögzített - egyenlő osztást eredményez, ha igaznak tekintik
  • Perl - Használjon Perl-kompatibilis regexpeket?
  • UseBytes - ha valóban átadja, akkor byte byte byte egyeztetést indít el karakter-karakter egyeztetés helyett

5. Regexpr ()

A grep mellett a regexpr megadja azt az indexet, ahol érvényes egyezés kezdődik, és a megfelelő húrhossz, ha nem található egyezés, -1 érték kerül visszatérítésre.

Pl .: regexpr (minta, szöveg, ignore.case = FALSE, perl = FALSE, fix = FALSE, useBytes = FALSE)

érvek:

  • Minta - Karakterlánc, amely olyan szokásos kifejezést tart, amely állítólag egyenlő az adott karaktervektorral.
  • X - Karakter vektor
  • Ignore.case - (Hamis - A minták illesztése a kis- és nagybetűk között érzéketlen, True - A szóhasználat-illesztés kis- és nagybetűk között érzékeny)
  • Perl - A Perl-kompatibilis kifejezések meghatározásához különösen a regexprns-t kell használni
  • Érték - Ha a talált egyezés valódi, hamis eredményt ad
  • UseBytes - Ha IGAZ, azután az illesztés byte byte byte helyett karakterről karakterre történik.
  • Invert - Az indexeket adja vissza, ha igaz

6. Gregexpr () az R karakterlánc funkciókban

A gregexpr nyújt hasonló hosszúságú listát ad vissza, mint egy szöveg, amelynek minden eleme hasonló formájú, mint a regexpr visszatérési értéke, azzal a különbséggel, hogy minden (diszjunkt) egyezés előzetes helyzetét megadjuk.

Szintaxis: gregexpr (minta, szöveg, ignore.case = FALSE, perl = FALSE, rögzített = FALSE, useBytes = FALSE, kivonat = FALSE)

érvek:

  • Minta - Karakterlánc, amely olyan szokásos kifejezést tart, amely feltételezhetően megegyezik az adott karaktervektorral.
  • X - Karakter vektor
  • Ignore.case - (Hamis - A minták illesztése a kis- és nagybetűk között érzéketlen, Igaz - A minták illesztése a kis- és nagybetűk között érzékeny)
  • Perl - A Perl-kompatibilis kifejezések meghatározásához különösen a regexprns-t kell használni
  • Érték - Ha a talált egyezés valódi, hamis eredményt ad
  • UseBytes - Ha IGAZ, azután az illesztés byte byte byte helyett karakterről karakterre történik.
  • Invert - Az indexeket adja vissza, ha igaz
  • Kivonat - Ha egy logikai jelzés egyezik, akkor az alsó rész kivonatát készítjük és visszaküldjük

7. Regexec ()

Az R karakterlánc-függvényekben szereplő regexec () nagyon hasonlít a regexpr () -re, kivéve, ha az indexek zárójelbe tették a megfelelő al-kifejezéseket

Szintaxis: regexec (minta, szöveg, ignore.case = FALSE, perl = FALSE, fix = FALSE, useBytes = FALSE)

érvek:

  • Minta - Karakterlánc, amely olyan szokásos kifejezést tart, amely feltételezhetően megegyezik az adott karaktervektorral.
  • X - Karakter vektor
  • Ignore.case - (Hamis - A minták illesztése a kis- és nagybetűk között érzéketlen, True - A szóhasználat-illesztés kis- és nagybetűk között érzékeny)
  • Perl - A Perl-kompatibilis kifejezések meghatározásához különösen a regexprns-t kell használni
  • Érték - Ha a talált egyezés valódi, hamis eredményt ad
  • UseBytes - Ha IGAZ, azután az illesztés byte byte byte helyett karakterről karakterre történik.
  • Invert - Az indexeket adja vissza, ha igaz

Ajánlott cikkek

Ez egy útmutató az R karakterlánc funkciókhoz. Itt megvitattuk az R karakterlánc funkcióinak fogalmát, tulajdonságait, manipulálását példákkal és érvekkel. A további javasolt cikkeken keresztül további információkat is megtudhat -

  1. JavaScript karakterlánc-funkciók
  2. Oracle String funkciók
  3. T-SQL karakterlánc funkciók
  4. VBScript karakterlánc funkciók
  5. Regex funkciók a Pythonban (példa)

Kategória: