R의 문자열에서 마지막 n 문자 추출
R의 문자열에서 마지막 n자를 어떻게 얻을 수 있습니까? SQL의 RIGHT와 같은 기능이 있습니까?
기본 R에는 아무것도 몰랐지만 substr
and를 사용 하여이 작업을 수행하는 것은 간단합니다 nchar
.
x <- "some text in a string"
substrRight <- function(x, n){
substr(x, nchar(x)-n+1, nchar(x))
}
substrRight(x, 6)
[1] "string"
substrRight(x, 8)
[1] "a string"
@mdsumner가 지적한 것처럼 벡터화됩니다. 치다:
x <- c("some text in a string", "I really need to learn how to count")
substrRight(x, 6)
[1] "string" " count"
stringr
패키지 사용이 마음에 들지 않으면 str_sub
음수를 사용하여 역으로 계산할 수 있으므로 편리합니다.
x <- "some text in a string"
str_sub(x,-6,-1)
[1] "string"
또는 Max가이 답변에 대한 의견에서 지적한 것처럼,
str_sub(x, start= -6)
[1] "string"
패키지의 stri_sub
기능을 사용하십시오 stringi
. 끝에서 부분 문자열을 얻으려면 음수를 사용하십시오. 아래 예를보십시오.
stri_sub("abcde",1,3)
[1] "abc"
stri_sub("abcde",1,1)
[1] "a"
stri_sub("abcde",-3,-1)
[1] "cde"
github에서이 패키지를 설치할 수 있습니다 : https://github.com/Rexamine/stringi
CRAN에서 사용 가능합니다. 간단히 입력하십시오.
install.packages("stringi")
이 패키지를 설치합니다.
str = 'This is an example'
n = 7
result = substr(str,(nchar(str)+1)-n,nchar(str))
print(result)
> [1] "example"
>
업데이트 : mdsumner 에서 언급했듯이 substr이기 때문에 원래 코드는 이미 벡터화되었습니다. 더 조심해야 했어요.
그리고 벡터화 된 버전을 원한다면 ( Andrie 의 코드를 기반으로 )
substrRight <- function(x, n){
sapply(x, function(xx)
substr(xx, (nchar(xx)-n+1), nchar(xx))
)
}
> substrRight(c("12345","ABCDE"),2)
12345 ABCDE
"45" "DE"
내가 변경 한 것을 참고 (nchar(x)-n)
하는 (nchar(x)-n+1)
얻을 n
문자.
또 다른 합리적인 방법은 정규 표현식을 사용하는 것입니다 sub
.
sub('.*(?=.$)', '', string, perl=T)
따라서 "한 문자 뒤에 모든 것을 제거하십시오". 끝에서 더 많은 문자를 얻으려면 lookahead 어설 션에 많은 점을 추가하십시오.
sub('.*(?=.{2}$)', '', string, perl=T)
어디 .{2}
수단 ..
그렇게하는 의미, 또는 "두 글자", "모든 것을 제거는 두 문자 다음에".
sub('.*(?=.{3}$)', '', string, perl=T)
변수를 사용하여 잡을 문자 수를 설정할 수 있지만 paste
변수 값을 정규식 문자열에 입력해야합니다.
n = 3
sub(paste('.+(?=.{', n, '})', sep=''), '', string, perl=T)
substring()
함수를 사용하는 간단한 기본 R 솔루션 (이 기능이 존재한다는 것을 누가 알았습니까?) :
RIGHT = function(x,n){
substring(x,nchar(x)-n+1)
}
기본적으로 substr()
아래에 있지만 기본 종료 값은 1,000,000입니다.
예 :
> RIGHT('Hello World!',2)
[1] "d!"
> RIGHT('Hello World!',8)
[1] "o World!"
대안 substr
은 문자열을 단일 문자 목록으로 분할하고 다음을 처리하는 것입니다.
N <- 2
sapply(strsplit(x, ""), function(x, n) paste(tail(x, n), collapse = ""), N)
나도 사용 substr
하지만 다른 방식으로. "음식 좀주세요"의 마지막 6 글자를 추출하고 싶습니다. 단계는 다음과 같습니다.
(1) 캐릭터 분할
splits <- strsplit("Give me your food.", split = "")
(2) 마지막 6 자 추출
tail(splits[[1]], n=6)
산출:
[1] " " "f" "o" "o" "d" "."
각 문자는로 액세스 할 수 있습니다 splits[[1]][x]
. 여기서 x는 1에서 6입니다.
전에 누군가 비슷한 솔루션을 사용하여 광산을 사용하지만 다음과 같이 생각하기가 더 쉽다는 것을 알았습니다.
> text<-"some text in a string" # we want to have only the last word "string" with 6 letter
> n<-5 #as the last character will be counted with nchar(), here we discount 1
> substr(x=text,start=nchar(text)-n,stop=nchar(text))
마지막 문자를 원하는대로 가져옵니다.
이 시도:
x <- "some text in a string"
n <- 5
substr(x, nchar(x)-n, nchar(x))
그것은 다음을 제공합니다 :
[1] "string"
문자열의 마지막 문자를 얻기 위해 다음 코드를 사용했습니다.
substr(output, nchar(stringOfInterest), nchar(stringOfInterest))
nchar (stringOfInterest)를 사용하여 마지막 몇자를 얻는 방법을 알아낼 수 있습니다.
@Andrie 솔루션을 약간 수정하면 보완 기능도 제공합니다.
substrR <- function(x, n) {
if(n > 0) substr(x, (nchar(x)-n+1), nchar(x)) else substr(x, 1, (nchar(x)+n))
}
x <- "moSvmC20F.5.rda"
substrR(x,-4)
[1] "moSvmC20F.5"
그것이 내가 찾던 것이 었습니다. 그리고 왼쪽으로 초대합니다.
substrL <- function(x, n){
if(n > 0) substr(x, 1, n) else substr(x, -n+1, nchar(x))
}
substrL(substrR(x,-4),-2)
[1] "SvmC20F.5"
다양한 문자를 선택해야하는 경우를 대비하여 :
# For example, to get the date part from the string
substrRightRange <- function(x, m, n){substr(x, nchar(x)-m+1, nchar(x)-m+n)}
value <- "REGNDATE:20170526RN"
substrRightRange(value, 10, 8)
[1] "20170526"
참고 URL : https://stackoverflow.com/questions/7963898/extracting-the-last-n-characters-from-a-string-in-r
'IT story' 카테고리의 다른 글
힘내 병합 오류 (0) | 2020.04.08 |
---|---|
mustache.js에서 if / else를 어떻게 달성합니까? (0) | 2020.04.08 |
WebKit이 스타일 변경을 전파하기 위해 다시 그리거나 다시 그리도록하려면 어떻게해야합니까? (0) | 2020.04.08 |
루비에서 변수가 nil이 아니고 0이 아닌지 확인 (0) | 2020.04.08 |
ng-click을 사용하여 경로를 호출하는 방법 / 언제? (0) | 2020.04.08 |