Programing

R 벡터의 모든 요소에서 마지막 n 문자를 제거하는 방법

lottogame 2020. 9. 15. 19:10
반응형

R 벡터의 모든 요소에서 마지막 n 문자를 제거하는 방법


저는 R을 처음 접했고 벡터의 모든 요소 (배열?)에서 마지막 n 문자를 제거하는 방법에 대한 간단한 예를 온라인에서 찾을 수 없습니다.

저는 Java 배경에서 왔기 때문에 모든 요소를 ​​반복하고 모든 요소 a$data에서 마지막 3 개 문자를 제거하고 싶습니다 .

어떻게 하시겠습니까?


다음은 내가 할 일의 예입니다. 나는 그것이 당신이 찾고있는 것이기를 바랍니다.

char_array = c("foo_bar","bar_foo","apple","beer")
a = data.frame("data"=char_array,"data2"=1:4)
a$data = substr(a$data,1,nchar(a$data)-3)

a는 이제 다음을 포함해야합니다.

  data data2
1 foo_ 1
2 bar_ 2
3   ap 3
4    b 4

방법은 gsub다음 같습니다.

cs <- c("foo_bar","bar_foo","apple","beer")
gsub('.{3}$', '', cs)
# [1] "foo_" "bar_" "ap"   "b"

이것은 @nfmcclure의 대답과 거의 동일하지만 stringr기본 R에있는 것보다 이름이 가장 일관되고 설명적인 함수 집합을 제공하기 때문에 package를 사용하는 것을 선호합니다 (사실 저는 항상 "수를 얻는 방법 이름을 기억할 수 없기 때문에 R의 문자nchar() ).

library(stringr)
str_sub(iris$Species, 1, str_length(iris$Species)-3)

그러면 Species열의 각 값에서 마지막 3 개 문자가 제거 됩니다.


stringi 패키지로도 동일한 결과를 얻을 수 있습니다 .

library('stringi')
char_array <- c("foo_bar","bar_foo","apple","beer")
a <- data.frame("data"=char_array, "data2"=1:4)
(a$data <- stri_sub(a$data, 1, -4)) # from the first to the last but 4th char
## [1] "foo_" "bar_" "ap"   "b" 

@Matthew_Plourde와 유사합니다. gsub

그러나 0 문자로 트리밍되는 패턴을 사용합니다. 즉, 원래 문자열이 잘라낼 문자 수보다 짧으면 ""를 반환합니다 .

cs <- c("foo_bar","bar_foo","apple","beer","so","a")
gsub('.{0,3}$', '', cs)
# [1] "foo_" "bar_" "ap"   "b"    ""    ""

차이점은 {0,3}수량 자는 0 ~ 3 개의 일치 항목을 나타내는 반면 {3}정확히 3 개의 일치 항목이 필요하다는 점입니다. 그렇지 않으면 gsub수정되지 않은 원래 문자열을 반환하는 일치 항목이 없습니다 .

NB를 사용 {,3}하는 것은 {0,3}, 나는 단순히 후자의 표기법을 선호합니다.

정규식 한정자에 대한 자세한 내용은 https://www.regular-expressions.info/refrepeat.html을 참조하십시오.

참고 URL : https://stackoverflow.com/questions/23413331/how-to-remove-last-n-characters-from-every-element-in-the-r-vector

반응형