본문 바로가기
PROGRAMMING/R

[R] 문자열 나누기 및 자르기_strsplit(x , split ='any')

by HYUNHP 2021. 10. 28.
728x90
반응형

안녕하세요 R과 관련하여 추가적으로 필요한 정보가 있으시면,

DATA101에서 확인 가능하십니다.

감사합니다.


안녕하세요, Hello

 

R에서 strsplit(x, split = 'any') 함수는 split 인자의 'any' 안에 들어가는 구분자(seperator) 예를 들어, 쉼표(,), 마침표(.) 등 기준에 따라서 문자열을 분리해주는 함수입니다.

 

STEP 1. strsplit()

 


STEP 1. strsplit(x, split = 'any')

 

strsplit() 함수로 문자형 벡터를 나누면 결과가 리스트(list) 구조로 나옵니다.

아래와 같이 '띄어쓰기'로 구분된 주소에서 서울시, 경기도 등 광역시 정보만 추출해보겠습니다.

 

# 실습 주소 데이터
address <-c('서울 강남구 헌릉로569길', '경기 고양시 일산동구 정발산로 24', '전남 해남군 해남읍 중앙2로 18',
  '울산 중구 중앙2길', '강원 동해시 효자남길 8-6')

# '띄어쓰기'를 기준으로 데이터 분리
split_address <- strsplit(address, split = ' ')
split_address[1:2]

 

아래와 같이 결과가 출력됩니다.

 

 


strsplit() 함수는 문자를 공백으로만 분리하는 것이 아니라 구분자에 의해서 다양하게 나눌 수 있습니다. 모든 문자열을 한글자씩 나누거나 자르고 싶다면 구분자(Split)를 "" 또는 NULL로 설정하면 됩니다.

 

# '' 또는 NULL을 기준으로 한 글자씩 데이터 분리
one_split_address <- strsplit(address, split = '')
one_split_address[[1]]

null_split_address <- strsplit(address, split = NULL)
null_split_address[[2]]

 

 


■ 마무리

R에서 문자열 데이터를 나누거나 자르는 strsplit() 함수를 알아봤습니다.

감사합니다.

위 포스팅은 카카오 티스토리, 네이버 블로그에도 동일하게 업로드합니다.

반응형

댓글