728x90
반응형
안녕하세요 R과 관련하여 추가적으로 필요한 정보가 있으시면,
DATA101에서 확인 가능하십니다.
감사합니다.
안녕하세요, Hello
R에서 strsplit(x, split = 'any') 함수는 split 인자의 'any' 안에 들어가는 구분자(seperator) 예를 들어, 쉼표(,), 마침표(.) 등 기준에 따라서 문자열을 분리해주는 함수입니다.
STEP 1. strsplit()
STEP 1. strsplit(x, split = 'any')
strsplit() 함수로 문자형 벡터를 나누면 결과가 리스트(list) 구조로 나옵니다.
아래와 같이 '띄어쓰기'로 구분된 주소에서 서울시, 경기도 등 광역시 정보만 추출해보겠습니다.
# 실습 주소 데이터
address <-c('서울 강남구 헌릉로569길', '경기 고양시 일산동구 정발산로 24', '전남 해남군 해남읍 중앙2로 18',
'울산 중구 중앙2길', '강원 동해시 효자남길 8-6')
# '띄어쓰기'를 기준으로 데이터 분리
split_address <- strsplit(address, split = ' ')
split_address[1:2]
아래와 같이 결과가 출력됩니다.
strsplit() 함수는 문자를 공백으로만 분리하는 것이 아니라 구분자에 의해서 다양하게 나눌 수 있습니다. 모든 문자열을 한글자씩 나누거나 자르고 싶다면 구분자(Split)를 "" 또는 NULL로 설정하면 됩니다.
# '' 또는 NULL을 기준으로 한 글자씩 데이터 분리
one_split_address <- strsplit(address, split = '')
one_split_address[[1]]
null_split_address <- strsplit(address, split = NULL)
null_split_address[[2]]
■ 마무리
R에서 문자열 데이터를 나누거나 자르는 strsplit() 함수를 알아봤습니다.
감사합니다.
위 포스팅은 카카오 티스토리, 네이버 블로그에도 동일하게 업로드합니다.
반응형
'PROGRAMMING > R' 카테고리의 다른 글
[R] 그래프: 파이 차트 (원 그래프/pie chart) 그리기 (0) | 2021.11.03 |
---|---|
[R] 그래프: 히스토그램(HIST, Histogram) 그리기 (0) | 2021.11.01 |
[R] 그래프: 상자그림 (box plot/box and whisker plot) 그리기 (0) | 2021.10.29 |
[R] 데이터 분석 기초(평균, 중간값, 분산, 표준편차, 백분위수) (0) | 2021.10.28 |
[R] 데이터 구조 확인하기 str( ), head( ), tail( ) (0) | 2021.10.21 |
댓글