본문 바로가기
반응형

PROGRAMMING/R14

[R] string 공백 제거, 없애기 (gsub) 안녕하세요, HELLO R에서 문자열에서 공백을 제거하는 가장 일반적인 방법 중 하나는 문자열의 지정된 패턴을 새 값으로 바꿀 수 있는 gsub() 함수를 사용하는 것입니다. 이 경우 '\\s' 패턴을 사용하여 문자열의 공백을 나타내고 "" 인수를 사용하여 빈 문자열로 바꿀 수 있습니다. 오늘 gsub 함수를 활용하여, R에서 공백을 제거하는 방법에 대해서 살펴보겠습니다. STEP 1. 'gsub' 활용하여 공백 제거 # Define a string with blank spaces my_string 2023. 2. 15.
[R] is.na, complete.cases, na.omit 결측치 확인, 수정, 제거 안녕하세요, HELLO 데이터 분석에서 결측치는 분석 결과에 왜곡, 오류 등을 발생할 수 있기에 수정, 대체, 삭제 등의 전처리가 필요합니다. 이러한 결측치는 데이터 수집 과정에서 오류, 무응답 혹은 의미 없는 값 그리고 수학적으로 계산이 불가능한 값 등이 해당됩니다. 오늘은 결측치를 R에서 확인, 수정 그리고 제거하는 방법에 대해서 정리하고자 합니다. STEP 1. '결측치' 개념 STEP 2. '결측치' 확인 STEP 3. '결측치' 처리 STEP 1. '결측치' 개념 결측치는 분석 결과에 왜곡, 오류 등을 발생할 수 있기에 수정, 대체, 삭제 등의 전처리가 필요합니다. 이러한 결측치는 데이터 수집 과정에서 오류, 무응답 혹은 의미 없는 값일 수도 있습니다. 이러한 결측치를 아래처럼 정리해봤습니다. .. 2022. 1. 29.
[R] getwd, dir, setwd_작업 디렉토리, 작업 경로 확인, 지정하기 안녕하세요, HELLO 작업 경로(working directory)는 데이터 저장 또는 불러올 때 기본적으로 설정되어 있는 경로를 의미합니다. 이와 관련하여 경로를 확인, 지정하기 위해 주로 사용하는 함수는 getwd, setwd, dir와 같은 함수가 있습니다. getwd() 함수는 작업 공간의 경로를 확인하는 함수이며, setwd() 함수는 작업 공간의 경로를 지정하는 함수입니다. 오늘은 작업 경로, 작업 디렉토리의 위치를 확인하고 지정하는 함수에 대해서 살펴보겠습니다. STEP 1. 'getwd() 함수' 설명 STEP 2. 'setwd() 함수' 설명 STEP 1. 'getwd() 함수' 설명 getwd 함수는 현재 작업 경로의 위치를 확인할 수 있는 함수입니다. dir 함수는 현재 작업 경로로 .. 2022. 1. 29.
[R] c 함수, seq 함수, rep 함수_벡터(vector) 만들기 안녕하세요, HELLO 이번에 R을 활용하여 벡터(vector)를 만드는 함수에 대해서 살펴보고자 합니다. 벡터(vector)는 하나 이상의 문자, 숫자 등의 덩어리로 동일한 데이터의 유형인 1차원 데이터 자료 구조입니다. R에서 벡터를 c(), seq(), rep() 등으로 만들 수 있습니다. STEP 1. 'c()' 설명 STEP 2. 'seq()' 설명 STEP 3. 'rep()' 설명 STEP 1. 'c()' 설명 함수 c()를 통해 벡터를 생성할 수 있으며, : (콜론)과 , (쉼표)를 활용하여 연속형 그리고 이산형 데이터를 만들 수 있습니다. # 연속형 데이터 x 2022. 1. 29.
[R] if, else if, ifelse 조건문 개념, 정리 안녕하세요, HELLO 조건문은 주어진 값에 따라 조건에 맞으면 문장을 출력 또는 명령어를 수행합니다. 오늘은 R의 조건문 if, if else, elseif에 대해 정리하고자 합니다. STEP 0. '조건문' 개념 STEP 1. 'if' 설명 STEP 2. 'ifelse' 설명 STEP 3. 'else if' 설명 STEP 0. '조건문' 개념 조건문은 주어진 값에 따라 조건에 맞으면 문장을 출력 또는 명령어를 수행합니다. 조건에 따라 참(True)인 경우와 거짓(False)인 경우를 나눠서, 순차적으로 참, 거짓을 판별하면서 명령을 진행합니다. STEP 1. 'if' 설명 조건문에서 if 문은 문장 출력과 다른 명령어 수행을 할 수 있다는 점입니다. 다만, 벡터 연산이 불가하고 오로지 하나의 조건에 .. 2022. 1. 28.
[R] read.table, read.csv 외부 데이터 불러오기 안녕하세요, HELLO 오늘은 R에서 외부 데이터(txt, csv, excel 등)를 불러올 때 활용하는 read 함수에서, read.table()과 read.csv()를 살펴보겠습니다. read.table() 함수는 txt 파일을 read.csv() 함수는 csv 파일을 불러오며, 데이터프레임으로 저장 가능합니다. STEP 1. 'read.table("파일이름")' 설명 STEP 2. 'read.csv("파일이름") 설명 STEP 1. 'read.table("파일이름")' 설명 read.table() 함수는 txt 파일을 테이블 형식의 데이터프레임으로 만들 수 있으며, 쌍 따옴표로"파일 이름"을 묶어서 불러와야 합니다. 그리고 "파일 이름" 뒤에 쉼표(,)를 구분으로 header, sep(구분자) 등의.. 2022. 1. 28.
[R] ggplot2(ggplot) 활용하여 그래프 그리기 안녕하세요, HELLO R의 기본 그래프 함수는 별다른 패키지를 설치하지 않아도 그래프를 생성할 수 있지만 색, 디자인 등을 모두 직접 설정해야 되는 등의 어려움이 있습니다. 그래서 R에서는 복잡한 그래프 생성 및 별다른 설정 없이도 예쁜 디자인을 만들 수 있는 ggplot2을 활용해서 그래프를 그릴 수 있습니다. ggplot2는 그래프 요소들을 함수로 분리하고 층(layer)을 쌓듯이 '+' 기호를 활용하여 여러 함수들을 연결하여 그래프를 더해가며 그려갈 수 있습니다. 오늘은 그래프 디자인 라이브러리 ggplot2를 정리하려고 합니다. STEP 1. 'ggplot2 라이브러리' 개념 STEP 2. 'ggplot2 라이브러리' 설명 STEP 1. 'ggplot2 라이브러리' 개념 R의 그래프 디자인 라이.. 2022. 1. 15.
[R] 막대 차트, 막대 그래프 (Bar plot) 그리기 안녕하세요, HELLO 범주형 데이터를 살펴볼 때 사용되는 막대 차트, 막대그래프 (barplot)에 대해서 정리하려고 합니다. 막대 차트는 범주형 데이터의 값을 막대 높이로 표현함으로써 범주 간 차이를 파악할 수 있습니다. 오늘은 barplot 함수를 활용해서, 막대 차트의 개념과 코드에 대해서 살펴보겠습니다. STEP 1. '막대 차트, 막대 그래프 (barplot)' 개념 STEP 2. '막대 차트, 막대 그래프 (barplot)' 코드 설명 STEP 1. '막대 차트, 막대 그래프 (barplot)' 개념 막대 차트(bar chart), 막대그래프(bar graph), 바 그래프(bar graph)는 높이와 길이를 지닌 직사각형 막대로 범주형 데이터를 표현하는 차트나 그래프를 말합니다. 막대 차트.. 2022. 1. 13.
[R] 그래프: 파이 차트 (원 그래프/pie chart) 그리기 안녕하세요 R과 관련하여 추가적으로 필요한 정보가 있으시면, DATA101에서 확인 가능하십니다. 감사합니다. 안녕하세요, HELLO 이번엔 범주형 데이터를 살펴볼 때 사용되는 파이 차트(pie chart)에 대해서 살펴보고자 합니다. 파이 차트는 범주형 데이터들의 건수를 추출해 범주 간 차지하는 비율을 확인하는데 일반적으로 사용됩니다. STEP 1. 파이 차트 (원 그래프/pie chart) 개념 STEP 2. 파이 차트 (원 그래프/pie chart) 그리기 STEP 1. 파이 차트 (원 그래프/pie chart) 개념 파이 차트(원 그래프)는 범주형 데이터에 대한 상대도수분포를 나타내기 위해 일반적으로 사용되는 그래프로 전체 대비 범주 간 비중을 비교할 때 유용하게 활용할 수 있습니다. 그리는 방법.. 2021. 11. 3.
반응형