본문 바로가기
반응형

전체 글786

[기술] 2021년 인공지능(AI) 기술실증 테스트베드 연계 기회제공형 실증 지원사업.. 공고 안녕하세요, HELLO 이번에는 '경기도경제과학진흥원'에서 진행하는 '2021년 인공지능(AI) 기술실증 테스트베드 연계 기회제공형 실증 지원사업'에 대해서 '인공지능(AI) 기술구현 및 활용을 위한 기술실증 테스트베트 기회제공 목적'에 따라 신규과제 모집을 하고 있습니다. 오늘은 '2021년 11월 17일(수)'에 제출인 '인공지능(AI) 기술실증 테스트베드 연계 기회제공형 실증 지원사업'을 알아보겠습니다. '인공지능(AI) 기술실증 테스트베드 연계 기회제공형 실증 지원사업'_KEY POINT 사업명 2021년 인공지능(AI) 기술실증 테스트베드 연계 기회제공형 실증 지원사업 접수기간 2021년 10월 18일(월) ~ 11월 17일(수)_이지비즈 온라인 접수 지원대상 국내 AI 기술 및 제품 보유 중소.. 2021. 11. 6.
[R] 그래프: 파이 차트 (원 그래프/pie chart) 그리기 안녕하세요 R과 관련하여 추가적으로 필요한 정보가 있으시면, DATA101에서 확인 가능하십니다. 감사합니다. 안녕하세요, HELLO 이번엔 범주형 데이터를 살펴볼 때 사용되는 파이 차트(pie chart)에 대해서 살펴보고자 합니다. 파이 차트는 범주형 데이터들의 건수를 추출해 범주 간 차지하는 비율을 확인하는데 일반적으로 사용됩니다. STEP 1. 파이 차트 (원 그래프/pie chart) 개념 STEP 2. 파이 차트 (원 그래프/pie chart) 그리기 STEP 1. 파이 차트 (원 그래프/pie chart) 개념 파이 차트(원 그래프)는 범주형 데이터에 대한 상대도수분포를 나타내기 위해 일반적으로 사용되는 그래프로 전체 대비 범주 간 비중을 비교할 때 유용하게 활용할 수 있습니다. 그리는 방법.. 2021. 11. 3.
[IT_INFO] 온프레미스(On-premise) 그리고 클라우드(Cloud, Off-premise) 안녕하세요, HELLO 데이터 분석 업무를 진행하게 되면, 자사 또는 타사, 고객사의 데이터를 확인하게 됩니다. 기업의 서버를 회사 자체 전산 서버에 보관하는가 아니면 서버를 인터넷을 통해 클라우드에 연결하는가에 따라 데이터 수집 방법에 차이가 있습니다. 이때, 기업의 서버가 회사 자체 서버에 보관하게 되면 온프레미스(On-premise) 방식이라 하며, 서버를 인터넷을 통해 클라우드에 연결하면 오프프레미스(Off-premise) 또는 클라우드(Cloud) 방식이라 합니다. 아래에서 온프레미스와 오프프레미스, 클라우드에 대해서 알아보겠습니다. STEP 1. 온프레미스(On-premise) 개념 STEP 2. 오프프레미스(Off-premise), 클라우드(Cloud) 개념 STEP 1. 온프레미스(On-p.. 2021. 11. 3.
[R] 그래프: 히스토그램(HIST, Histogram) 그리기 안녕하세요 R과 관련하여 추가적으로 필요한 정보가 있으시면, DATA101에서 확인 가능하십니다. 감사합니다. 안녕하세요, HELLO ​ 연속된 데이터를 구간별로 나누고, 그 구간에 해당하는 빈도수를 시각화하여, 데이터의 분포 특성을 파악하는 데 유용한 히스토그램(histogram)에 대해서 알아보겠습니다. STEP 1. 히스토그램(HIST, histogram) 개념 ​ STEP 2. 히스토그램(HIST, histogram) 그리기 STEP 1. 히스토그램(HIST, histogram) 개념 히스토그램(histogram)은 연속형 자료에 대한 도수분포표를 시각화한 그래프다. 이로 인해, 히스토그램의 1개의 막대(봉)는 1개의 구간(가로)과 그 구간 내에 속하는 데이터의 빈도수(세로)를 표현합니다. 이를 .. 2021. 11. 1.
[R] 그래프: 상자그림 (box plot/box and whisker plot) 그리기 안녕하세요 R과 관련하여 추가적으로 필요한 정보가 있으시면, DATA101에서 확인 가능하십니다. 감사합니다. 안녕하세요, HELLO 데이터를 시각화를 통해 전체적인 모습을 확인하는 방법 중에 '사분위수(Quarter Percentile)와 이상치(Outlier)'을 시각화하여, 데이터의 중심과 분포를 파악하는 데 편리한 상자그림(box plot/box and whisker plot)에 대해서 알아보겠습니다. STEP 1. 상자그림(box plot) 개념 STEP 2. 상자그림(box plot) 그리기 STEP 1. 상자그림(box plot) 개념 상자그림(box plot)은 중앙값, 제1사분위수, 제3사분위수 등의 기술 통계량을 상자 모양으로 나타낸 그래프입니다. 상자그림과 각 요소별 의미는 아래와 같.. 2021. 10. 29.
[R] 문자열 나누기 및 자르기_strsplit(x , split ='any') 안녕하세요 R과 관련하여 추가적으로 필요한 정보가 있으시면, DATA101에서 확인 가능하십니다. 감사합니다. 안녕하세요, Hello R에서 strsplit(x, split = 'any') 함수는 split 인자의 'any' 안에 들어가는 구분자(seperator) 예를 들어, 쉼표(,), 마침표(.) 등 기준에 따라서 문자열을 분리해주는 함수입니다. STEP 1. strsplit() STEP 1. strsplit(x, split = 'any') strsplit() 함수로 문자형 벡터를 나누면 결과가 리스트(list) 구조로 나옵니다. 아래와 같이 '띄어쓰기'로 구분된 주소에서 서울시, 경기도 등 광역시 정보만 추출해보겠습니다. # 실습 주소 데이터 address 2021. 10. 28.
[R] 데이터 분석 기초(평균, 중간값, 분산, 표준편차, 백분위수) 안녕하세요 R과 관련하여 추가적으로 필요한 정보가 있으시면, DATA101에서 확인 가능하십니다. 감사합니다. 안녕하세요, HELLO 데이터 분석 개론서, 실습서 등을 살펴보면, 분석의 기초는 데이터를 왜곡없이 '있는 그대로' 보는 것을 강조합니다. 이처럼 관찰된 데이터를 수치화(평균, 분산, 표준편차 등)된 공통 기준을 활용함으로써 데이터를 정리할 수 있습니다. 이에 따라 데이터 특성을 파악할 수 있는 주요 지표에 대해서 아래와 같이 살펴보겠습니다. STEP 1. 평균 STEP 2. 중간값 STEP 3. 분산/표준편차 STEP 4. 백분위수 통계량 (Statistics) R 평균 (산술평균) mean() 조화평균 1/mean(1/x) 중간값 median() 분산 var() 표준편차 sd() 백분위수 q.. 2021. 10. 28.
[PYTHON] 파이썬 정규식을 활용한 괄호와 괄호 안 문자열 삭제 또는 추출 안녕하세요 파이썬과 관련하여 추가적으로 필요한 정보가 있으시면, DATA101에서 확인 가능하십니다. 감사합니다. 안녕하세요, HELLO 이번에 특허청 특허 정보를 확인하게 되면서, 국내 출원/등록된 특허 데이터가 저장된 형태를 보게 되었습니다. 특허 정보는 아래와 같이, 특허 상태, 특허명(영문 포함), 특허 정보 등으로 구성되며, 이 중에서 특허명은 괄호()로 국문과 영문이 구분되어 있습니다. 국문 특허명과 영문 특허명을 구분해서 저장하며, 활용한 코드를 아래와 같이 공유합니다. 이번에는 PYTHON 정규식과 library re를 활용해서, STEP 1. 괄호와 괄호 안 문자열 삭제 STEP 2. 괄호와 괄호 안 문자열 추출 이 두가지에 대해서 살펴보고자 합니다. STEP 1. 괄호와 괄호 안 문자열.. 2021. 10. 26.
[PYTHON] 파이썬 웹 크롤링 (무한 스크롤 크롤링/SCROLL_DOWN) 안녕하세요 파이썬과 관련하여 추가적으로 필요한 정보가 있으시면, DATA101에서 확인 가능하십니다. 감사합니다. 안녕하세요, HELLO ​ 이번에는 PYTHON selenium을 활용해서 동적 페이지를 크롤링할 때, 웹 크롤링을 진행하게 되면 스크롤 다운(scroll down)하여, 웹페이지를 내려가면서 데이터를 수집하는 스크롤 다운 방법 중 마지막 항목까지 자동으로 내려가는 무한 스크롤 크롤링을 정리했습니다. ​ 이번 코드는 이전에 공유한 횟수를 정하고 내려가는 방식도 향후에 참고하면 좋습니다. 2021. 10. 24.
반응형