본문 바로가기
반응형

DATA_SCIENCE/DATA3

[DATA] 수치형 데이터에서 피처 정규화가 중요할까요? 안녕하세요, HELLO 데이터 모델링에서 수치형 데이터 (Numerical Data)에서 피처 정규화 (Feature Normalization)가 중요할까요? 1. 수치형 데이터란? 수치형 데이터는 주사위 눈금, 인구수 등 나눌 수 있는 이산형 숫자 데이터와 키, 몸무게 등 나눌 수 없는 연속형 숫자 데이터로 나눠집니다. 2. 피처 정규화란? 피처 정규화 (Feature normalization)는 데이터의 범위를 특정 구간의 범위로 조절해 주는 방법입니다. 정규화는 달러, 원화, 엔화 등 단위가 다른 경우, 계산 난이도를 낮추기 위함 등의 목적으로 진행됩니다. 대표적인 정규화 기법으로는 최댓값-최솟값을 활용한 min-max scaling, 데이터 분포의 평균, 분산을 활용한 z-normalization.. 2023. 5. 28.
[DATA] 스타트업 지원 사업 클러스터링 및 워드클라우드 안녕하세요, HELLO 이번에는 정부에서 주관하는 스타트업 지원 사업을 정리해서 지원 혜택 종류에 따라 클러스터링 (clustering)을 진행하고, 이후에는 지원 대상과 지원 혜택을 워드클라우드로 이미지를 그려보겠습니다. GPU 연산을 위해 구글 Colab을 활용했습니다. ■ 분석 목적 - 現 정부에서 주관하는 스타트업 지원 혜택 유형을 분류 - 각 지원 대상과 지원 혜택별로 키워드 파악 ■ 데이터 수집 - 2021년 1월 ~ 2022년 4월 12일 지원 목록 12,598건 - 소관부처, 수행기관, 지원분야, 공고명, 지원대상, 지원혜택, 신청시작일자, 신청종료일자, 등록일자, URL - 기업마당 크롤링 진행 2022.04.10 - [DATA_SCIENCE/Python] - [PYTHON] 기업마당_정.. 2022. 4. 14.
2022년 상반기 서강대학교 정보통신대학원 데이터 사이언스 합격 후기 안녕하세요 HELLO 이번에 2022년 상반기 서강대학교 정보통신대학원에 데이터 사이언스 전공에 합격하게 되었습니다. 오늘은 데이터 사이언스 대학원을 가기 위해 내용과 후기를 공유하려고 합니다. STEP 0. BACKGROUND 저는 대학생 시절부터 창업을 하고 싶었습니다. 창업을 바로 하는 것을 두렵고 무섭기에, 스타트업 투자자가 되면 스타트업도 만나고, 투자도 배울 수 있다고 생각해서 스타트업 투자자, 그중에서 벤처캐피털리스트 (Venture capitalist). 이른바 VC가 되고 싶었습니다. 이를 준비하며, 졸업 후에 스타트업 보육, 육성하는 액셀러레이터(Startup accelerator)의 정부 지원담당을 거쳐, 스타트업 투자심사역으로 커리어를 확장했습니다. 젊은 나이에 투자자로서의 경험은 .. 2022. 1. 13.
반응형