반응형 DATA_SCIENCE46 [딥러닝] 데이터 증대 (Data Augmentation) 해설, 정리, 요약 안녕하세요, HELLO 이번에는 모델을 훈련함에 있어, 데이터가 적은 경우에 데이터를 증대하는 방법인 data augmentation에 대해서 살펴보고자 합니다. 보다 자세한 내용은 세부 항목을 통해 정리하려고 합니다. STEP 1. 데이터 증대(Data Augmentation) 설명 STEP 2. 데이터 증대(Data Augmentation) 종류 STEP 3. 데이터 증대(Data Augmentation) 한계 STEP 1. 데이터 증대(Data Augmentation) 설명 데이터 증대는 훈련 데이터 세트의 크기를 인위적으로 늘리는 데 사용되는 기계 학습 기술입니다. 이는 회전, 변환, 크기 조정, 뒤집기 등과 같은 기존 데이터에 변환을 적용하여 달성됩니다. 데이터 증대의 기본 아이디어는 모델의 견.. 2023. 2. 6. [딥러닝] 하이퍼파라미터 최적화 (Hyperparameter Optimization) 해설, 정리, 요약 안녕하세요, HELLO 오늘은 딥러닝 모델 성능을 개선하는 여러 방법 중 주요하게 활용되는 하이퍼파라미터 최적화, Hyperparameter optimization에 대해서 살펴보겠습니다. 기본적으로 Grid search, random search 그리고 bayesian optimization 세 가지가 있습니다. CHAPTER 1. '하이퍼파라미터 최적화' 설명 CHAPTER 2. '하이퍼파라미터 최적화' 방법 CHAPTER 3. '하이퍼파라미터 최적화' 정리 CHAPTER 1. '하이퍼파라미터 최적화' 설명 하이퍼파라미터 최적화(Hyperparameter optimization)는 기계 학습 모델에 가장 적합한 하이퍼파라미터 세트를 선택하는 것입니다. 하이퍼파라미터는 데이터에서 학습된 것이 아니라 실.. 2023. 2. 4. [REVIEW] Fully Convolutional Networks for Semantic Segmentation (FCN) 리뷰, review 안녕하세요, HELLO 회사에서는 시계열 데이터를 중심으로 살펴보기에, 컴퓨터 비전 모델에 대해서는 살펴볼 기회가 많이 없었습니다. 다양한 모델을 살펴보고 싶은 마음에, computer vision의 object detection, classification, segmentation, ocr 등에 대해서 스터디를 진행하며, 논문을 리뷰하고 있습니다. 이번에 살펴본 논문은 Semantic Segmentation 문제를 위해 제안된 딥러닝 모델인 Fully Convolutional Networks for Semantic Segmentation (FCN)입니다. FCN은 Semantic Segmentation 모델을 위해 기존에 이미지 분류(Classification)에서 좋은 성능을 보인 CNN 기반 모델(.. 2023. 1. 8. [Review] Effective Data Cleaning with Continuous Evaluation 리뷰, review 안녕하세요, HELLO 머신러닝, 딥러닝 분야는 좋은 성능의 모델을 만들기 위한 많은 시간, 컴퓨팅 파워, 인력 등이 필요한 '시행착오 (Trial and error)'가 많이 필요합니다. 이러한 반복적이고, 실험적인 모델의 학습을 개선하기 위해 최근에는 데이터를 입력하면 사람의 많은 개입(Human Assistance) 없이 높은 성능의 모델을 만들어내는 automated machine learning, 이른바 AutoML 분야가 각광받고 있습니다. AutoML 분야는 데이터, 변수, 모델의 관점에서 data preparation, feature engineering 그리고 model generation, model evaluation 이렇게 4개 분야로 정리하고 있습니다. (ref. AutoML: A.. 2022. 12. 31. [Review] Generative Adversarial Nets (GAN) 리뷰, REVIEW 안녕하세요, HELLO 머신러닝, 딥러닝 분야는 좋은 성능의 모델을 만들기 위한 많은 시간, 컴퓨팅 파워, 인력 등이 필요한 '시행착오 (Trial and error)'가 많이 필요합니다. 이러한 반복적이고, 실험적인 모델의 학습을 개선하기 위해 최근에는 데이터를 입력하면 사람의 많은 개입(Human Assistance) 없이 높은 성능의 모델을 만들어내는 automated machine learning, 이른바 AutoML 분야가 각광받고 있습니다. AutoML 분야는 데이터, 변수, 모델의 관점에서 data preparation, feature engineering 그리고 model generation, model evaluation 이렇게 4개 분야로 정리하고 있습니다. (ref. AutoML: A.. 2022. 12. 11. [Review] Recognition from Web Data A Progressive Filtering Approach 리뷰, review 안녕하세요, HELLO 머신러닝, 딥러닝 분야는 좋은 성능의 모델을 만들기 위한 많은 시간, 컴퓨팅 파워, 인력 등이 필요한 '시행착오 (Trial and error)'가 많이 필요합니다. 이러한 반복적이고, 실험적인 모델의 학습을 개선하기 위해 최근에는 데이터를 입력하면 사람의 많은 개입(Human Assistance) 없이 높은 성능의 모델을 만들어내는 automated machine learning, 이른바 AutoML 분야가 각광받고 있습니다. AutoML 분야는 데이터, 변수, 모델의 관점에서 data preparation, feature engineering 그리고 model generation, model evaluation 이렇게 4개 분야로 정리하고 있습니다. (ref. AutoML: A.. 2022. 12. 11. [딥러닝] 머신러닝, 딥러닝 기본 용어 해설, 정리, 요약 안녕하세요, HELLO 오늘은 머신러닝, 딥러닝 분야에서 많이 언급되는 기본적인 용어에 대해서 살펴보고자 합니다. 그동안 공부 및 논문을 읽으면서 배운 내용을 이번 기회를 통해서 정리하려고 합니다. CHAPTER 1. '머신러닝, 딥러닝' 용어 정리 Name Details Logistic regression - Binary classification을 하기위해 사용되는 알고리즘 - y가 1일 확률을 계산하며, 활성화 함수 중 하나인 시그모이드 함수를 이용하여 0~1사이의 값으로 계산할 수 있습니다. First-order method - 한번 미분한 변수로만 이루어진 식 Dot product - 두 벡터 간의 내적 Linear Function - 원점을 지나는 1차 함수 Affine Function - L.. 2022. 11. 20. [Review] The Expectation Maximization (EM) Algorithm 리뷰, review 안녕하세요, HELLO 대학원에서 공부 및 회사에서 업무를 진행하며, 최신 논문 그리고 프로젝트에 맞는 논문을 읽다 보니 머신러닝 분야의 권장 논문을 읽어보지 못했습니다. 그래서 학교 공부를 병행하며, 그동안 리서치하며 알게 된 8개 논문을 정해서 스터디를 진행하게 되었습니다. Linkedin을 통해서 업데이트를 진행하고 있으며, 영어로 정리해서 공유합니다. 이번에 살펴본 논문은 'Expectation Maxmization (EM) Algorithm'입니다. 데이터는 있지만, 이에 대한 분포를 모르는 상황에서, 데이터 분포를 구하는 방법입니다. EM step을 반복하면, 결국에는 Local maximum에 도달하지만, 위 결과가 global maximum에 도달하는지는 확신할 수는 없습니다. ■ Refe.. 2022. 11. 20. [Review] Statistical Modeling, The Two cultures 리뷰, review 안녕하세요, HELLO 대학원에서 공부 및 회사에서 업무를 진행하며, 최신 논문 그리고 프로젝트에 맞는 논문을 읽다 보니 머신러닝 분야의 권장 논문을 읽어보지 못했습니다. 그래서 학교 공부를 병행하며, 그동안 리서치하며 알게 된 8개 논문을 정해서 스터디를 진행하게 되었습니다. Linkedin을 통해서 업데이트를 진행하고 있으며, 영어로 정리해서 공유합니다. 이번에 살펴본 논문은 전통적인 통계 기반의 데이터 모델 (Data Modeling)과 알고리즘 모델 (Algorithmic Modeling)의 차이점과 알고리즘 모델링으로 개발할 필요가 있다고 정리한 "Statistical Modeling, The Two cultures" 입니다. 논문의 저자는 Leo Breiman (1928 ~ 2005)으로, 버.. 2022. 11. 19. 이전 1 2 3 4 5 6 다음 반응형