본문 바로가기
DATA_SCIENCE/Deep Learning

[딥러닝] 데이터 증대 (Data Augmentation) 해설, 정리, 요약

by HYUNHP 2023. 2. 6.
728x90
반응형

 

안녕하세요, HELLO

이번에는 모델을 훈련함에 있어, 데이터가 적은 경우에 데이터를 증대하는 방법인 data augmentation에 대해서 살펴보고자 합니다. 보다 자세한 내용은 세부 항목을 통해 정리하려고 합니다.


STEP 1. 데이터 증대(Data Augmentation) 설명

STEP 2. 데이터 증대(Data Augmentation) 종류

STEP 3. 데이터 증대(Data Augmentation) 한계


STEP 1. 데이터 증대(Data Augmentation) 설명

데이터 증대는 훈련 데이터 세트의 크기를 인위적으로 늘리는 데 사용되는 기계 학습 기술입니다. 이는 회전, 변환, 크기 조정, 뒤집기 등과 같은 기존 데이터에 변환을 적용하여 달성됩니다. 데이터 증대의 기본 아이디어는 모델의 견고성을 높이고 과적합을 줄일 수 있는 새롭고 다양한 샘플을 만드는 것입니다.

많은 기계 학습 알고리즘이 패턴을 학습하고 예측하기 위해 많은 양의 교육 데이터에 의존하기 때문에 데이터 증대가 중요합니다. 데이터 세트가 작으면 모델이 새 데이터에 잘 일반화되지 않을 수 있으며 과적합될 가능성이 더 큽니다. 데이터 증대를 사용하여 훈련 데이터 세트의 크기를 늘리고 모델의 성능을 향상할 수 있습니다.

반응형


STEP 2. 데이터 증대(Data Augmentation) 종류

데이터 증대의 몇 가지 예는 이미지 인식 분야, image classification에서 볼 수 있습니다.

1. 이미지 뒤집기 (Image flipping)


2. 이미지 회전 (Image rotation)


3. 이미지 스케일링 (Image scaling)


4. 이미지에 노이즈 추가 (Image noising)


예를 들어 개 이미지를 가로로 뒤집거나 회전하거나 노이즈를 추가하는 등의 방법을 통해 이미지를 증대할 수 있습니다.

 


STEP 3. 데이터 증대(Data Augmentation) 한계

이점에도 불구하고 데이터 증대에도 한계점이 있습니다. 예를 들어 너무 많은 데어터 증대를 적용하면 과도한 일반화가 발생하여 모델이 너무 유연하고 덜 정확해질 수 있습니다. 또한 데이터 증대를 적용하는 계산 비용이 높을 수 있으며, 특히 대규모 데이터 세트의 경우 더 많은 비용이 요구됩니다.


■ 마무리

'데이터 증대(Data Augmentation)'
에 대해서 알아봤습니다.


좋아요댓글 부탁드리며,
오늘 하루도 즐거운 날 되시길 기도하겠습니다 :)

감사합니다.

반응형

댓글