본문 바로가기
반응형

DATA_SCIENCE45

[딥러닝] Model-Agnostic Method 해설, 정리, 요약 안녕하세요, HELLO 머신러닝 분야가 빠르게 발전함에 따라, 모델이 예측을 어떻게 수행하는지를 이해하는 것이 점점 더 중요해지고 있습니다. 정교한 딥러닝 모델들은 높은 정확도를 제공하지만, 종종 "블랙박스"처럼 작동하여 그 내부 작동 방식을 해석하기 어렵습니다. Model-Agnostic 방법은 모델의 내부 구조나 특정 알고리즘에 의존하지 않고, 어떤 머신러닝 모델의 예측 결과를 해석할 수 있는 도구를 제공합니다. 이번에는 Model-Agnostic 방법이 무엇인지, 왜 중요한지, 그리고 대표적인 두 가지 기법인 LIME과 SHAP을 자세히 살펴보겠습니다.CHAPTER 1. 'Model-Agnostic' 방법 CHAPTER 2. 'LIME (Local Interpretable Model-agnostic.. 2024. 8. 15.
[딥러닝] 규제 (Regularization) 해설, 정리, 요약 안녕하세요, HELLO 딥러닝은 어떤 현상에 대해서 가장 자세히 설명하기 위한 모델 함수를 찾는 것이 목적입니다. 모델을 찾을 때, 실제 정답과 모델이 예측한 결과 간의 오차가 발생하고, 정답 y와 모델이 예측값 y^과의 차이를 손실 함수 (Loss function, Cost function)이라고 합니다. 딥러닝 모델의 성능을 올리기 위해서는 손실 함수를 최소화해야 합니다. 모델에 훈련 데이터의 특징, 패턴 등이 과하게 적용되어, 손실 함수가 필요 이상으로 작아지게 되는 경우를 과적합 (Overfitting)이라고 합니다. Overfitting이 발생하게 되면 학습에 사용된 데이터에 대해서만 잘 설명하고, 다른 데이터에 대해서는 설명이 부족해지는 일반화 능력 (Generalization)이 부족해집니다.. 2023. 11. 5.
[딥러닝] 차원의 저주 (Curse of dimensionality) 해설, 정리, 요약 안녕하세요, HELLO 차원의 저주는 고차원 공간에서 데이터 포인트의 밀도가 극단적으로 희박해지는 현상을 가리킵니다. 이는 고차원 데이터를 처리하거나 분석할 때 발생하는 문제로, 학습 및 예측의 정확도를 저하시키는 원인이 됩니다. 오늘은 차원의 저주 (Curse of dimensionality)에 대해서 정리해 보겠습니다. CHAPTER 1. '차원의 저주 (Curse of dimensionality)' 개요 CHAPTER 2. '차원의 저주 (Curse of dimensionality)' 문제점 CHAPTER 3. '차원의 저주 (Curse of dimensionality)' 예시 CHAPTER 1. '차원의 저주 (Curse of dimensionality)' 개요 차원의 저주는 고차원 데이터를 다룰.. 2023. 10. 31.
[CV] Top 1 error, Top 5 error 이미지 분류 모델 평가 지표 해설, 정리, 요약 안녕하세요, HELLO 이미지 분류 (Image classification) 문제에서 볼 수 있는 top 1 error와 top 5 error에 대해서 살펴보고자 합니다. CHAPTER 1. 'Top 1 error, Top 5 error' 정리 CHAPTER 2. 'Top 5 error' 모델 성능에서의 의의 CHAPTER 1. 'Top 1 error', 'Top 5 error' 정리 Top 1 error와 Top 5 error는 이미지 분류 (image classification) 성능을 평가 기준입니다. 분류기 (classifier) 모델은 주어진 이미지가 어떤 클래스 (class)에 속하는지 분류해 낼 것입니다. 이때 예측 (predicted)한 에서 상위 1개의 값이 실제 정답과 같다면, top .. 2023. 10. 17.
[DATA] 수치형 데이터에서 피처 정규화가 중요할까요? 안녕하세요, HELLO 데이터 모델링에서 수치형 데이터 (Numerical Data)에서 피처 정규화 (Feature Normalization)가 중요할까요? 1. 수치형 데이터란? 수치형 데이터는 주사위 눈금, 인구수 등 나눌 수 있는 이산형 숫자 데이터와 키, 몸무게 등 나눌 수 없는 연속형 숫자 데이터로 나눠집니다. 2. 피처 정규화란? 피처 정규화 (Feature normalization)는 데이터의 범위를 특정 구간의 범위로 조절해 주는 방법입니다. 정규화는 달러, 원화, 엔화 등 단위가 다른 경우, 계산 난이도를 낮추기 위함 등의 목적으로 진행됩니다. 대표적인 정규화 기법으로는 최댓값-최솟값을 활용한 min-max scaling, 데이터 분포의 평균, 분산을 활용한 z-normalization.. 2023. 5. 28.
[REVIEW] AutoSmart: An Efficient and Automatic Machine Learning framework for Temporal Relational Data 리뷰, review 안녕하세요, HELLO 머신러닝, 딥러닝 분야는 좋은 성능의 모델을 만들기 위한 많은 시간, 컴퓨팅 파워, 인력 등이 필요한 '시행착오 (Trial and error)'가 많이 필요합니다. 이러한 반복적이고, 실험적인 모델의 학습을 개선하기 위해 최근에는 데이터를 입력하면 사람의 많은 개입(Human Assistance) 없이 높은 성능의 모델을 만들어내는 automated machine learning, 이른바 AutoML 분야가 각광받고 있습니다. AutoML 분야는 데이터, 변수, 모델의 관점에서 data preparation, feature engineering 그리고 model generation, model evaluation 이렇게 4개 분야로 정리하고 있습니다. (ref. AutoML: A.. 2023. 5. 14.
[Review] AutoML-Zero: Evolving Machine Learning Algorithms From Scratch 리뷰, review 안녕하세요, HELLO 머신러닝, 딥러닝 분야는 좋은 성능의 모델을 만들기 위한 많은 시간, 컴퓨팅 파워, 인력 등이 필요한 '시행착오 (Trial and error)'가 많이 필요합니다. 이러한 반복적이고, 실험적인 모델의 학습을 개선하기 위해 최근에는 데이터를 입력하면 사람의 많은 개입(Human Assistance) 없이 높은 성능의 모델을 만들어내는 automated machine learning, 이른바 AutoML 분야가 각광받고 있습니다. AutoML 분야는 데이터, 변수, 모델의 관점에서 data preparation, feature engineering 그리고 model generation, model evaluation 이렇게 4개 분야로 정리하고 있습니다. (ref. AutoML: A.. 2023. 5. 5.
[REVIEW] Cellpose: A generalist algorithm for cellular segmentation 리뷰, review 안녕하세요, HELLO 이미지 분야 (computer vision)로 도메인 지식을 넓히기 위해, object detection, classification, segmentation, ocr, generative AI 등에 대해서 스터디를 진행하며, 논문을 리뷰하고 있습니다. 이번에 살펴본 논문은 세포 이미지, celluar segmentation 문제를 개선하기 위해 제안된 U-net 기반 모델인 Cellpose: A generalist algorithm for cellular segmentation입니다. Cellpose는 Convolutional Neural Netowrk에 기반한 딥러닝 접근 방식을 사용하여 이미지 분할을 수행합니다. 세포, 핵, 박테리아, 기타 작은 구조물 등 생물학적 이미지에서.. 2023. 4. 30.
[딥러닝] 음성 신호 처리 (Audio Signal Processing) 기본 용어 해설, 정리, 요약 안녕하세요, HELLO 오늘은 음성 신호 처리 (Audio Signal Processing)에서 기본 개념인 파형, 주파수, 진폭 등에 대해서 정리하려고 합니다.CHAPTER 1. '파형 (Waveform)' 정리 CHAPTER 2. '주파수 (Frequency), 진폭 (Amplitude), 강도 (Intensity)' 정리 CHAPTER 3. '위상 (Phase), 음색 (Timbre)' 정리  CHAPTER 1. '파형 (Waveform)' 정리 ◼︎ 파형 (Waveform)이란? 파형은 시간에 따른 신호의 진폭을 보여주는 오디오 신호의 그래픽 표현입니다. 파형은 가로축의 시간에 대한 세로축의 신호 전압 또는 압력 값을 가로축에 표시한 그림입니다.파형은 주파수, 진폭, 위상 및 파형 모양과 같은 오.. 2023. 4. 2.
반응형