안녕하세요, HELLO
Sørensen–Dice 계수라고도 하는 Dice score, 다이스 스코어는 segmentation 또는 predicted, true 이미지 영역과 같은 두 이진 데이터 세트 간의 유사성을 측정하는 데 사용되는 컴퓨터 비전의 일반적인 평가 metric입니다. 다이스 스코어의 범위는 0과 1 사이이며 값이 1이면 두 세트가 완전히 겹치는 것을 나타내고, 값이 0이면 겹치는 부분이 전혀 없음을 나타냅니다.
오늘은 이미지 분야에서 평가 지표로 활용되는 Dice score, 다이스 스코어에 대해서 정리해 보겠습니다.
CHAPTER 1. 'Dice score, 다이스 스코어' 개요
CHAPTER 2. 'Dice score, 다이스 스코어' 계산 방법
CHAPTER 1. 'Dice score, 다이스 스코어' 개요
Sørensen–Dice 계수라고도 하는 Dice score, 다이스 점수는 segmentation 또는 predicted, true 이미지 영역과 같은 두 이진 데이터 세트 간의 유사성을 측정하는 데 사용되는 컴퓨터 비전의 일반적인 평가 metric입니다. 다이스 점수의 범위는 0과 1 사이이며 값이 1이면 두 세트가 완전히 겹치는 것을 나타내고, 값이 0이면 겹치는 부분이 전혀 없음을 나타냅니다.
다이스 스코어는 다음과 같이 계산됩니다.
Dice Score = (2 * |X ∩ Y|) / (|X| + |Y|)
여기서 X와 Y는 비교되는 두 집합이고 |X| 그리고 |Y| cardinality, 카디널리티(즉, 각 세트의 요소 수)입니다. X ∩ Y로 표시되는 두 세트의 교집합은 두 세트에 있는 요소의 수입니다.
이미지 segmentation에서 Dice score는 predicted value와 true value 간의 유사성을 측정하거나 다른 segmentation 알고리즘 또는 모델을 비교하는 데 사용할 수 있습니다. segmentation 방법의 성능에 대한 보다 포괄적인 평가를 제공하기 위해 종종 정밀도, 재현율 및 F1 score와 같은 다른 평가 기법과 함께 사용됩니다.
추가적으로, 딥러닝에서는 loss가 감소하도록 학습합니다. 위의 공식 dice score는 값이 클수록 좋기 때문에, 일반적으로 음의 값을 취해 아래와 같은 공식으로 loss function을 구현합니다.
Dice loss = 1 - Dice score
두 영역이 같아질수록 dice score는 1에 가까워지며, dice loss는 0에 가까워지므로 학습이 잘 된다고 할 수 있습니다.
CHAPTER 2. 'Dice score, 다이스 스코어' 계산 방법
Dice score 계산에서 조화 평균(harmonized mean) 대신 산술 평균(arithmetric mean) 또는 기하 평균(geometric mean)을 사용하는 것은 이미지 segmentation 성능을 평가하는 데 적합하지 않을 수 있습니다. 이는 과소 세분화 오류(under-segmentation error; 예측 영역이 정답 영역보다 적은 경우)와 과다 세분화 오류(over-segmentation error; 예측 영역이 정답 영역보다 큰 경우)를 모두 똑같이 고려하지 않기 때문입니다.
산술 평균(arithmetric mean)은 예측 영역과 실측 영역 모두에 동일한 가중치를 부여하며, 과소 세분화 또는 과다 세분화 오류의 경우 적절하지 않을 수 있습니다. 예를 들어, 예측된 영역이 실측 영역보다 훨씬 작은 경우, 산술 평균은 예측된 영역에 더 가까운 값이 되며 이는 과소 분할 오류의 심각도를 반영하지 않을 수 있습니다.
반면에 기하 평균(geometric mean)은 두 영역 중 더 작은 영역에 더 큰 가중치를 둡니다. 즉, 과도한 세분화 오류는 대상을 예측하지 못함으로써, 거의 모든 경우에 바람직하지 않을 수 있는 과소 세분화 오류보다 더 심하게 페널티를 받게 됩니다.
대조적으로 조화 평균(harmonized mean)은 과소 세분화 오류와 과다 세분화 오류를 동등하게 고려하여, 균형 잡히게 측정합니다. 예측 그리고 정답, 두 영역 중 더 작은 영역에 더 많은 가중치를 두어, 다이스 점수가 두 가지 오류 유형의 심각도를 반영하도록 합니다.
따라서 Dice score 계산에서 조화 평균을 사용하는 것은 일반적으로 이미지 분할 성능을 평가하는 데 가장 적합한 접근 방식으로 간주됩니다. 이는 과소 세분화 오류와 분할 오류를 모두 동등하게 고려하는 균형 있고 공정한 측정을 제공하기 때문입니다.
■ 마무리
'다이스 스코어 (Dice Score)'에 대해서 정리해 봤습니다.
그럼 오늘 하루도 즐거운 나날 되길 기도하겠습니다
좋아요와 댓글 부탁드립니다 :)
감사합니다.
'DATA_SCIENCE > Deep Learning' 카테고리의 다른 글
[딥러닝] End to End model (E2E model) 해설, 정리, 요약 (0) | 2023.02.24 |
---|---|
[딥러닝] 레벤슈타인 거리 Levenshtein Distance 해설, 정리, 요약 (0) | 2023.02.21 |
[딥러닝] 배치 (Batch), 배치 사이즈, 배치 크기 (Batch size) 해설, 정리, 요약 (0) | 2023.02.13 |
[딥러닝] 전이 학습 (Transfer Learning) 해설, 정리, 요약 (0) | 2023.02.13 |
[딥러닝] 앙상블 모델 (Ensemble) 방법, 배깅 (Bagging), 부스팅 (Boosting), 스태킹 (Stacking) 해설, 정리, 요약 (0) | 2023.02.09 |
댓글