[AI] 얼굴 인식 기술 TEST
모델 분류 성능 지표
1. True Positive(TP) : 실제 True인 정답을 True로 예측
2. False Positive(FP) : 실제 Flase인 정답을 Ture로 예측
3. False Negative(FN) : 실제 True 인 정답을 False로 예측
4. True Negative(TN) : 실제 False인 정답을 False로 예측
Precision(정밀도) : True로 분류한 것 중 실제 True인 값의 비율 TP / (TP + FP)
Recall(재현율) : 실제 True인 것 중에 모델이 True라고 예측한 것의 비율 TP / (TP + FN)
F1 Score: Precision과 Recall의 조화평균 2 * (Precision * Recall) / (Precision + Recall)
초기 성능 비교
| 모델 | RetinaFace | ArcFace |
| DATASET | WIDER FACE DATASET | LFW |
| Accuracy(%) | 87.3 | |
| Precision(%) | 92.02 | 90.6 |
| Recall(%) | 100 | 84.3 |
| F1 score(%) | 95.84 | 87.3 |
한국인 안면 이미지 성능 비교
| 모델 | RetinaFace + ArcFace | RetinaFace + ArcFace | RetinaFace + ArcFace |
| DATASET | 저화질 | 중화질 | 고화질 |
| Accuracy(%) | 50 | 75 | 86 |
| Precision(%) | 50 | 71.6 | 96 |
| Recall(%) | 100 | 83 | 75 |
| F1 score(%) | 66.57 | 76.88 | 84.21 |
=> 저화질 이미지에 대한 성능 향상 필요
한국인 안면 이미지 + RandomErasing
| 모델 | RetinaFace + ArcFace + Cosine |
RetinaFace + ArcFace + Euclidean |
RetinaFace + ArcFace + Euclidean l2 |
RetinaFace + ArcFace + Cosine |
RetinaFace + ArcFace + Euclidean |
RetinaFace + ArcFace + Euclidean l2 |
| DATASET | 고화질 | 고화질 | 고화질 | 고화질 + RandomErasing |
고화질 + RandomErasing |
고화질 + RandomErasing |
| Accuracy(%) | 87.0 | 83.75 | 83.75 | 75.5 | 70 | 73 |
| Precision(%) | 75.6 | 85.88 | 85.88 | 77.42 | 63.3 | 81.08 |
| Recall(%) | 89 | 73 | 73 | 72 | 72 | 60 |
| F1 score(%) | 87.3 | 78.9 | 78.9 | 74.61 | 74.61 | 68.96 |
=> Cosine 을 통한 embedding 비교
ESR GAN, Real-ESRGAN 도입
| 모델 | ESRGAN + RetinaFace + ArcFace | Real-ESRGAN + RetinaFace + ArcFace |
| DATASET | 저화질 | 저화질 |
| Accuracy(%) | 50 | 71.5 |
| Precision(%) | 50 | 69.03 |
| Recall(%) | 100 | 78 |
| F1 score(%) | 66.67 | 73.24 |
- ESRGAN의 경우, 얼굴에 대해 유의미한 성능 향상을 이뤄내지 못함 => 얼굴과 배경의 구분이 이루어지지 않음
- Real-ESRGAN의 경우, F1 score이 6.57%p 향상
'AI' 카테고리의 다른 글
| [AI] 얼굴 인식 기술 특징 (0) | 2024.05.24 |
|---|---|
| [논문] About Face: A Survey of Facial Recognition Evaluation 요약 (1) | 2024.05.24 |