Tave 13기 팀 23456 Pickle의 딥러닝 페이지입니다.
김지헌 | 백채은 | |
---|---|---|
깃허브 |
Archive 에는, 최종모델 구축을 위해 실험한 모든 코드와 모델 파라미터들을 살펴보실 수 있습니다.
- models/ - 최종 모델 파일 디렉토리
- app.py - FastAPI를 통해 배포하는 모델 소스코드
- license.txt - 코드 내 사용한 오픈소스 라이선스 고지
- requirements.txt - Python pip 라이브러리 목록
- EfficientNet b2 + 출력 layer를 Identity Matrix로 변경해 이미지를 임베딩
- 임베딩 벡터 간의 유사도를 Faiss를 이용하여 측정, 0.65 이상의 유사도를 가진 이미지를 유사하다고 판단
- Image size를 288로 하여 보다 정확한 분류를, 512로 하여 Feature를 넓게 분석하여 포괄적인 분류를 가능하도록 설계
- Image size를 224로 하여 gray scale로 판단
- 너무 깊은 Feature까지 학습하지 않도록 가벼운 모델인 MobileNetV2를 채택
- Postech RealBLur Dataset, Discriminative Blur Detection Features +α, 약 50,000장의 Image를 사용하여 Fine-Tuning
- Yolov8을 사용하여 특정 size 이상의 얼굴만 Crop
- EfficientNet b2 모델을 채택하여 Closed / Non-Closed(눈뜬 사진을 비롯한 선글라스, 안경, 안대, 눈가림 등) 분류
- CEW DATASET, AiHub Face Parsing 데이터 일부, Google&Naver Crawling으로 약 8,500장의 Image를 사용하여 Fine-Tuning
fastapi==0.111.0
faiss-cpu==1.8.0
numpy==1.26.4
torch==2.3.1+cu121
Pillow==10.3.0
torchvision==0.18.1+cu121
ultralytics==8.2.46
pydantic==2.7.4
requests==2.25.1
opencv-python-headless==4.10.0