🔡 OCR Data-Centric 대회

✨ 팀 소개

Thanks goes to these wonderful people (emoji key):

_김승기
💻 🔧 🐛 👀

_김준영
💻 🐛 🔣 📆

_전형우
💻 🔣 🔬 🔧

_천지은
💻 🔣 🤔 🔬

_신우진
💻 🔣 🐛 👀

This project follows the all-contributors specification. Contributions of any kind welcome!

🎙️ 프로젝트 소개

OCR (Optimal Character Recognition) 기술은 사람이 직접 쓰거나 이미지 속에 있는 문자를 얻은 다음 이를 컴퓨터가 인식할 수 있도록 하는 기술입니다. 스마트폰으로 카드를 결제하거나, 카메라로 카드를 인식할 경우 자동으로 카드 번호가 입력되거나 주차장에 들어가면 차량 번호가 자동으로 인식되는 등 일상생활에 이미 보편적으로 사용되고 있습니다. 이번 대회는 OCR의 대표적인 model 중 하나인 EAST model을 활용하여 진료비 계산서 영수증안에 있는 글자를 인식하는 대회입니다.

이번 대회는 Data-Centric 대회로 다음과 같은 제약사항이 있습니다.

대회에서 주어지는 EAST model만을 사용해야 하며 model과 관련된 코드를 바꿔서는 안됩니다.
이미지넷 기학습 가중치 외에는 사용이 불가합니다.

즉 이번 대회는 모델을 고정한 상태로 데이터만을 활용하여 OCR model의 성능을 최대한 끌어 올리는 프로젝트 입니다.

이번 대회는 부스트캠프 AI Tech CV 트랙내에서 진행된 대회이며 F1-Score로 최종평가를 진행하였습니다.

📆 프로젝트 일정

프로젝트 전체 일정

2023.05.22 ~ 2023.06.01

프로젝트 세부 일정

2023.05.22 ~ 2023.05.24 : OCR에 대해 알아보기, EDA
2023.05.25 ~ 2023.05.25 : Train dataset과 Validation dataset 분리, Validation 코드 추가
2023.05.26 ~ 2023.05.28 : Mixed Precision, Pickle 파일로 학습시간 단축
2023.05.27 ~ 2023.05.28 : Train/Test dataset 살펴보기, Re-labeling, Augmentation 실험
2023.05.29 ~ 2023.05.31 : Re-labeling, Pretrain용 Dataset 탐색, wandb에 detEval 추가
2023.05.30 ~ 2023.05.31 : Re-labeling, Optimizer & Scheduler 탐색
2023.06.01 ~ 2023.06.01 : Ensemble

🥼 프로젝트 수행

➡️ Link따라 들어가시면 보실 수 있습니다.

🗒️ 프로젝트 결과

프로젝트 결과 최종적으로 아래와 같은 결과를 얻었습니다. (Public 1등, Private 1등)
- Public
- Private

🔄️ Directory

├── utils
├── .gitignore
├── gitcommit_template.txt
├── dataset.py
├── inference.py
├── train.py
└── train_fp16.py

베이스라인 모델인 EAST 모델이 정의되어 있는 model.py, loss.py, east_dataset.py, detect.py 파일은 변경하지 않았으므로 업로드하지 않았습니다.

실험의 결과를 확인하기 위한 기능들, 성능을 더 올리기 위한 기능들은 utils폴더 안에 모두 구성했습니다.

File(.ipynb/.py)	Description
COCO to UFO	COCO format으로 작성된 json file을 UFO format으로 변환합니다.
UFO to COCO	UFO format으로 작성된 json file을 COCO format으로 변환합니다.
Erase exclude tags and Polygons	필요없는 tag와 polygon을 지웁니다.
check	Image에 대해 bbox가 어떻게 그려지는지 확인해보는 코드입니다.
preprocessing	학습 가속화를 위해 image 데이터를 pickle로 바꿉니다.
speed_up_loader	Image를 pickle로 변경한 후 데이터 로딩 시간의 변화를 정리한 파일입니다.
train_val_split	Train dataset과 Validation dataset으로 나눕니다.
ensemble	WBF ensemble 코드입니다.
wbf_ensemble	기존 라이브러리 코드에서 하나의 모델만 예측한 bbox를 제거하는 코드를 추가한 ensemble 코드입니다.

🤔 Wrap-Up Report

Wrap-Up Report

⚠️ Dataset 출처

대회에서 사용된 부스트캠프 AI Tech임을 알려드립니다.

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

🔡 OCR Data-Centric 대회

✨ 팀 소개

🎙️ 프로젝트 소개

📆 프로젝트 일정

🥼 프로젝트 수행

🗒️ 프로젝트 결과

🔄️ Directory

🤔 Wrap-Up Report

⚠️ Dataset 출처

About

Releases

Packages

Languages

Name		Name	Last commit message	Last commit date
Latest commit History 43 Commits
.github		.github
etc		etc
utils		utils
.gitignore		.gitignore
.pre-commit-config.yaml		.pre-commit-config.yaml
README.md		README.md
dataset.py		dataset.py
gitcommit_template.txt		gitcommit_template.txt
inference.py		inference.py
train.py		train.py
train_fp16.py		train_fp16.py

seungki1011/AI-Tech5-Data-Centric-Competetion

Folders and files

Latest commit

History

Repository files navigation

🔡 OCR Data-Centric 대회

✨ 팀 소개

🎙️ 프로젝트 소개

📆 프로젝트 일정

🥼 프로젝트 수행

🗒️ 프로젝트 결과

🔄️ Directory

🤔 Wrap-Up Report

⚠️ Dataset 출처

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages