Web application for Sino-Nôm digitalization

Demo: https://share.streamlit.io/ds4v/nomnasite/main/app.py

Usage

pip install requirements.txt
streamlit run app.py

👉 Check out YouTube demo

Input image from local or URL.
Leverage DL models to extract text from image:
- Use VNPF's site as collected source.
- Apply models based on the results of NomNaOCR.
Interactive mode using streamlit-drawable-canvas:
- Drawing mode: draw rectangle boxes on image regions containing characters.
- Editing mode: rotate, skew, scale, move any box of the canvas on demand.
- Undo, Redo or Delete canvas contents.
Saving OCR results:
- Export detection, recognition, and translation results to CSV or JSON.
- Download patches cropped from detected bounding boxes.
Translate using APIs from:
- VNUHCM University of Science: https://www.clc.hcmus.edu.vn/?page_id=3039
- Sino-Nôm dictionary: https://hvdic.thivien.net/transcript.php#trans

(*) Note: In Editing mode, double-click a box to remove it.

My Vietnamese Sino-Nôm digitalization series :

Name		Name	Last commit message	Last commit date
Latest commit History 44 Commits
assets		assets
data		data
handler		handler
imgs		imgs
.gitignore		.gitignore
README.md		README.md
app.py		app.py
crnn.py		crnn.py
dbnet.py		dbnet.py
layers.py		layers.py
processor.py		processor.py
requirements.txt		requirements.txt
style.py		style.py
toolbar.py		toolbar.py