NLP-information-extractor

Introdução

Projeto criado com o intuito de extrair e classificar informações de acórdãos jurídicos em arquivos PDF, utilizando python, regex, a library Spacy para a formação de entidades customizadas e para a criação e treinamento de modelos de classificação. A interface com o usuário é feita em Django.

Os dados extraídos foram:

ementa de cada acórdão;
número do processo;
nome do órgão;
restante do texto;

O projeto está em fase de desenvolvimento, e uma parte dele se encontra em uma aplicação feita em Django: O usuário submete um arquivo em PDF contendo um acórdão, no qual palavras chaves são extraídas e o número de suas ocorrências no texto são apresentadas em uma tabela.

As palavras chaves serão utilizadas para a classificação dos acórdãos por meio do reconhecimento de entidades.

🚀 Comandos básicos da aplicação:

Build:

docker-compose build

Deploy:

docker-compose up

Logs:

docker-compose logs

Name		Name	Last commit message	Last commit date
Latest commit History 73 Commits
data_training		data_training
pdfTreatment		pdfTreatment
pdf_keywords		pdf_keywords
pdf_kw_extractor		pdf_kw_extractor
.gitignore		.gitignore
Dockerfile		Dockerfile
README.md		README.md
dev-env		dev-env
docker-compose.yml		docker-compose.yml
manage.py		manage.py
requirements.txt		requirements.txt
start.sh		start.sh

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

NLP-information-extractor

Introdução

🚀 Comandos básicos da aplicação:

About

Releases

Packages

Contributors 2

Languages

francocamila/NLP-information-extractor

Folders and files

Latest commit

History

Repository files navigation

NLP-information-extractor

Introdução

🚀 Comandos básicos da aplicação:

About

Topics

Resources

Stars

Watchers

Forks

Releases

Packages 0

Contributors 2

Languages

Packages