Skip to content

This project was created with the goal of the extraction and classification of legal judgments contained into PDF files using regex, the NLP library spacy, and Django.

Notifications You must be signed in to change notification settings

francocamila/NLP-information-extractor

Repository files navigation

NLP-information-extractor

Introdução

Projeto criado com o intuito de extrair e classificar informações de acórdãos jurídicos em arquivos PDF, utilizando python, regex, a library Spacy para a formação de entidades customizadas e para a criação e treinamento de modelos de classificação. A interface com o usuário é feita em Django.

Os dados extraídos foram:

  • ementa de cada acórdão;
  • número do processo;
  • nome do órgão;
  • restante do texto;

O projeto está em fase de desenvolvimento, e uma parte dele se encontra em uma aplicação feita em Django: O usuário submete um arquivo em PDF contendo um acórdão, no qual palavras chaves são extraídas e o número de suas ocorrências no texto são apresentadas em uma tabela.

As palavras chaves serão utilizadas para a classificação dos acórdãos por meio do reconhecimento de entidades.

🚀 Comandos básicos da aplicação:

  • Build:
docker-compose build
  • Deploy:
docker-compose up
  • Logs:
docker-compose logs

About

This project was created with the goal of the extraction and classification of legal judgments contained into PDF files using regex, the NLP library spacy, and Django.

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published