Projeto de classificação de animais utilizando técnicas de machine learning para o Atlântico Avanti Bootcamp
No estudo, foi utilizado o conjunto de dados Image Classification - 64 Classes - Animal, disponível na plataforma Kaggle. A base de dados contém 14.377 imagens de diferentes espécies de animais, com resolução de 512x512 pixels. As imagens são divididas em categorias como cães, gatos, elefantes, entre outros, abrangendo uma grande diversidade de animais.
O objetivo deste projeto foi desenvolver um modelo de rede neural convolucional (CNN) para classificar imagens de animais. Para isso, utilizamos uma abordagem baseada em modelos pré-treinados, como o ResNet152, para alcançar altos níveis de precisão e eficiência. O projeto também visa identificar quais métodos de transformação de dados e ajustes de hiperparâmetros podem melhorar a performance na classificação das imagens.
A classificação automática de imagens de animais pode ser aplicada em diversas áreas, como na biologia, para identificação de espécies, e em sistemas de monitoramento, como em câmeras de segurança e ambientes naturais. O uso de redes neurais convolucionais, especialmente modelos pré-treinados como o ResNet152, proporciona uma maneira eficiente e precisa de resolver esse tipo de problema, oferecendo um modelo robusto que pode ser facilmente adaptado para outros tipos de classificação de imagens.
O estudo visa aprimorar a qualidade dos sistemas automáticos de classificação de imagens, utilizando os dados coletados para avaliar a eficácia dos métodos utilizados, como as transformações de dados e a configuração dos hiperparâmetros. A partir dessa análise, espera-se fornecer uma base sólida para a implementação de sistemas de classificação eficientes em outras áreas, seja na área de pesquisa animal, em sistemas de saúde ou em outras aplicações de inteligência artificial.
O notebook [Animal Classification | EfficientNet | PyTorch] demonstra a construção de um modelo de classificação de imagens de animais usando a arquitetura EfficientNet com PyTorch. O projeto abrange desde o pré-processamento do dataset com 64 classes de animais, passando por técnicas de aumento de dados, até a customização e treinamento do modelo. Além disso, o notebook apresenta as métricas de desempenho, como acurácia e F1-score, e visualizações dos resultados, como a matriz de confusão, oferecendo uma visão completa do processo de classificação de imagens com redes neurais convolucionais modernas.