Vision-Text Model Fine-Tuning for Pokémon Cards

This repository contains code for fine-tuning the Idefics model on a Vision-Text task using a dataset of Pokémon cards. The model is trained to answer questions about images of Pokémon cards.

pip install -q datasets
pip install -q git+https://github.com/huggingface/transformers
pip install -q bitsandbytes sentencepiece accelerate loralib
pip install -q -U git+https://github.com/huggingface/peft.git

Name		Name	Last commit message	Last commit date
Latest commit History 6 Commits
Idefics_9B_FT.ipynb		Idefics_9B_FT.ipynb
MoE2.ipynb		MoE2.ipynb
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Vision-Text Model Fine-Tuning for Pokémon Cards

About

Releases

Packages

Languages

AnnemSony/Simple-FineTune-multimodal-LLM

Folders and files

Latest commit

History

Repository files navigation

Vision-Text Model Fine-Tuning for Pokémon Cards

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages