contextual-pruning

Library to facilitate pruning of LLMs based on context

In AI research, the optimization of Large Language Models (LLMs) remains a significant challenge, crucial for advancing the field’s practical applications and sustainability. Building upon the foundational work of Professor Song Han’s lab at MIT, this codebase consoldiates work done as an MIT 6.5940 Project, introducing a novel approach in developing Mini-GPTs via contextual pruning. Our methodology strategically prunes the computational architecture of traditional LLMs, like Phi-1.5, focusing on retaining core functionalities while drastically reducing model sizes. We employed the technique across diverse and complex datasets, including US law, Medical Q&A, Skyrim dialogue, English-Taiwanese translation, and Economics articles. Contextual pruning is a promising method for building domain-specific LLMs, and this research is a building block towards future development with more hardware compute, refined fine-tuning, and quantization.

Authors: Tim Valicenti, Justice Vidal, and Ritik Patnaik

Name		Name	Last commit message	Last commit date
Latest commit History 9 Commits
legal_dataset		legal_dataset
question_datasets		question_datasets
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
dataset.py		dataset.py
evaluation.py		evaluation.py
example.py		example.py
model_manager.py		model_manager.py
prune.py		prune.py
requirements.txt		requirements.txt
run.py		run.py
utils.py		utils.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

contextual-pruning

About

Releases

Packages

Contributors 3

Languages

License

tval2/contextual-pruning

Folders and files

Latest commit

History

Repository files navigation

contextual-pruning

About

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Contributors 3

Languages

Packages