Diffusion-for-image-captioning

diffusion for image captioning

The continuous diffusion model is applied to the field of image description and generated in a non-autoregressive way to obtain more diverse image descriptions.

Setup

cd diffusion
conda install mpi4py
conda install pytorch torchvision torchaudio cudatoolkit=11.3 -c pytorch
pip install -e improved-diffusion/
pip install -e transformers/
pip install spacy==3.2.4
pip install datasets==1.8.0
pip install huggingface_hub==0.4.0
pip install wandb

Experiment

Train

cd improved-diffusion
bash script/train_diff.sh

Test

bash script/generation.sh

Reference data formats are provided below：

链接：https://pan.baidu.com/s/1x2bvPC3oxr0r4OaTz7E2tQ

提取码：7bdx

Citations

If you find this code useful in your research, please consider citing:

@inproceedings{liu-etal-2024-prefix,
    title = "Prefix-diffusion: A Lightweight Diffusion Model for Diverse Image Captioning",
    author = "Liu, Guisheng  and
      Li, Yi  and
      Fei, Zhengcong  and
      Fu, Haiyan  and
      Luo, Xiangyang  and
      Guo, Yanqing",
    booktitle = "Proceedings of the 2024 Joint International Conference on Computational Linguistics, Language Resources and Evaluation (LREC-COLING 2024)",
    year = "2024",
    url = "https://aclanthology.org/2024.lrec-main.1134",
    pages = "12954--12965",
}

Name		Name	Last commit message	Last commit date
Latest commit History 8 Commits
improved-diffusion		improved-diffusion
transformers		transformers
README.md		README.md
README.pdf		README.pdf

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Diffusion-for-image-captioning

diffusion for image captioning

Setup

Experiment

Train

Test

Citations

About

Releases

Packages

Languages

lgs00/Prefix-diffusion

Folders and files

Latest commit

History

Repository files navigation

Diffusion-for-image-captioning

diffusion for image captioning

Setup

Experiment

Train

Test

Citations

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages