IMAX

Enhancing Multi-task Learning Capability of Medical Generalist Foundation Model via Image-centric Multi-annotation Data

Xun Zhu, Fanbin Mo, Zheng Zhang, Jiaxi Wang, Yiming Shi, Ming Wu, Chuang Zhang, Miao Li, Ji Wu

【Accepted】by The 33rd ACM International Conference on Multimedia (ACM MM 2025)

Dataset

Dataset statistics

IMAX comprises a total of 47,600 unique X-rays and 354,595 data entries, distributed as follows: 100,901 for VQA, 54,684 for calculation, 51,045 for REC, 51,045 for REG, 45,715 for report generation, 45,186 for multi-label classification, and 6,019 for multi-class classification. We partition IMAX into train and test sets with a ratio of 4:1, resulting in 38,077 images and 284,017 data entries allocated for training.

DMAX average: 1) 1.25 tasks per image; 2) 2.09 train data entries per image.

IMAX average: 1) 4.10 tasks per image; 2) 7.46 train data entries per image.

Name		Name	Last commit message	Last commit date
Latest commit History 7 Commits
eval_configs		eval_configs
images		images
imax		imax
train_configs		train_configs
README.md		README.md
eval_calculate.py		eval_calculate.py
eval_caption.py		eval_caption.py
eval_cls_multi_class.py		eval_cls_multi_class.py
eval_cls_multi_label.py		eval_cls_multi_label.py
eval_rec.py		eval_rec.py
eval_reg.py		eval_reg.py
eval_vqa.py		eval_vqa.py
evaluate_metrics.py		evaluate_metrics.py
train.py		train.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

IMAX

Getting Started

About

Uh oh!

Releases

Packages

Languages

MSIIP/IMAX

Folders and files

Latest commit

History

Repository files navigation

IMAX

Getting Started

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages