Search Results - RepositoryStats

86

1.7k

apache-2.0

22

Emu Series: Generative Multimodal Models from BAAI

instruct-tuning foundation-models in-context-learning multimodal-generalist multimodal-pretraining generative-pretraining-in-multimodality

Created 2023-07-11

41 commits to main branch, last one 4 months ago

Awesome_Matching_Pretraining_Transfering Paranioar

48

416

mit

12

The Paper List of Large Multi-Modality Model (Perception, Generation, Unification), Parameter-Efficient Finetuning, Vision-Language Pretraining, Conventional Image-Text Matching for Preliminary Insigh...

tutorial awesome-list image-text-matching large-vision-models vision-and-language image-text-retrieval large-language-model video-text-retrieval cross-modal-retrieval large-language-models multimodal-pretraining video-text-recognition memory-efficient-tuning text-to-image-synthesis text-to-image-generation text-to-video-generation visual-semantic-embedding large-vision-language-models parameter-efficient-fine-tuning multimodal-large-language-models

Created 2020-12-22

130 commits to main branch, last one about a month ago

Youku-mPLUG X-PLUG

11

290

apache-2.0

6

Youku-mPLUG: A 10 Million Large-scale Chinese Video-Language Pre-training Dataset and Benchmarks

mllm video youku chinese dataset benchmark multimodal video-retrieval multimodal-pretraining video-question-answering multimodal-large-language-models

Created 2023-06-06

18 commits to main branch, last one about a year ago

mPLUG-2 X-PLUG

19

222

apache-2.0

4

mPLUG-2: A Modularized Multi-modal Foundation Model Across Text, Image and Video (ICML 2023)

vqa mllm mplug video multimodal image-retrieval video-retrieval foundation-models multimodal-pretraining video-question-answering

Created 2023-05-22

4 commits to main branch, last one about a year ago