Search Results - RepositoryStats

Awesome_Matching_Pretraining_Transfering Paranioar

48

416

mit

12

The Paper List of Large Multi-Modality Model (Perception, Generation, Unification), Parameter-Efficient Finetuning, Vision-Language Pretraining, Conventional Image-Text Matching for Preliminary Insigh...

tutorial awesome-list image-text-matching large-vision-models vision-and-language image-text-retrieval large-language-model video-text-retrieval cross-modal-retrieval large-language-models multimodal-pretraining video-text-recognition memory-efficient-tuning text-to-image-synthesis text-to-image-generation text-to-video-generation visual-semantic-embedding large-vision-language-models parameter-efficient-fine-tuning multimodal-large-language-models

Created 2020-12-22

130 commits to main branch, last one about a month ago

safe-sora PKU-Alignment

5

29

unknown

4

SafeSora is a human preference dataset designed to support safety alignment research in the text-to-video generation field, aiming to enhance the helpfulness and harmlessness of Large Vision Models (L...

alignment human-preferences large-vision-models text-to-video-generation

Created 2024-06-09

4 commits to main branch, last one 5 months ago

Awesome-MLLM-Uncertainty Ruiyang-061X

0

28

unknown

2

✨A curated list of papers on the uncertainty in multi-modal large language model (MLLM).

mllm multi-modal uncertainty large-vision-models large-language-models uncertainty-estimation uncertainty-quantification large-vision-language-models

Created 2024-11-27

8 commits to main branch, last one 20 days ago