Search Results - RepositoryStats

19

385

unknown

10

An open-source implementation for training LLaVA-NeXT.

gpt-4 gpt4o llama llava llama3 chatbot chatgpt llava-next multimodal multi-modality vision-language-model large-multimodal-models visual-language-learning

Created 2024-05-11

36 commits to master branch, last one 5 months ago

RLAIF-V RLHF-V

13

324

unknown

5

[CVPR'25] RLAIF-V: Open-Source AI Feedback Leads to Super GPT-4V Trustworthiness

llava gpt-4v chatbot rlaif-v cvpr2025 minicpm-v llava-next multimodal vision-language-learning

Created 2024-05-13

62 commits to main branch, last one 21 days ago

lmms-finetune zjysteven

28

278

apache-2.0

8

A minimal codebase for finetuning large multimodal models, supporting llava-1.5/1.6, llava-interleave, llava-next-video, llava-onevision, llama-3.2-vision, qwen-vl, qwen2-vl, phi3-v etc.

llava qwen-vl finetuning llava-next multimodal vision-language foundation-models instruction-tuning large-language-model large-multimodal-models visual-instruction-tuning multimodal-large-language-models

Created 2024-07-20

109 commits to main branch, last one about a month ago

matryoshka-mm mu-cai

6

98

apache-2.0

4

Matryoshka Multimodal Models

chatb llama llava llava-next matryoshka multimodal multimodal-large-language-models

Created 2024-05-27

477 commits to main branch, last one 2 months ago

LLaVA-NeXT-Image-Llama3-Lora chuangchuangtan

4

44

apache-2.0

2

LLaVA-NeXT-Image-Llama3-Lora, Modified from https://github.com/arielnlee/LLaVA-1.6-ft

lora llama3 finetuning llava-next

Created 2024-06-24

6 commits to main branch, last one 8 months ago

HiRED hasanar1f

4

26

mit

1

[AAAI 2025] HiRED strategically drops visual tokens in the image encoding stage to improve inference efficiency for High-Resolution Vision-Language Models (e.g., LLaVA-Next) under a fixed token budget...

ml vlm lvlm llava llava-next

Created 2024-08-19

19 commits to main branch, last one about a month ago