Search Results - RepositoryStats

4 results found Sort:

148

2.3k

apache-2.0

GPT4V-level open-source multi-modal model based on Llama3-8B

cogvlm multi-modal language-model pretrained-models

Created 2024-05-10

86 commits to main branch, last one 5 months ago

890

gpl-3.0

Tag manager and captioner for image datasets

llava cogvlm pyside6 florence-2 tag-manager image-tagging image-captioning stable-diffusion

Created 2023-03-08

559 commits to main branch, last one 2 months ago

638

cc0-1.0

Famous Vision Language Models and Their Architectures

vlm blip clip llava cogvlm kosmos awesome qwen-vl internlm multimodal awesome-list text-encoder image-encoder vision-language-model

Created 2024-02-15

237 commits to main branch, last one 10 days ago

mit

Python scripts to use for captioning images with VLMs

llm vlm cogvlm llama3 mistral moondream vision-language image-captioning text-summarization

Created 2024-03-24

11 commits to main branch, last one 6 months ago