Search Results - RepositoryStats

46

480

apache-2.0

7

Custom ComfyUI nodes for Vision Language Models, Large Language Models, Image to Music, Text to Music, Consistent and Random Creative Prompt Generation

llm vlm mllm llava nodes phi15 joytag siglip comfyui img2sfx img2text custom-nodes image-captioning

Created 2024-01-24

274 commits to main branch, last one about a month ago

siglip merveenoyan

12

223

apache-2.0

5

Projects based on SigLIP (Zhai et. al, 2023) and Hugging Face transformers integration 🤗

siglip computer-vision machine-learning multimodal-learning

Created 2024-01-04

20 commits to main branch, last one about a month ago

LLaVA-MORE aimagelab

8

113

apache-2.0

6

LLaVA-MORE: A Comparative Study of LLMs and Visual Backbones for Enhanced Visual Instruction Tuning

llms llava llama3 siglip gemma-2 siglip2 llama3-1 deepseek-r1 llava-llama3 llama3-vision multimodal-llms vision-and-language

Created 2024-07-31

32 commits to main branch, last one 2 hours ago

AWT MCG-NJU

4

95

apache-2.0

3

[NeurIPS 2024] AWT: Transferring Vision-Language Models via Augmentation, Weighting, and Transportation

clip vlms siglip computer-vision transfer-learning zero-shot-learning video-understanding open-set-recognition

Created 2024-10-04

6 commits to main branch, last one 5 months ago

tryoffdiff rizavelioglu

17

83

other

4

Official repository of "TryOffDiff: Virtual-Try-Off via High-Fidelity Garment Reconstruction using Diffusion Models".

siglip fashion pytorch demo-app diffusion e-commerce image-to-image virtual-try-on virtual-try-off stable-diffusion huggingface-diffusers

Created 2024-07-26

3 commits to main branch, last one 2 months ago

transformers-notebooks qubvel

12

70

apache-2.0

7

Inference and fine-tuning examples for vision models from 🤗 Transformers

detr siglip vitpose depth-pro inference superglue rt-detr-v2 fine-tuning transformers pose-estimation depth-estimation object-detection keypoint-matching vision-transformer

Created 2025-01-20

38 commits to main branch, last one a day ago

MachineLearning OrvilleX

22

66

unknown

3

本项目以应用为主出发，结合了从基础的机器学习、深度学习到目标检测以及目前最新的大模型，采用目前成熟的第三方库、开源预训练模型以及相关论文的最新技术，目的是记录学习的过程同时也进行分享以供更多人可以直接进行使用。

knn llm svm mllm numpy scipy siglip sklearn tensorflow spark-mllib machine-learning

Created 2020-09-06

127 commits to master branch, last one 23 days ago

freedom NikosEfth

2

43

mit

2

Official PyTorch implementation of the WACV 2025 Oral paper "Composed Image Retrieval for Training-FREE DOMain Conversion".

clip siglip cross-domain deep-learning training-free computer-vision image-retrieval neural-networks domain-conversion cross-domain-learning composed-image-retrieval

Created 2024-11-08

28 commits to main branch, last one 5 days ago