Search Results - RepositoryStats

2 results found Sort:

347

3.5k

bsd-3-clause

Code and models for NExT-GPT: Any-to-Any Multimodal Large Language Model

llm mllm gpt-4 chatgpt multimodal foundation-models instruction-tuning multi-modal-chatgpt large-language-models visual-language-learning

Created 2023-08-30

249 commits to main branch, last one 4 months ago

270

3.0k

bsd-3-clause

[EMNLP 2023 Demo] Video-LLaMA: An Instruction-tuned Audio-Visual Language Model for Video Understanding

blip2 llama minigpt4 multi-modal-chatgpt large-language-models cross-modal-pretraining video-language-pretraining vision-language-pretraining

Created 2023-05-06

145 commits to main branch, last one 9 months ago