Search Results - RepositoryStats

2 results found Sort:

939

5.5k

other

113

A modular framework for vision & language multimodal research from Facebook AI Research (FAIR)

vqa dialog pytorch textvqa captioning multimodal deep-learning hateful-memes multi-tasking pretrained-models

Created 2018-06-27

1,099 commits to main branch, last one 2 months ago

unknown

Official code for paper "Spatially Aware Multimodal Transformers for TextVQA" published at ECCV, 2020.

eccv vision textvqa language

Created 2020-10-05

19 commits to main branch, last one 3 years ago