Search Results - RepositoryStats

2 results found Sort:

384

other

Conceptual 12M is a dataset containing (image-URL, caption) pairs collected for vision-and-language pre-training.

pre-training multimodal-dataset vision-and-language

Created 2021-03-03

16 commits to main branch, last one 2 years ago

gpl-3.0

Dataset and Evaluation Scripts for Obstacle Detection via Semantic Segmentation in a Marine Environment

Created 2019-10-15

17 commits to master branch, last one 4 years ago