LXMERT: Learning Cross-Modality Encoder Representations from Transformers 논문 리뷰

2023. 4. 13. 19:22

VLP: Unified Vision-Language Pre-Traning for Image Captioning and VQA 논문 리뷰 (2)	2023.04.17
VL-BERT: Pre-training of Generic Visual-Linguistic Representations 논문 리뷰 (2)	2023.04.16
ViLBERT: Pretraining Task-Agnostic Visiolinguistic Representations for Visual-and-Language Tasks (0)	2023.04.12
VisualBERT: A Simple and Performant Baseline for Vision and Language 논문 리뷰 (0)	2023.04.11
VLM(Vision-Language Model)에 대해 알아보자! (0)	2023.04.10