GeoChat:Grounded Large Vision-Language Model for Remote Sensing

Kuckreja, Kartik; Sohail Danish, Muhammad; Naseer, Muzammal; Das, Abhijit; Khan, Salman; Shahbaz Khan, Fahad

doi:10.1109/cvpr52733.2024.02629

Public

GeoChat:Grounded Large Vision-Language Model for Remote Sensing

Shared by NobleBlocks on Jun 16, 2024 • 12:00 AM UTC

Authors:

Kartik Kuckreja

Muhammad Sohail Danish

Muzammal Naseer

Abstract

Recent advancements in Large Vision-Language Models (VLMs) have shown great promise in natural image domains, allowing users to hold a dialogue about given visual content. However, such general-domain VLMs perform poorly for Remote Sensing (RS) scenarios, leading to inaccurate or fabricated informat...

Subject

Computer science

Language model

Computer vision

Finding related papers...

Discussions

(0)

No comments yet

Be the first to share your thoughts!