바로가기메뉴

본문 바로가기 주메뉴 바로가기

GeoData

지질학, 생태학, 해양학, 우주과학, 극지과학에서의 데이터 저널

논문목록

다목적실용위성을 활용한 AI 학습용 구름 데이터셋 구축

AI Training Dataset for Cloud Detection of KOMPSAT

초록

광학영상 획득 시 불가피하게 등장하는 구름은 지상 관측을 어렵게 하며, 이를 제거하는 것은 위성영상의 활용도를 높이는 중요한 절차이다. 현재 다목적실용위성영상에 대해서는 전체 영상에 대해 목측 운량만 제공될 뿐, 구름에 대한 자세한 마스킹 정보는 제공되지 않는다. 구름 마스킹 정보를 구하는 것은 시간이 많이 걸리는 작업으로 최신 인공지능 기술을 통해 이러한 작업을 빠르게 수행하는 알고리즘을 개발하고자 구름 데이터셋을 구축하였다. 구름 데이터셋의 영상은 구름이 지역에 따라 그 특색이 다르게 나타나는 점을 고려하여 다양한 지역에서 선정되었으며 구름 라벨은 두꺼운 구름, 얇은 구름, 구름 그림자, 청천으로 분류하였다. 구축 규모는 1000x1000 크기로 4000장 이상으로, 글 작성 시점 기준으로 공개된 구름 데이터 중에서는 세계 최대 규모이다. 본 데이터는 정부 인공지능 학습용 데이터 구축 사업에 의해 구축되었으며 aihub.or.kr를 통해 공개할 예정이다.

Abstract

Clouds that appear inevitably when acquiring optical satellite images hinder the interpretation of surface information, so removing them is a crucial procedure to increase the utilization of satellite images. Currently, for KOMPSAT (Korea Multi-purpose Satellite) images, only the cloud amount by visual measurement is proved for the entire scene and detailed cloud masks are not provided. Since cloud detection is a time-consuming task, we built a cloud dataset for KOMPSAT images so as to develop an algorithm that expedites the task with state-of-the-art artificial intelligent techniques. In the dataset, satellite images were selected from various regions considering that clouds have different characteristics depending on the region, and masks were classified into thin clouds, thick clouds, cloud shadows, and clear sky. The size of dataset is over 4,000 image/mask pairs by an image size of 1024x1024 and one of the largest among publicly available cloud datasets, as of this writing. The dataset is built by a government AI (artificial intelligent) training dataset building program and will be available through the website, aihub.or.kr.


투고일Submission Date
2020-12-17
수정일Revised Date
2020-12-22
게재확정일Accepted Date
2020-12-23

Geo Data