Skip Navigation
Skip to contents

GEO DATA : GEO DATA

OPEN ACCESS
SEARCH
Search

Articles

Page Path
HOME > GEO DATA > Volume 6(1); 2024 > Article
Original Paper
Landsat-5/-7/-8 및 Sentinel-2 광학 위성영상을 활용한 천지호 GeoAI 데이터셋
이어루1,2orcid, 이하성3orcid, 박순천4orcid, 정형섭5,6,*orcid
The Cheonji Lake GeoAI Dataset based in Optical Satellite Imagery: Landsat-5/-7/-8 and Sentinel-2
Eu-Ru Lee1,2orcid, Ha-Seong Lee3orcid, Sun-Cheon Park4orcid, Hyung-Sup Jung5,6,*orcid
GEO DATA 2024;6(1):14-23.
DOI: https://doi.org/10.22761/GD.2023.0055
Published online: March 28, 2024

1석박사통합과정생, 서울시립대학교 공간정보공학과, 서울특별시 동대문구 서울시립대로 163, 02504, 대한민국

2석박사통합과정생, 서울시립대학교 스마트시티학과, 서울특별시 동대문구 서울시립대로 163, 02504, 대한민국

3연구사, 기상청 지진화산연구과, 서울특별시 동작구 여의대방로 16길 61, 07062, 대한민국

4연구관, 기상청 지진화산연구과, 서울특별시 동작구 여의대방로 16길 61, 07062, 대한민국

5교수, 서울시립대학교 공간정보공학과, 서울특별시 동대문구 서울시립대로 163, 02504, 대한민국

6교수, 서울시립대학교 스마트시티학과, 서울특별시 동대문구 서울시립대로 163, 02504, 대한민국

1Integrated Master and PhD Student, Department of Geoinformatics, University of Seoul, 163 Seoulsiripdae-ro, Dongdaemun-gu, 02504 Seoul, South Korea

2Integrated Master and PhD Student, Department of Smart Cities, University of Seoul, 163 Seoulsiripdae-ro, Dongdaemun-gu, 02504 Seoul, South Korea

3Researcher, Earthquake and Volcano Research Division, Korea Meteorological Administration, 61 Yeouidaebang-ro 16-gil, Dongjak-gu, 07062 Seoul, South Korea

4Senior Researcher, Earthquake and Volcano Research Division, Korea Meteorological Administration, 61 Yeouidaebang-ro 16-gil, Dongjak-gu, 07062 Seoul, South Korea

5Professor, Department of Geoinformatics, University of Seoul, 163 Seoulsiripdae-ro, Dongdaemun-gu, 02504 Seoul, South Korea

6Professor, Department of Smart Cities, University of Seoul, 163 Seoulsiripdae-ro, Dongdaemun-gu, 02504 Seoul, South Korea

Corresponding Author Hyung-Sup Jung Tel: +82-2-6490-2892 E-mail: hsjung@uos.ac.kr
• Received: November 27, 2023   • Revised: March 14, 2024   • Accepted: March 18, 2024

Copyright © 2024 GeoAI Data Society

This is an Open Access article distributed under the terms of the Creative Commons Attribution Non-Commercial License (http://creativecommons.org/licenses/by-nc/4.0/) which permits unrestricted non-commercial use, distribution, and reproduction in any medium, provided the original work is properly cited.

prev next
  • 1,377 Views
  • 54 Download
  • The variations in the water area and water level of Cheonji, the caldera lake of Baekdu Mountain, serve as reliable indicators of volcanic precursors. However, the geographical and spatial features of Baekdusan make it impossible to directly observe the water area and water level. Therefore, it is crucial to rely on remote sensing data for monitoring purposes. Optical satellite imagery employs different spectral bands to accurately delineate the boundaries between water bodies and non-water bodies. Conventional methods for classifying water bodies using optical satellite images are significantly influenced by the surrounding environment, including factors like terrain and shadows. As a result, these methods often misclassify the boundaries. To address these limitations, deep learning techniques have been employed in recent times. Hence, this study aimed to create an AI dataset using Landsat-5/-7/-8 and Sentinel-2 optical satellite images to accurately detect the water body area and water level of Cheonji lake. By utilizing deep learning methods on the dataset, it is reasonable to consistently observe the area and level of water in Cheonji lake. Furthermore, by integrating additional volcanic precursor monitoring factors, a more accurate volcano monitoring system can be established.
최근 세계 각지에서 대규모 및 소규모 화산활동의 증가가 관찰되고 있다. 최근 2023년에는 러시아 캄차카 반도의 시벨루치 화산분출로 인해 인근 섬들이 화산재로 뒤덮이고, 전력 공급 중단 및 인명피해까지 발생하였다. 이러한 화산활동은 전지구적·불가역적 영향을 미칠 수 있다. 이에 따라 화산활동의 전조 현상을 감지하고 피해를 최소화하기 위한 다양한 연구가 진행 중에 있다. 특히, 칼데라 내 호수의 면적 및 수위 변화는 마그마 팽창이나 절리계 발달에 따른 지반 상승으로 인해 발생할 수 있으며, 이는 화산 분화의 전조 증상으로 간주될 수 있다(Shibata and Akita, 2001).
북한의 삼지연군과 중국 동북지방의 국경지대에 위치한 백두산에서는 2000년대 초반부터 지진, 지표 변위, 온천수 화학 성분의 변화 등 화산활동의 초기 징후가 나타나고 있다(Xu et al., 2012). 이에 따라 백두산 화산활동의 전조 현상을 모니터링하는 다양한 연구들이 수행되었다(Lee et al., 2022; Meng et al., 2022; Yun et al., 2019). 백두산 정상에 위치한 천지호로 불리는 칼데라호는 과거 화산 분화로 형성되었다. 칼데라호 아래에는 여러 개의 마그마방이 존재하며, 여름철 천지가 녹아 있을 때 수체 면적 및 수위의 변화를 관찰함으로써 화산활동의 전조 현상을 추론할 수 있다(Sato et al., 1992). 그러나 백두산의 광대한 지형 및 칼데라 호수의 범위로 인해 현장조사는 어려움이 있다. 이를 극복하기 위해 화산활동에 대한 정보를 신속하게 전달할 수 있는 원격 탐사 기술의 개발이 중요하며, 위성영상 자료를 활용함으로써 공간적 한계를 극복하고 지속적인 모니터링이 가능하다(Baek and Jung, 2019; Lee et al., 2023b).
광학 위성은 다양한 파장대역에서 지표면에서 반사되는 태양 복사 에너지를 측정하여 영상을 생성한다. 이러한 위성은 지표면의 다양한 특성을 파악할 수 있으며, 특히 수체의 변화를 직관적으로 파악할 수 있는 데 유용하다(Wieland and Martinis, 2020). 그러나 광학 위성은 기상 조건에 영향을 많이 받기 때문에 연속적인 데이터 취득과 분석이 어렵다. 이를 극복하기 위해, 다양한 종류의 위성영상을 활용하여 서로 다른 각도와 시간대의 이미지를 통합함으로써 기상 조건의 영향을 최소화할 수 있다.
최근 이미지 내의 관심 영역 및 경계를 산출하는 알고리즘은 딥러닝을 기반으로 기존 탐지의 기법 성능을 상회하는 것으로 나타났다(Russakovsky et al., 2015). 딥러닝 모델은 광학 위성영상의 다양한 스펙트럼 대역을 통합적으로 분석할 수 있으며, 일조량, 조도 및 계절적 변화와 같은 외부적인 조건을 고려하여 일관된 결과를 제공할 수 있다(Gargiulo et al., 2020; Lee et al., 2023a). 특히, 수체와 같은 복잡한 패턴 및 특성을 학습함으로써 보다 정확하게 분류할 수 있으며, 이를 통해 시간과 자원을 절감시킬 수 있다(James et al., 2021). 이에 따라 본 논문에서는 백두산 천지의 수체 면적 및 수위 변화를 모니터링하기 위해, 다종 광학 위성영상을 활용하여 천지 수체 면적에 대한 AI 학습 데이터셋을 구축하였다.
백두산 정상에 위치한 천지는 과거 화산활동의 결과로 형성된 칼데라 호수이다(Fig. 1). 북한의 함경북도와 중국의 동북지방 국경에 위치한 천지의 해발 고도는 2,190 m이며, 둘레는 약 13.11 km에 달한다. 호수 면적은 약 9.82 km2로 추정되며, 약 20억 톤의 물을 저장할 수 있다. 천지의 위치와 고도로 인해 구름과 안개의 형성이 잦으며, 연간 강수량은 약 1,340 mm에 달한다(Kim et al., 2013). 또한 한반도의 기후 특성과 유사하여 계절적 변화에 따라 천지호는 겨울철에 결빙되고, 여름철에는 해빙되는 패턴을 보인다(Korea Meteorological Administration, 2021).
본 연구에서는 백두산 천지의 수체 탐지를 위한 인공지능 학습 데이터 구축을 목표로 하여, 다양한 광학 위성영상을 활용하였다. Table 1에 명시된 바와 같이, 8월부터 11월 사이에 해빙이 완전히 이루어진 천지의 영상 중에서 구름이 없는 이미지를 육안 분석을 통해 총 Landsat-5/-7/-8 108장, Sentinel-2A/-2B 45장을 선별하였다. 또한, 일관된 탐지 정확도를 보장하기 위해 입력 데이터의 product level을 명확히 정의하고 수집하였다. Landsat 위성영상은 United States Geological (USGS)에서, Sentinel-2 위성영상은 European Space Agency에서 무료로 수집이 가능하다.
연구를 위해 수집된 광학 위성영상의 특성을 고려하여 선택된 다양한 전처리 기법과 분광대역을 적용함으로써 보다 정밀한 AI 수체 데이터셋을 구축하였다. Landsat 시리즈 위성 영상의 경우 결측치 보간 과정과 대기 보정을 통해 품질을 개선하였다. 특히, Landsat-7 위성은 Scan Line Corrector (SLC) 고장으로 발생한 결측치를 처리하기 위한 보간 기법이 적용되었다. 그 후, 천지가 모두 포함되도록 영상을 200×200 픽셀의 크기로 잘라냈다. 마지막으로, 이상치 최소화 및 AI 모델 학습의 효율성을 향상시키기 위해 99% 최대-최소 정규화 방법을 통해 표준화하였다. 활용된 분광대역의 경우 수체와 비수체 간의 다양한 분광 정보를 포함하고 정밀한 탐지를 위해 Landsat-5/-7/-8 센서에 모두 포함되어 있으며, 30 m 공간해상도를 가진 blue, green, blue, near infrared (NIR), short wavelength infraRed (SWIR) 1, SWIR2 그리고 thermal infrared (TIR) 대역을 활용하였다. Sentinel-2 위성영상의 경우 비교적 높은 공간해상도와 복사해상도로 더 상세한 지표면 정보를 획득할 수 있다. 그러나 백두산과 같이 높은 고도의 산악 지형과 비가 자주 내리고 구름이 많은 기상 조건은 대기 보정 처리에 있어 상당한 어려움을 야기한다. 특히 고해상도 영상의 대기 보정 불일치는 더욱 두드러진 오류를 초래하며, 데이터의 품질을 저하시킨다. 또한 비교적 해상도가 낮은 영상에서는 픽셀의 크기에 따라 상대위치오차의 영향이 크지 않지만, 해상도가 높으면 상대위치오차에 의해 시계열 자료 분석에 오차를 야기할 수 있다. 이에 대기보정은 수행하지 않고 영상 정합을 통해 상대위치오차를 저감하였다. 그 후, 천지 영역을 모두 포함하도록 512×512 크기로 잘랐으며 99% 최대-최소 정규화 방법을 수행하였다. 활용된 분광대역의 경우 10 m의 공간해상도를 지닌 blue, green, red 그리고 NIR 대역을 활용하였다.
다음으로 AI 기술에 적용하기 위한 라벨데이터셋 제작을 위해 수집된 모든 영상에 대해 어노테이션(annotation) 과정을 수행하였다. 이를 위해, 일정한 기준에 따라 정밀한 어노테이션을 수행하기 위한 기준 영상을 각 영상별로 제작하여 활용하였다. 가시광선 대역의 경우 수체와 육지 영역 간의 명확한 구분이 가능하여 어노테이션 작업은 대체로 용이하였으나, 그림자 영역의 경계는 구분이 어렵다. 이에 대응하여, 각 위성에 따라 분광대역 자료들을 종합적으로 비교하여 최종 기준 영상을 제작하고, 어노테이션을 진행하여 최종 AI 학습 데이터셋을 구축하였다. 처리 과정에 대한 자세한 내용은 다음 절에서 기술하였다.
3.1 결측 영역 보관
Landsat-7 위성의 경우 SLC의 문제가 발생하여 2003년 5월부터 SLC-off 모드 상태로 영상을 촬영하고 있다(Storey et al., 2005). SLC는 Whiskbroom 방식의 센서가 위성 진행 방향과 직각으로 회전하며 스캔할 때 발생하는 스캔 라인을 정확하게 보정하기 위한 장치이다(Jain and Dimri, 2017). SLC-off로 촬영된 Landsat-7 위성영상은 Fig. 2A와 같이 일부 영역에서 데이터가 누락되어 영상에 특징적인 줄무늬 패턴이 나타난다. 이러한 줄무늬는 영상의 가장자리에서 더욱 두드러지며, 데이터의 약 25%가 결측되어 영상이 취득되고 있다(Maxwell, 2004). 이에 천지호 수체 면적을 탐지할 경우 SLC-off로 인해 발생한 결측값으로 인해 적절한 탐지가 불가능하다. 이에 본 연구에서는 결측 지역을 보간하기 moving kernel median filter 기법을 활용하였다(Korea Meteorological Administration, 2021). Moving kernel median filter 기법은 영상을 일정한 크기의 kernel을 움직여가며 필터링을 진행하는데, kernel 내의 포함된 픽셀 중 결측 지역을 제외하고 존재하는 값의 중앙값을 대표값으로 사용하여 결측치를 보간하는 기법이다. Fig. 2B는 SLC-off로 촬영된 영상을 moving kernel median filter 기법을 통해 보간한 영상으로 줄무늬 효과가 사라진 것을 확인할 수 있다.
3.2 대기보정
천지호 면적 탐지의 정밀도를 높이기 위해 대기의 산란, 흡수 및 굴절에 의한 지표 반사율의 왜곡을 보정하는 대기보정 절차를 적용하였다(Park et al., 2012). 이를 위해 미국 지질 조사국(USGS)에서 제공하는 Landsat 위성의 종류에 따른 대기보정 모델을 활용하였다(Roy et al., 2016). Landsat-5 및 Landsat-7 위성영상의 경우, Eq. 1을 통해 센서의 화소값을 복사휘도로 변환해준 뒤, Eq. 2를 통해 대기상층 복사도로 변환하였다. Landsat-8 위성영상은 Eq. 3을 통해 태양각도 보정을 하지 않은 대기상층 복사도를 구한 뒤, 태양각도를 고려하여 Eq. 4를 통해 대기상층 복사도로 변환하였다.
[Eq. 1]
Lλ=LMAXλ-LMINλDNMAX-DNMINDN-DNMIN+LMINλ
[Eq. 2]
ρλ=πLλd2ESUNλCosθS
[Eq. 3]
ρλt=MρDN+Aρ
[Eq. 4]
Rλ=ρλtSinθSE
Lλ, 복사휘도; DN, 센서의 화소 값; LMINλ, 복사휘도의 최소값; LMAXλ, 복사휘도 최대값; ρλ, 대기 상층복사도; d, 지구와 태양까지의 거리(단위: AU); ESUNλ, 태양으로부터 복사된 복사조도; θS, 태양의 천정각도; Mρ, 밴드별 조정 상수; Aρ, 밴드별 조정 계수; Rλ, 태양의 각도를 고려한 대기 상층복사도; θSE, 태양의 일조각도.
3.3 영상 정합
기하보정이 수행된 영상에도 불구하고 시계열 영상들 사이에는 상대위치오차가 존재한다. 비교적 해상도가 낮은 영상에서는 픽셀의 크기에 따라 상대위치오차의 영향이 크지 않지만, 해상도가 향상될수록 상대위치오차에 의하여 시계열 자료 분석에 오차를 야기할 수 있다. 이를 해결하기 위해 고해상도인 Sentinel-2 영상에서 Bernstein and Colby (1983)의 교차상관 알고리즘을 활용하여 두 영상 간의 상관계수를 계산한 뒤 정합하였다. 교차상관 알고리즘은 주영상과 부영상 쌍 내 모든 가로 및 세로 방향 픽셀의 정규 상관계수를 주영상과 부영상 쌍 전체에 대해 커널을 이동시키며 계산하는 방식이다. 광학 위성영상 간의 정합을 위해 교차상관 알고리즘을 적용할 때, 광학 위성영상의 분광 반사도 red, green, blue 및 NIR 정보를 활용하였으며, 주 영상은 영상 내 구름이 없고 정밀한 기하보정이 된 2021년 10월 22일에 촬영된 영상을 선정하였다. 최종적으로 분석에 활용되는 모든 시계열 영상에 본 기법을 적용함으로써 전체 영상에 대한 상대위치오차를 저감하였으며 약 2 m 미만 수준으로 보정되었다.
3.4 영상 자르기 및 정규화
광학 위성데이터의 전처리 과정에서 EPSG:32652 (UTM 52N Zone) 좌표계를 사용하여 천지호를 전체적으로 포함하도록 데이터를 잘랐다. 데이터를 자를 때, 천지의 크기, 공간해상도 및 학습 데이터의 크기를 고려하였다. Landsat-5/-7/-8 위성영상의 경우 좌상단 좌표(419,070 m, 4,653,450 m)에서 (200 pixel, 200 pixel)만큼 영상을 잘랐으며, Sentinel-2 위성영상의 경우 좌상단 좌표(419,560 m, 4,653,190 m)에서 (512 pixel, 512 pixel)만큼 영상을 잘랐다.
마지막으로, 데이터 전처리 과정에서 정규화는 딥러닝 모델이 과적합되는 것을 방지하고 강건성을 향상시킨다. 특히, 위성영상은 취득 과정에서 다양한 외부 환경 요인에 의해 잡음이 유입될 수 있다(Lee et al., 2022). 이러한 잡음은 영상의 품질을 저하시키고, 결과적으로 딥러닝 모델의 학습 효율과 정확도에 부정적인 영향을 미친다. 이에 따라, 위성영상의 잡음을 제거하고 및 정규화를 위해 99% 최대-최소 정규화 방법을 수행하였다. 데이터를 오름차순으로 정렬한 후, 하위 0.5% 및 상위 0.5%를 제외한 새로운 최소값과 최대값을 설정하였다. 이렇게 조정된 새로운 최소값과 최대값을 기반으로 최대-최소 정규화를 수행하였다. 이 과정에서 0보다 작은 값은 0으로, 1보다 큰 값은 1로 변환하여 데이터의 범위를 (0, 1)로 조정하여 원천데이터를 구축하였다.
3.5 기준 영상 생성
Landsat 영상의 경우, SWIR, green, blue 밴드를 이용한 false color 영상과 normalized difference water index (NDWI) 영상 그리고 TIR 영상을 서로 상호보완하여 수체와 비수체의 경계를 명확히 구분하였다(Table 2). NDWI와 SWIR을 포함한 false color 영상은 수체의 반사 특성과 다른 육지표면의 반사 특성 차이를 정량화하여 경계를 효과적으로 구분할 수 있다. 특히, SWIR은 물에 대한 반사율이 거의 없는 특징을 가져 구분에 용이하다. TIR 영상은 지형의 그림자와 수체를 가장 뚜렷하게 구분할 수 있으나 다른 밴드보다 비교적 낮은 공간간해상도를 보간한 영상으로 라벨데이터 제작 시 보완 자료로만 활용하였다.
Sentinel-2의 경우, Landsat-5/-7/-8보다 높은 복사해상도를 가지고 있어 그림자 내부의 수체와 비수체 영역의 세밀한 분류가 가능하다. 이에 따라, Table 2와 같이 로그 변환된 false color 영상과 shadow histogram stretching map (SHSM)을 활용하여 그림자 영역에 대한 어노테이션을 수행하였다. 로그 변환 맵은 blue, green, NIR 밴드를 활용하는 false color 영상에서 각 밴드별 최대값으로 나눈 후 로그 변환을 통해 그림자 내 수체와 육지 지역의 시각적 차이를 극대화하였다. 유사하게, SHSM은 가시광선과 적외선 대역 데이터에 대해 수계 영역과 그림자 영역의 값을 기준으로 한 선형 변환 자료로, 역시 그림자 내 수체와 육지의 시각적 차이를 향상시켰다.
이에 따라 앞서서 기술한 기준 영상을 상호보완적으로 활용하여 정밀한 어노테이션을 통해 최종 라벨데이터를 구축하였다.
4.1 Landsat-5/-7/-8 AI 데이터
Landsat-5/-7/-8 위성은 다른 광학 위성에 비해 저해상도이지만, TIR 및 수체에 민감한 SWIR 밴드 대역으로 정밀한 수체 경계 구분이 가능하다. Fig. 3은 Landsat-5/-7/-8 위성 영상 원천데이터, 기준 영상 및 라벨데이터를 나타낸다. 우선, Fig. 3의 3, 4는 Landsat-7 위성이 촬영한 영상으로 SLC-off로 인한 줄무늬 형태의 결측치가 보간된 것을 확인할 수 있다. 다음으로, Fig. 3의 A, B, D를 확인해보면 비교적 천지호의 수체를 잘 분류하는 것을 알 수 있다. NDWI (Fig. 3의 C1-6)는 수계 영역과 비수계 영역 사이의 픽셀값 차이가 커서 수계 지역의 경계를 명확히 구분하는 데 효과적인 것을 확인할 수 있다. 그러나 Fig. 3의 A1-6의 흰색 박스와 같이 천지호가 그림자와 맞닿아 있는 경우, NDWI를 이용해 수체 영역과 그림자 영역을 구분하는 것은 어렵다. 이에 물에 대한 낮은 반사율을 가진 SWIR (Fig. 3의 B1-6) 밴드를 활용하여 수계 영역과 그림자 영역을 뚜렷하게 구분하였다. TIR 영상(Fig. 3의 D1-6)은 흰색 박스와 같이 지형 그림자와 수계 영역을 가장 잘 구분하였으나, 따뜻한 계절에 촬영된 TIR 영상(Fig. 3의 D3-4)의 경우 흰색 박스와 같이 천지호와 주변 그림자 사이의 경계가 모호한 경향을 보였다. 이러한 밴드 특성 및 영상 고유의 특징을 상호보완하여 수정함으로써, 최종적으로 고품질의 라벨데이터(Fig. 3의 E1-6)를 구축하였다.
4.2 Sentienl-2 AI 데이터
Sentinel-2 영상은 비교적 고해상도 특성으로 수체의 경계를 보다 뚜렷하게 구분할 수 있다. Fig. 4는 Sentinel-2 위성영상 원천데이터, 기준 영상 및 라벨 데이터를 나타낸다. Fig. 4A를 확인해보면, 천지호의 수체를 뚜렷하게 분류하는 것을 확인할 수 있다. 그러나 흰색박스 지역은 비류봉 지역으로 천지호가 그림자와 맞닿아 있어 짙은 그림자의 영향으로 인해 경계를 확인하기 어렵다. 이에 로그 변환된 false color 영상(Fig. 4의 B1-4)과 SHSM (Fig. 4의 D1-4)을 제작함으로써 수계와 그림자 지역 간의 차이를 뚜렷하게 구분할 수 있다. NDWI (Fig. 4의 C1-4)는 흰색 박스 부분인 그림자 영역을 구분하는 데 한계가 있는 반면, 수계 영역과 주변 지형 영역 간의 픽셀값 차이가 커서 경계를 명확하게 구분할 수 있다(Lee and Jung, 2023). 이러한 기준 영상을 상호보완하여 수정함으로써, 최종적으로 고품질의 라벨데이터(Fig. 4의 E1-4)를 구축하였다.
백두산 화산활동 모니터링은 천지호의 수위와 수체 면적의 변화를 지속적으로 분석함으로써 효과적으로 수행될 수 있다. 이러한 모니터링은 백두산 천지호의 특수한 정치적 및 지리적 조건을 고려할 때, 위성영상 기반 관측이 실용적인 방법으로 제시된다. 광학 위성의 경우 기상 조건에 영향을 많이 받으나 다종 광학 위성을 활용한다면 이러한 제약을 최소화할 수 있다. 이에 본 연구에서는 다중 분광 영상을 활용하여 백두산 천지호의 수체 면적을 정밀하게 탐지할 수 있는 AI 데이터셋을 구축하고자 한다. 이를 위해, Landsat-5/-7/-8 및 Sentinel-2의 위성영상을 수집하여 필요한 전처리 과정을 수행함으로써 원천데이터를 구축하였다. 특히, Land-5/-7/-8 위성영상은 다양한 분광대역을 활용하여 수체와 비수체를 뚜렷하게 구분할 수 있었으며, Sentinel-2의 높은 공간 및 복사 해상도는 수체의 경계와 심지어 그림자에 의해 영향을 받는 경계까지도 식별할 수 있음을 확인하였다. 라벨데이터 구축을 위해서는 각 위성에 적절한 기준 영상을 제작하여 정밀한 어노테이션 작업을 수행하였다. 이렇게 구축된 AI 데이터셋은 머신러닝 및 딥러닝 기술에 적용함으로써 천지호 모니터링의 정확도를 향상시킬 것으로 기대된다. 그러나 다종 위성영상의 통합된 활용을 위해서는 추가적인 전처리가 요구된다. 우선 Landsat-5/-7/-8 위성영상은 비류봉 지역의 그림자 영역 내 경계 구분이 어렵기 때문에 그림자 마스킹 아웃 과정이 필요하다. 그 후, 서로 다른 위성의 해상도와 궤도 차이로 인한 천지호 면적 측정의 왜곡을 보정해야 한다. 추가적으로, AI 기법을 활용하여 도출된 천지호 수체 영역 중 경계를 수치표고모델과 결합함으로써 수위 모니터링이 가능하다. 이에 따라 본 연구에서 구축된 데이터셋을 AI 기술에 적용하면 시계열 수체 면적과 수위 변화의 모니터링이 가능하다. 이는 화산 활동의 다른 전조 현상과 결합하여, 더욱 포괄적인 화산 모니터링 시스템을 구축하는 데 중요한 기여를 할 것으로 기대된다.

Conflict of Interest

On behalf of all authors, the corresponding author states that there is no conflict of interest.

Funding Information

This work is financially supported by Korea Ministry of Land, Infrastructure and Transport (MOLIT) as 「Innovative Talent Education Program for Smart City」.

This work is financially supported by Korea Meteorological Administration (KMA) as 「Development of earthquake, tsunami, volcano monitoring and prediction technology (KMA2022-02123)」.

Data Availability Statement

Data Availability Statement The data that support the findings of this study are openly available in DataON at http://doi.org/10.22711/idr/1010.

Fig. 1.
Study area of Sentinel-2 RGB images in 2019.09.20.
GD-2023-0055f1.jpg
Fig. 2.
Landsat-7 RGB images in 2006.09.21. (A) Scan Line Corrector (SLC)-off images; (B) gap-filling image.
GD-2023-0055f2.jpg
Fig. 3.
Annotation result for water body segmentation. (A) True color (RGB); (B) false color (SGB); (C) normalized difference water index (NDWI); (D) thermal infrared (TIR); (E) ground truth; (1) LANDSAT-5 (1992.09.22); (2) LANDSAT-5 (1995.09.15); (3) LANDSAT-7 (2008.08.25); (4) LANDSAT-7 (2011.09.03); (5) LANDSAT-8 (2013.10.02); (6) LANDSAT-8 (2017.09.27).
GD-2023-0055f3.jpg
Fig. 4.
Application images for annotation production: Sentinel-2. (A) True color map; (B) log transformed false color map; (C) normalized difference water index (NDWI); (D) shadow histogram stretching map (SHSM); (E) ground truth; (1) 2017.10.30; (2) 2018.08.16; (3) 2019.09.30; (4) 2019.11.04.
GD-2023-0055f4.jpg
Table 1.
Satellite images available for monitoring Mt. Baekdu
Sensor Acquisition date Temporal resolution (days) Spatial resolution (m) Product level Number of images Remark
Landsat-5/-7/-8 1987-2020 16 15-30 Level-1 collection 108 https://earthexplorer.usgs.gov/
Sentinel-2A/-2B 2016-2021 10 10-60 Level-1C 45 https://dataspace.copernicus.eu/
Table 2.
Standard data for generating water body detection label data
Sensor Standard data Formula
Landsat-5/-7/-8 False color map 1 R = SWIR, G = green, B = blue
NDWI Green-NIRGreen+NIR
TIR -
Sentinel-2 NDWI Green-NIRGreen+NIR
Log transformed false color map 2 Infalse color map 2max (false color map 2)
(B = blue, G = green, R = NIR)
Shadow histogram stretching map -

SWIR, short wavelength infraRed; NDWI, normalized difference water index; NIR, near infrared; TIR, thermal infrared.

  • Baek WK, Jung HS (2019) A review of change detection techniques using multi-temporal synthetic aperture radar images. Korean J Remote Sens 35(5_1):737–750
  • Bernstein R, Colby C (1983) Image geometry and rectification. In: Colwell RN (ed) Manual of Remote Sensing, vol 1. American Society of Photogrammetry, Falls Church, pp 873-922
  • Gargiulo M, Dell’Aglio DAG, Iodice A, Riccio D, Ruello G (2020) Integration of Sentinel-1 and Sentinel-2 data for land cover mapping using W-Net. Sensors 20(10):2969ArticlePubMedPMC
  • Jain M, Dimri AP (2017) Efficacy of filtering techniques in improving Landsat SLC-off thermal infrared data. IEEE J Sel Top Appl Earth Obs Remote Sens 11(1):271–284Article
  • James T, Schillaci C, Lipani A (2021) Convolutional neural networks for water segmentation using Sentinel-2 red, green, blue (RGB) composites and derived spectral indices. Int J Remote Sens 42(14):5338–5365Article
  • Kim SW, Choi EK, Jung SJ, et al (2013) A preliminary study for predicting a damage range of pyroclastic flows, lahars, and volcanic flood caused by Mt. Baekdusan eruption. J Korean Earth Sci Soc 34(6):479–491
  • Korea Meteorological Administration (2021) Development of Monitoring Technology through Analysis of Changes in Surface Temperature before and after Volcanic Eruption. Korea Meteorological Administration, Seoul, 150p
  • Lee ER, Baek WK, Jung HS (2023a) Mapping tree species using CNN from bi-seasonal high-resolution drone optic and LiDAR data. Remote Sens 15(8):2140Article
  • Lee ER, Baek HS, Lee JM, Jung HS (2023b) The Cheonji lake GeoAI dataset based in synthetic aperture radar images: TerraSAR-X, Sentinel-1 and ALOS PALSAR-2. GEO DATA 5(4):251–261ArticlePDF
  • Lee ER, Lee HS, Park SC, Jung HS (2022) Observation of ice gradient in Cheonji, Baekdu Mountain using modified U-Net from Landsat -5/-7/-8 images. Korean J Remote Sens 38(6_2):1691–1707
  • Lee ER, Jung HS (2023) A study of development and application of an Inland water body training dataset using Sentinel-1 SAR images in Korea. Korean J Remote Sens 39(6):1371–1388
  • Maxwell S (2004) Filling Landsat ETM+ SLC-off gaps using a segmentation model approach. Photogramm Eng Remote Sens 70(10):1109–1111
  • Meng Z, Shu C, Yang Y, et al (2022) Time series surface deformation of Changbaishan volcano based on sentinel-1B SAR data and its geological significance. Remote Sens 14(5):1213Article
  • Park SH, Lee MJ, Jung HS (2012) Analysis on the snow cover variations at Mt. Kilimanjaro using Landsat satellite images. Korean J Remote Sens 28(4):409–420Article
  • Russakovsky O, Deng J, Su H, et al (2015) Imagenet large scale visual recognition challenge. Int J Comput Vis 115:211–252ArticlePDF
  • Roy DP, Kovalskyy V, Zhang HK, et al (2016) Characterization of Landsat-7 to Landsat-8 reflective wavelength and normalized difference vegetation index continuity. Remote Sens Environ 185:57–70ArticlePubMedPMC
  • Sato T, Wakita H, Notsu K, Igarashi G (1992) Anomalous hot spring water changes: possible precursors of the 1989 volcanic eruption off the east coast of the Izu Peninsula. Geochem J 26(2):73–83Article
  • Shibata T, Akita F (2001) Precursory changes in well water level prior to the March, 2000 eruption of Usu volcano, Japan. Geophys Res Lett 28(9):1799–1802Article
  • Storey J, Scaramuzza P, Schmidt G, Barsi J (2005) Landsat 7 scan line corrector-off gap-filled product development. In: Proceedings of Pecora 16 Global Priorities in Land Remote Sensing, Sioux Falls, 23-27 Oct 2005
  • Wieland M, Martinis S (2020) Large-scale surface water change observed by Sentinel-2 during the 2018 drought in Germany. Int J Remote Sens 41(12):4742–4756Article
  • Xu J, Liu G, Wu J, et al (2012) Recent unrest of Changbaishan volcano, northeast China: a precursor of a future eruption? Geophys Res Lett 39(16):L16305Article
  • Yun HW, Kim JR, Choi YS, Lin SY (2019) Analyses of time series InSAR signatures for land cover classification: case studies over dense forestry areas with L-band SAR images. Sensors 19(12):2830ArticlePubMedPMC
Metadata for Dataset
Sort *Title Subcategory#1 Subcategory#2
Essential Field The Cheonji Lake GeoAI Dataset from Landsat-5/-7/-8 and Sentinel-2
*DOI http://doi.org/10.22711/idr/1010
*Category Geoscientific Information
*Temporal Coverage 1987-2021
*Spatial Coverage Address Mt. Baekdu: N 4647450 m-4653450 m, E 419070 m-425070 m
UTM 52N
*Personnel Name Eu-Ru Lee
Affiliation University of Seoul
E-mail eurulee22@uos.ac.kr
*CC License CC BY-NC
Optional *Project Korea Meteorological Administration (KMA) Development of remote surveillance analysis technology of Mt. Baekdu using optical satellite image
*Instrument Landsat-5/-7/-8, Sentinel-2

Figure & Data

References

    Citations

    Citations to this article as recorded by  

      Figure
      • 0
      • 1
      • 2
      • 3
      Related articles
      The Cheonji Lake GeoAI Dataset based in Optical Satellite Imagery: Landsat-5/-7/-8 and Sentinel-2
      Image Image Image Image
      Fig. 1. Study area of Sentinel-2 RGB images in 2019.09.20.
      Fig. 2. Landsat-7 RGB images in 2006.09.21. (A) Scan Line Corrector (SLC)-off images; (B) gap-filling image.
      Fig. 3. Annotation result for water body segmentation. (A) True color (RGB); (B) false color (SGB); (C) normalized difference water index (NDWI); (D) thermal infrared (TIR); (E) ground truth; (1) LANDSAT-5 (1992.09.22); (2) LANDSAT-5 (1995.09.15); (3) LANDSAT-7 (2008.08.25); (4) LANDSAT-7 (2011.09.03); (5) LANDSAT-8 (2013.10.02); (6) LANDSAT-8 (2017.09.27).
      Fig. 4. Application images for annotation production: Sentinel-2. (A) True color map; (B) log transformed false color map; (C) normalized difference water index (NDWI); (D) shadow histogram stretching map (SHSM); (E) ground truth; (1) 2017.10.30; (2) 2018.08.16; (3) 2019.09.30; (4) 2019.11.04.
      The Cheonji Lake GeoAI Dataset based in Optical Satellite Imagery: Landsat-5/-7/-8 and Sentinel-2
      Sensor Acquisition date Temporal resolution (days) Spatial resolution (m) Product level Number of images Remark
      Landsat-5/-7/-8 1987-2020 16 15-30 Level-1 collection 108 https://earthexplorer.usgs.gov/
      Sentinel-2A/-2B 2016-2021 10 10-60 Level-1C 45 https://dataspace.copernicus.eu/
      Sensor Standard data Formula
      Landsat-5/-7/-8 False color map 1 R = SWIR, G = green, B = blue
      NDWI Green-NIRGreen+NIR
      TIR -
      Sentinel-2 NDWI Green-NIRGreen+NIR
      Log transformed false color map 2 Infalse color map 2max (false color map 2)
      (B = blue, G = green, R = NIR)
      Shadow histogram stretching map -
      Sort *Title Subcategory#1 Subcategory#2
      Essential Field The Cheonji Lake GeoAI Dataset from Landsat-5/-7/-8 and Sentinel-2
      *DOI http://doi.org/10.22711/idr/1010
      *Category Geoscientific Information
      *Temporal Coverage 1987-2021
      *Spatial Coverage Address Mt. Baekdu: N 4647450 m-4653450 m, E 419070 m-425070 m
      UTM 52N
      *Personnel Name Eu-Ru Lee
      Affiliation University of Seoul
      E-mail eurulee22@uos.ac.kr
      *CC License CC BY-NC
      Optional *Project Korea Meteorological Administration (KMA) Development of remote surveillance analysis technology of Mt. Baekdu using optical satellite image
      *Instrument Landsat-5/-7/-8, Sentinel-2
      Table 1. Satellite images available for monitoring Mt. Baekdu

      Table 2. Standard data for generating water body detection label data

      SWIR, short wavelength infraRed; NDWI, normalized difference water index; NIR, near infrared; TIR, thermal infrared.


      GEO DATA : GEO DATA
      TOP