Skip Navigation
Skip to contents

GEO DATA : GEO DATA

OPEN ACCESS
SEARCH
Search

Articles

Page Path
HOME > GEO DATA > Volume 6(4); 2024 > Article
Data Article
담수 녹조 모니터링을 위한 GLORIA 및 Sentinel-2 연계 활용성 평가
남기범1,*orcid, 최성화2orcid, 황의호3orcid, 강기묵1orcid, 김진겸1orcid, 윤동현1orcid
Assessment of the Usability of the Linkage between GLORIA and Sentinel-2 Imagery for the Surveillance of Algal Blooms in Freshwater Ecosystems
Gibeom Nam1,*orcid, Sunghwa Choi2orcid, Euiho Hwang3orcid, Kimook Kang1orcid, JinGyeom Kim1orcid, DongHyeon Yoon1orcid
GEO DATA 2024;6(4):451-462.
DOI: https://doi.org/10.22761/GD.2024.0044
Published online: December 31, 2024

1선임연구원, K-water연구원 수자원위성센터, 대전광역시 유성구 유성대로1689번길 125, 34045, 대한민국

2책임위원, K-water연구원 수자원위성센터, 대전광역시 유성구 유성대로1689번길 125, 34045, 대한민국

3수석연구원, K-water연구원 수자원위성센터, 대전광역시 유성구 유성대로1689번길 125, 34045, 대한민국

1Senior Researcher, K-water Research Institute, 125 Yuseong-daero 1689beon-gil, Yuseong-gu, 34045 Daejeon, South Korea

2Principal Specialist, K-water Research Institute, 125 Yuseong-daero 1689beon-gil, Yuseong-gu, 34045 Daejeon, South Korea

3Head Researcher, K-water Research Institute, 125 Yuseong-daero 1689beon-gil, Yuseong-gu, 34045 Daejeon, South Korea

Corresponding Author Gibeom Nam Tel: +82-42-870-7498 E-mail: gib2om82@gmail.com
• Received: November 4, 2024   • Accepted: December 18, 2024

Copyright © 2024 GeoAI Data Society

This is an Open Access article distributed under the terms of the Creative Commons Attribution Non-Commercial License (http://creativecommons.org/licenses/by-nc/4.0/) which permits unrestricted non-commercial use, distribution, and reproduction in any medium, provided the original work is properly cited.

prev next
  • 219 Views
  • 14 Download
  • Due to the recent anomalous climatic conditions, the mean summer temperature in Korea for the current year reached 25.6°C, marking the highest temperature recorded since 1973. Concurrently, the incidence of large-scale green algal blooms has escalated beyond the typical frequency in the four principal river systems. The Ministry of Environment has instituted a water quality monitoring network aimed at gathering data pertinent to water quality assessment and regulatory measures; however, the reliance on discrete point data imposes constraints on comprehending the spatial distribution and proliferation of green algae. Techniques for remote monitoring of green algae utilizing satellite imagery may serve as an alternative or complementary resource to conventional point-based water quality assessments. In the present study, we devised and critically assessed an algorithm for the remote estimation of freshwater chlorophyll-a concentrations through the analysis of Sentinel-2 satellite data. Given the challenges associated with field data collection, the GLORIA dataset was employed, and three variations of the CatBoost algorithm were developed based on different input variables, with their effectiveness concerning Sentinel-2 satellite data subjected to evaluation. Among the three algorithms, the variant that was trained utilizing variables such as band ratio and spectral shape was contrasted with 76 field measurements of surface chlorophyll-a, demonstrating a commendable accuracy with an R value of 0.79, root mean square error of 10.1 mg/m3 when applied to the GLORIA dataset. The chlorophyll-a quantification algorithm predicated on Sentinel-2 satellite data, which was developed in this study, holds the potential to be utilized effectively for collaborative management and responsive measures regarding green algae by providing objective insights into the prevalence of green algae across extensive areas, temporal trends, and localized hotspots.
기상청이 발표한 2024년 여름철 기후 특성에 따르면 올해 6-8월 전국 평균 기온은 평년보다 1.9℃ 높은 25.6℃로 1973년 이래 가장 높은 역대급 더위를 기록하였다. 특히 7월 하순부터 8월 하순까지는 북태평양 및 티베트 고기압의 영향으로 한반도 전역에 열돔 현상이 발생하였고 폭염과 열대야가 장기간 지속되었다(Korea Meteorological Administration, 2024). 이러한 이상 기후는 단발성 집중 호우와 수온 상승을 야기하였다. 담수역의 수질 관리 측면에서는 조류의 증식에 의해 물이 초록빛으로 변하는 녹조 현상이 예년보다 빈번하게 발생하였다.
환경부에서는 전국 1,953개의 수질 측정 지점을 운영하여 유역의 수질을 주기적으로 모니터링하고 있으나 관리 지점에서 채수된 시료를 분석하여 수질을 측정하기 때문에 수질의 공간적인 분포 현황과 집중 발생 지역에 대한 정보를 파악하기에는 한계가 있다(Yi et al., 2023). 위성영상을 이용한 원격탐사 기법의 도입은 공간적인 수질 분포 현황을 분석할 수 있음에 따라 분석된 자료는 지점 단위의 현장 수질 모니터링에 대한 대안 혹은 보완을 위한 자료로 활용될 수 있다(Liu et al., 2022).
위성 자료를 이용한 담수 클로로필-a (chlorophyll-a) 추정 연구는 최근까지도 활발하게 진행되고 있으며 밴드비나 조류의 흡수계수를 통한 경험적(Viso-Vázquez et al., 2021), 반분석적(Li et al., 2012) 등의 알고리즘에서 머신러닝을 이용한 알고리즘으로 발전하였다(Fang et al., 2024; Santos et al., 2024; Sun et al., 2024). 머신러닝 기술을 통해 개발된 알고리즘은 경험적으로 최적화됨으로써 높은 정확도를 가지는 결과를 산출할 수 있으나 반드시 양질의 자료가 확보되어야 하는 특징이 있다. 원격 탐사에 활용되는 자료는 동일한 시점, 특정 지점에 대한 분광값과 대상체의 정성 혹은 정량값이 매칭된 형태로 구축되어야 하고 그중에서도 수질 자료는 물의 특성상 짧은 시간에도 구성 물질의 비율이 변하기 때문에 다량의 질적인 자료를 구축하기 어려운 실정이다.
본 연구에서는 자료 확보의 한계점을 보완하기 위한 대안으로 수십 년간 전 세계 450개 수체에서 생산된 global reflectance community dataset for imaging and optical sensing of aquatic environments (GLORIA) 자료를 이용하여 Sentinel-2 위성에 적합한 클로로필-a 정량 추정 알고리즘 개발하고 적용성을 평가하고자 하였다. 먼저 초분광 반사율과 클로로필-a 농도 값으로 구성된 GLORIA 데이터셋을 Sentinel-2 밴드에 맞게 가공한 후 입력 변수에 따라 3가지 CatBoost 알고리즘을 개발하고 평가하였다. 이후 Sentinel-2 위성에 적용 가능성을 평가하기 위하여 위성 자료의 수체 영역에 알고리즘을 적용하여 면 단위의 클로로필-a 농도 자료를 생성하고 Sentinel-2 위성 촬영 시점에 실제 현장에서 채수된 시료의 클로로필-a 농도 값과 비교하여 성능을 검증하였다. 최종적으로 검증된 클로로필-a 추정 알고리즘을 선정하고 위성을 활용한 녹조 광역 모니터링 체계를 확보하여 과학적인 유역 수질 관리에 활용하고자 하였다.
2.1 연구 대상 지역
전북 임실군 우암면에 위치한 옥정호는 호남 곡창지대에 부족한 농업용수의 수요를 보완하기 위하여 운암저수지를 조성한 것이 그 기원이 되었다(Moon and Kim, 2019). 옥정호는 섬진강댐을 건설하며 유역 면적 763 km2, 만수위 시 저수 면적 26.5 km2, 저수량 4억 3천 t인 거대한 인공 호수가 되었으며, 이는 섬진강 유역 면적의 약 15.6%에 해당한다. 1965년에 준공된 섬진강댐은 댐 높이 64 m, 제방 길이 344.2 m 규모의 우리나라 최초 다목적 댐이다. 댐 건설 효과로 유역 변경된 물을 이용하는 칠보수력발전소의 최대 발전량이 2만 8,800 kW가 되었고 홍수 조절량은 3,200만 t이며 용수 공급량 연 3억 5000만 t이다.
2.2 현장 수질 자료
본 연구에서는 GLORIA 데이터셋으로 개발된 녹조 정량 추정 알고리즘의 성능을 평가하기 위하여 옥정호 내 붕어섬을 중심으로 Sentinel-2 위성 촬영 시점에 맞추어 현장 수질 자료를 수집하였다. 대상 수질 항목은 클로로필-a이며 분석을 위한 현장시료 채수는 수체 횡방향으로 좌, 중, 우 3개(2구역 좌우 2개)씩 9개 구역, 총 26개 지점의 표층을 대상으로 하였다(Fig. 1). 시료 채수 시 위성 자료와 비교 지점을 일치시키기 위하여 각 지점마다 GPS 장비를 이용하여 경위도 위치값을 측정하였다. 현장 조사는 8-9월 중 Sentinel-2 위성 촬영일을 최대한 고려하여 진행되었고 기상의 영향을 받지 않은 날 중 총 3회(2024년 8월 14일, 8월 19일, 9월 23일)의 자료를 확보하였다.
현장시료는 수표면을 기준으로 30 cm 이내 표층수를 채수, 무균채수병에 저장하며 환경부 수질오염 공정시험기준에 따라 4℃ 이하의 암소 환경에서 실험실로 운송되었다. 클로로필-a 농도는 수질오염 공정시험기준에 따라 아세톤 용액을 이용하여 시료를 여과한 여과지로부터 색소를 분리해 내고 분리액의 흡광도를 663, 645, 630, 750 nm에서 측정하여 Eq. 1을 통해 계산되었다.
Eq. 1
Chlamgm3=11.64X12.16X2+0.01X3×V1V2
X1=OD663–OD750; X2=OD645–OD750; X3=OD630–OD750; V1=상층액의 시료량(mL); ODλ=λ 파장에서의 흡광도.
2.3 GLORIA
GLORIA는 수질 원격 탐사 기술의 향상을 목표로 하는 데이터셋으로, 전 세계 59개 기관에서 450개 수역에 대해 총 7,572개의 수집 데이터를 포함하고 있다(Lehmann et al., 2023). 데이터셋은 350-900 nm 파장 범위에서 1 nm 간격의 초분광 원격 감지 반사율 측정값과 클로로필-a, 총 부유물질(suspended solids) 농도, 유색용존물질(colored dissolved organic matter)에 의한 흡수율 등 하나 이상의 수질 지표와 연계되어 있다. 또한 데이터셋에는 초분광 반사율 및 수질 측정값의 측정 시기, 방법, 환경 등의 메타 정보도 포함되어 있어 연구자들에게 유용한 정보를 제공한다.
수집된 GLORIA 데이터셋의 초분광 반사율 값을 Sentinel-2 다분광 밴드와 일치시키기 위해 spectral response function을 적용하였고(Eq. 2) Sentinel-2의 가시광선에서 근적외선 영역인 2-8번 밴드에 해당하는 반사율 값으로 변환하였다. 그 뒤 분광 및 클로로필-a 농도 값이 결측되었거나 농도 값 중 현실적으로 발생 빈도가 낮은 500 mg/m3 이상의 자료를 제외한 나머지 자료를 알고리즘 개발에 활용하였다.
Eq. 2
Ri=j=1nRjSRFjj=1mSRFj
2.4 CatBoost
본 논문에서는 다양한 기계학습 기법 중 CatBoost를 활용하여 클로로필-a의 정량 추정을 위한 알고리즘을 개발하였다. CatBoost는 Yandex (Moscow, Russia)에서 개발한 gradient boosting 알고리즘으로 범주형 및 연속형 데이터 모두에 유연하게 적용될 수 있다. CatBoost는 빠른 학습 속도와 우수한 일반화 성능을 제공하며 과적합을 방지하기 위해 독자적인 ordered boosting 기법을 사용한다. 또한 hyperparameter 튜닝이 상대적으로 용이하여 모델 최적화 과정이 단순하다는 장점도 있다(Prokhorenkova et al., 2018).
CatBoost 기반의 클로로필-a 정량 추정 알고리즘은 입력 변수에 따른 영향을 고려하기 위하여 Table 1과 같이 3가지로 구분하여 개발되었다. 입력 변수의 구분은 GLORIA 데이터셋의 활용 가능성을 확인하기 위한 것이며 최적 밴드 선정에 대한 내용은 본 연구에서 다루지 않았다. Alg.1은 밴드별 반사율 값을 입력 자료로 사용하고, Alg.2는 밴드와 조합 가능한 밴드비를 모두 입력 자료로 하여 구성된 알고리즘이며, Alg.3은 GLORIA와 Sentinel-2 분광 자료 간의 편차 특성을 고려하기 위해 밴드비와 spectral shape 변수를 입력 자료로 사용한 알고리즘이다.
Alg.3에서 입력 변수로 사용된 B5/B4는 클로로필-a 흡수 특성과 관련된 파장대역을 가진 밴드로 다양한 연구에서 활용된 바 있으며(Barraza-Moraga et al., 2022; Grendaitė et al., 2018; Moses et al., 2009) (B3+B5)/2-B4 변수는 클로로필-a 흡수 정도를 직접적으로 고려하기 위하여(Zhang et al., 2014) 사용된 입력 변수이다. CatBoost 알고리즘 학습을 위해 GLORIA 데이터셋의 20%를 테스트(test) 데이터로 구분하였으며 훈련에 사용되는 80% 중 10%는 검증(validation) 데이터로, 나머지는 학습(training) 데이터로 활용되었다. 훈련 데이터와 테스트 데이터는 철저히 분리되었으며 알고리즘은 학습 및 검증 데이터를 통해 개발된 후 테스트 데이터를 사용하여 성능이 평가되었다.
2.5 Sentinel-2 위성 자료
Sentinel-2는 유럽우주국(European Space Agency, ESA) Copernicus 프로그램의 일환으로 개발된 고해상도 다중 스펙트럼 위성으로 2015년에 발사된 2A 및 2017년에 발사된 2B 두 대의 위성으로 구성되어 있다. Sentinel-2는 두대의 위성 운영 시 약 5일 간격으로 동일 지역을 촬영하여 비교적 짧은 시간 내에 연속적인 시간 시계열 데이터를 확보할 수 있다. 이러한 특징은 수질 및 작물 관리와 재난 감시 등의 분야에서 주기적인 변화를 모니터링하는 데 효과적으로 활용할 수 있다(Table 2).
Sentinel-2 MSI는 혁신적인 고해상도 다중 스펙트럼 센서로 가시광선(visible), 근적외선(near infrared, NIR), 단파장 적외선(short-wave infrared, SWIR)을 포함한 13개의 대역을 감지할 수 있다. 센싱 가능한 파장대역 중 red-edge 밴드(밴드 5, 6, 7)는 광합성 활성과 식물 생리 상태를 정밀하게 감지할 수 있어 담수역의 클로로필-a 농도 변화를 추적하는 데 효과적으로 사용되고 있다.
본 연구에서는 8-9월 사이 구름 등으로 결측되지 않은 4개 날짜(8월 14일, 8월 19일, 9월 8일, 9월 23일)에 대해 bottom of atmosphere (BOA)를 제공하는 Sentinel-2 Level 2A 자료를 확보하였다. 녹조를 포함한 수체 영역을 추출하기 위하여 normalized difference snow index (NDSI)와 11번 밴드의 임계치를 분석하여 해당되는 영역을 밴드별로 적용하여 가공하였다. 추출된 영역은 GLORIA 데이터셋 기반의 클로로필-a 정량 추정 알고리즘에 적용되었으며 결과는 현장에서 수집된 표층 클로로필-a 농도 자료와 비교하여 성능을 평가하였다.
3.1 현장 자료 분석 결과
2024년 8-9월 기간 동안 옥정호에서 채수된 78개 시료에 대한 클로로필-a 농도 분석 결과는 Table 3과 같다. 8월 14일과 19일에 획득된 클로로필-a 자료의 농도 범위는 29.2- 89.6 mg/m3로 상대적으로 농도 값이 높은 자료가 확보되었으며 9월 23일에 수집된 자료는 다른 두 날짜에 비해 전반적으로 낮은 농도 범위(11.0-31.2 mg/m³)를 보였다. 수집된 전체 자료는 고른 분포대의 값을 검증할 수 있을 것으로 판단되었다.
3.2 GLORIA 데이터셋 처리 결과
앞선 전처리를 통해 확보된 GLORIA 데이터셋은 총 895개로 각 밴드와 클로로필에 대한 통계치는 Table 4와 같다. 클로로필-a 농도값은 전반적으로 낮은 쪽에 다수 분포되어 있는 것으로 확인되었다. 각 밴드별 반사율은 최저값에서 일부 음수값을 가지는 자료가 포함되어 있으나 클로로필-a 분석에 큰 영향을 주는 밴드가 아니라 판단하고 최대한 많은 자료를 알고리즘 개발에 적용하기 위하여 활용하였다.
3.3 Catboost 알고리즘 평가
입력 변수의 종류에 따라 결정된 3가지 알고리즘에 대해 최적화를 수행하고 최종 개발된 결과는 Table 5Fig. 2와 같다. Alg.1과 Alg.2는 학습 데이터의 R2 값이 0.99로 매우 높게 나타났고 root mean square error (RMSE) 값은 Alg.2가 Alg.1에 비해 조금 높으나 테스트 데이터에서는 Alg.2가 Alg.1에 비해 성능이 더 좋은 것으로 확인되었다. Alg.3는 학습과 테스트 데이터에서 성능이 좋은 것으로 판단되나 다른 두 알고리즘에 비해 R2, RMSE 수치가 조금 낮은 것으로 분석되었다.
Fig. 2에서 3개 알고리즘 모두 1:1 경향을 잘 따르고 있는 것으로 판단되었고 특히 Alg.2는 테스트 데이터에서도 낮은 농도의 값을 잘 모의하는 것으로 확인되었다. Alg.3은 다른 두 알고리즘에 비해 농도가 높아질수록 참값과의 오차가 증가하는 것으로 나타났다.
3.4 Sentinel-2 위성 자료 적용성 평가
본 연구에서 개발된 3개 알고리즘은 현장 관측과 위성 촬영일이 일치하는 3개 날짜의 Sentinel-2 위성 자료에 적용하였고 정성 평가와 정량 평가로 나누어 결과를 평가하였다. 정성 평가는 녹조의 발생 패턴이 명확하고 편차가 큰 날짜로 확인되는 9월 8일 자료를 사용하였으며 녹조 현상이 발생한 상류 지역의 컬러 영상과 알고리즘에 따른 클로로필-a 농도 추정 결과는 Fig. 3과 같다.
9월 8일 컬러 영상에서는 상류(우상단)에서 녹조가 상대적으로 더 심한 것으로 확인되고 3개 알고리즘 모두 해당 지역에서 클로로필-a 농도가 높은 것으로 추정되었다. 다만 Alg.1은 녹조 현상이 상당히 심한 부분이 오히려 농도가 주변보다 낮은 것으로 확인되었다. Alg.2와 Alg.3은 육안으로 확인되는 녹조의 심화 정도를 잘 반영하는 것으로 판단되나 클로로필-a 농도 값의 편차가 존재하는 것으로 확인되었다. 추가적으로 모든 알고리즘에서 구름에 의한 그림자가 발생한 영역은 주변 지역 보다 클로로필-a 농도가 눈에 띄게 낮은 것으로 나타났다. 따라서 해당 영역에 대한 정확한 정보를 제공하기 위한 추가 처리가 필요한 것으로 판단되었다.
정량 평가는 붕어섬 인근 26개 지점에서 관측된 현장 자료를 이용하여 수행되었다. 3개의 알고리즘은 8월 14일, 8월 19일, 9월 23일 총 78개 지점 중 8월 19일 구름으로 결측된 2개 지점(7-2, 7-3)을 제외한 총 76개 지점에 대해 평가되었고 그 결과는 Table 6Fig. 4와 같다.
3개 알고리즘 중 Alg.3은 R2 0.79, RMSE 10.1 mg/m3, mean absolute error (MAE) 6.6 mg/m3로 3개의 지표를 통해 가장 정확도가 높은 것으로 분석되었다. Alg.1과 Alg.2는 Alg.3에 비해 오차가 약 5배 이상 큰 것으로 확인되고 모든 값에서 과대 추정하는 것으로 나타났다.
알고리즘 개발 단계에서의 정확도와 Sentinel-2 자료 적용 단계에서 정확도에서 차이가 나는 원인은 분광 자료가 생성된 도메인 특성의 차이에 의한 것으로 판단된다. GLORIA 데이터셋의 수체 초분광 자료를 획득하기 위한 센서와 Sentinel-2 MSI의 감도 특성차가 가장 큰 영향을 주었을 것이고 이를 통해 특정 도메인에서 정확도가 높은 모델을 개발하더라도 타 도메인 적용 시에는 도메인 간의 이해와 적절한 처리가 필요한 것으로 판단된다. Alg.2와 Alg.3은 밴드비를 기본으로 하는 입력 변수로 학습된 알고리즘으로써 도메인 차이에 의한 영향을 일부 완화하여 정성적인 녹조 현상 발생 경향에서는 실제 상황을 잘 반영한 것으로 확인된다. 다만 다른 도메인에서 생성된 자료를 연계하여 활용할 때 Alg.2와 같이 알고리즘 개발 시 사용할 수 있는 모든 입력 변수를 적용하는 것은 오히려 해당 도메인에만 적합한 알고리즘이 될 가능성이 큰 것으로 확인된다.
다음 Table 7Table 8은 Alg.3을 Sentinel-2 위성영상에 적용하여 3개 날짜에 대한 클로로필-a 농도 지도를 생성한 결과이다.
8월 14일과 19일에 옥정호 상류 붕어섬 일원에서 클로로필-a 농도가 높은 녹조 현상이 관찰되었고 하류로 갈수록 녹조 현상이 완화되는 것으로 확인된다. 9월 23일에는 물빛이 황토색에 가까운 것으로 보아 토사가 다량 유입된 것으로 판단되고 상대적으로 다른 날짜에 비해 클로로필-a 농도는 낮은 것으로 나타났다. 본 연구를 통해 개발된 클로로필-a 원격 정량 추정 알고리즘과 Sentinel-2 위성 자료를 이용함으로써 유역 내 녹조 발생 현황을 면 단위로 감시하고 대응을 위한 의사결정에 활용될 수 있음을 확인하였다.
본 연구에서는 우리나라 현장의 분광-수체 데이터셋의 한계로 글로벌 데이터셋(GLORIA)을 이용하여 Sentinel-2 기반의 국내 담수역의 녹조 면 단위 모니터링을 위한 알고리즘을 개발하고 적용성을 평가하였다. 1 nm 간격의 초분광 값과 클로로필-a 농도 값으로 구성된 GLORIA 데이터셋을 Sentinel-2 위성의 밴드에 적합하게 가공하여 머신러닝 알고리즘 개발을 위한 학습 데이터를 구축하였다. 밴드의 반사율 값과 밴드비, spectral shape 등 입력 변수의 구성에 따라 3가지 CatBoost 알고리즘을 개발하고 평가한 결과 모든 알고리즘에서 0.85 이상의 높은 수치의 R2을 가지는 결과를 도출하였다. 개발된 3가지 알고리즘은 실제 8월 14일, 8월 19일, 9월 8일, 9월 23일에 촬영된 Sentinel-2에 적용하여 정성 및 정량 평가를 수행하였다. 밴드별 반사율 값만으로 입력 변수를 구성한 Alg.1은 농도가 높을 것으로 보이는 지역을 오히려 주변보다 낮은 농도로 추정하였고, Alg.2는 가시적으로 보이는 녹조 패턴은 잘 재현하였으나 정량적인 수치에서 과대 추정하는 것으로 분석되었다. Alg.3은 클로로필-a와 관련된 파장의 밴드비와 spectral shape 형태의 2개 입력 변수로 학습된 알고리즘으로 GLORIA 데이터셋의 평가에서 다른 두 알고리즘 보다 정확도가 낮은 것으로 나타났으나 Sentinel-2 위성 자료 적용과 현장 실측 데이터 비교 평가에서는 R2=0.79, RMSE 10.1 mg/m3, MAE 6.6 mg/m3로 가장 성능이 좋은 것으로 나타났다. 이러한 결과는 데이터가 수집된 도메인 사이의 특성차에서 기인한 것으로 판단된다. 따라서 다른 도메인에서 구축된 데이터셋을 이용하기 위해서는 도메인 간의 관계를 명확히 하고 전환에 필요한 가공이나 도메인 간의 차이를 최소화할 수 있는 알고리즘 개발 등을 고려해야 할 것으로 판단된다.
본 연구를 통해 개발된 Sentinel-2 위성 기반의 클로로필-a 정량 추정 알고리즘은 광역의 면 단위 녹조 발생 상황과 시계열적 확산, 우심 지역에 대한 객관적인 정보를 제공함으로써 관련 유역의 부처 간 녹조 공동 관리와 대응에 적극 활용할 수 있을 것으로 기대된다.
Acknowledgements
The author would like to thank the staff at River Basin Management Department, Yeongsan & Seomjin Rivers Basin Head Office, Korea Water Resources Corporation(K-Water), for providing the surface chlorophyll-a data of Okjung Lake.

Conflict of Interest

Euiho Hwang and Kimook Kang have been an Editorial Board of GEO DATA; however, they were not involved in the peer reviewer selection, evaluation, or decision process of this article. Otherwise, no other potential conflicts of interest relevant to this article were reported.

Funding Information

This research was supported by Ministry of Environment, under the Development of Ground Operation System for Water Resources Satellite.

Data Availability Statement

The data that support the findings of this study are available on request from the corresponding author. The data are not publicly available due to privacy or ethical restrictions.

Fig. 1.
Study area (Lake Okjung) and sampling sites.
GD-2024-0044f1.jpg
Fig. 2.
The results of three CatBoost algorithms. Left, Alg.1. Middle, Alg.2. Right, Alg.3.
GD-2024-0044f2.jpg
Fig. 3.
The results of applying the CatBoost algorithms to Sentinel-2 satellite data.
GD-2024-0044f3.jpg
Fig. 4.
The comparison results of estimated value by algorithms and measured value by field survey.
GD-2024-0044f4.jpg
Table 1.
Input variables by algorithms
Algorithm Input variables Number
Alg.1 B2, B3, B4, B5, B6, B7, B8 7
Alg.2 B2, …, B8, B3/B2, …, B8/B2, B2/B3, …, B8/B3, B2/B4, …, B8/B4, B2/B5, …, B8/B5, B2/B6, …, B8/B6, B2/B7, …, B8/B7, B2/B8, …, B7/B8 49
Alg.3 B5/B4, (B3+B5)/2-B4 2
Table 2.
Sentinel-2 satellite specifications
Sentinel-2 Specification
Sensor Multi-Spectral Imager (MSI)
Operator European Space Agency
Operation time S2A since 2015
S2B since 2017
Resolution
 Spatial (m) 10, 20, 60
 Temporal (days) 10 (per satellite)
 Spectral (bands) 13
 Radiometric (bits) 12
Field of view (km) 290
Table 3.
Summary statistics of measured chlorophyll-a concentration
2024 Aug 14 2024 Aug 19 2024 Sep 23
Number 26 26 26
Mean 41.6 47.6 19.5
Maximum 84.0 89.6 31.2
Minimum 29.2 30.9 11.0
Table 4.
Summary statistics of the transformed GLORIA dataset (n=895)
GLORIA B2 B3 B4 B5 B6 B7 B8 Chl-a
Mean 0.0989 0.1585 0.0991 0.1041 0.0442 0.0436 0.0360 28.9
Maximum 0.4050 0.5709 0.4990 0.5316 0.3970 0.4221 0.3977 449.0
Minimum 0.0027 0.0099 0.0026 0.0013 0.0001 -0.0051 -0.0118 0.1
Median 0.0820 0.1358 0.0653 0.0637 0.0210 0.0194 0.0162 10.2

GLORIA, global reflectance community dataset for imaging and optical sensing of aquatic environments.

Table 5.
Hyper-parameter and statistics result of developed CatBoost algorithms
Item Parameter Alg.1 Alg.2 Alg.3
Training data Iteration 6,900 3,000 3,500
Learning rate 0.01 0.01 0.01
Depth 4 4 4
R2 0.99 0.99 0.96
RMSE 4.6 5.2 10.1
Test data R2 0.88 0.93 0.85
RMSE 12.9 10.3 18.1

RMSE, root mean square error.

Table 6.
Summary statistics of measured chlorophyll-a concentration
Number R2 RMSE (mg/m3) MAE (mg/m3)
Alg.1 76 0.14 82.7 78.9
Alg.2 76 0.71 49.0 41.7
Alg.2 76 0.79 10.1 6.6

RMSE, root mean square error; MAE, mean absolute error.

Table 7.
Maps of chlorophyll-a concentration distribution in the Lake Okjung for three dates
GD-2024-0044i1.jpg
Table 8.
Maps of chlorophyll-a concentration distribution near Boungeo Island in Okjeong Lake
GD-2024-0044i2.jpg
  • Barraza-Moraga F, Alcayaga H, Pizarro A, Félez-Bernal J, Urrutia R (2022) Estimation of chlorophyll-a concentrations in Lanalhue Lake using Sentinel-2 MSI satellite images. Remote Sens 14(22):5647Article
  • Fang C, Song C, Wen Z, et al (2024) A novel chlorophyll-a retrieval model based on suspended particulate matter classification and different machine learning. Environ Res 240:117430ArticlePubMed
  • Grendaitė D, Stonevičius E, Karosienė J, Savadova K, Kasperovičienė J (2018) Chlorophyll-a concentration retrieval in eutrophic lakes in Lithuania from Sentinel-2 data. Geol Geogr 4(1):15–28
  • Korea Meteorological Administration (2024) Summer 2024 climate characteristics. Korea Meteorological Administration. https://www.kma.go.kr/kma/news/press.jsp?mode=view&num=1194405 Accessed 20 Oct 2024
  • Lehmann MK, Gurlin D, Pahlevan N, et al (2023) GLORIA-A globally representative hyperspectral in situ dataset for optical sensing of water quality. Sci Data 10(1):100PubMedPMC
  • Li L, Li L, Shi K, Li Z, Song K (2012) A semi-analytical algorithm for remote estimation of phycocyanin in inland waters. Sci Total Environ 435:141–150ArticlePubMed
  • Liu M, Ling H, Wu D, Su X, Cao Z (2021) Sentinel-2 and Landsat-8 observations for harmful algae blooms in a small eutrophic lake. Remote Sens 13(21):4479Article
  • Moon YE, Kim HS (2019) Spatiotemporal distribution of algae and characteristics of algal abundance in Lake Okjung, Korea. J Korean Soc Environ Eng 41(10):554–571Article
  • Moses WJ, Gitelson AA, Berdnikov S, Povazhnyy V (2009) Estimation of chlorophyll-a concentration in case II waters using MODIS and MERIS data - successes and challenges. ERL 4(4):045005Article
  • Prokhorenkova L, Gusev G, Vorobev A, Dorogush AV, Gulin A (2018) CatBoost: unbiased boosting with categorical features. In: 32nd Conference on Neural Information Processing Systems (NeurIPS 2018), Montréal, 2-8 Dec 2018
  • Santos VO, Guimarães BMDM, Neto IEL, et al (2024) Chlorophyll-a estimation in 149 tropical semi-arid reservoirs using remote sensing data and six machine learning methods. Remote Sen 16(11):1870Article
  • Sun Y, Wang D, Li L, Ning R, Yu S, Gao N (2024) Application of remote sensing technology in water quality monitoring: from traditional approaches to artificial intelligence. Water Res 267:122546ArticlePubMed
  • Viso-Vázquez M, Acuña-Alonso C, Rodríguez JL, Álvarez X (2021) Remote detection of cyanobacterial blooms and chlorophyll-a analysis in a eutrophic reservoir using Sentinel-2. Sustainability 13(15):8570Article
  • Yi HS, Choi S, Kim DK, Kim H (2023) Improvement of algal bloom identification using satellite images by the algal spatial monitoring and machine learning analysis in a new dam reservoir. GEO DATA 5(3):126–136ArticlePDF
  • Zhang F, Zhang B, Li J, et al (2014) Validation of a synthetic chlorophyll index for remote estimates of chlorophyll-a in a turbid hypereutrophic lake. Int J Remote Sens 35(1):289–305Article
Meta Data for Dataset
Essential
Field Sub-Category
Title of Dataset GLORIA
DOI https://doi.org/10.1594/PANGAEA.948492
Category Environment
Temporal Coverage 2024.8.14., 2024.8.19., 2024.9.8., 2024.9.23.
Spatial Coverage Address The global 450 water bodies (included in the dataset)
WGS84 Coordinates Included in the dataset per point
Personnel Name Gibeom Nam
Affiliation K-water
E-mail gbnam@kwater.or.kr
CC License CC BY-NC
Optional
Field Sub-Category
Summary of Dataset GLObal Reflectance community dataset for Imaging and optical sensing of Aquatic environments
Project The Development of Ground Operation System for Water Resources Satellite
Instrument Sentinel-2 (ESA)

Figure & Data

References

    Citations

    Citations to this article as recorded by  

      Figure
      • 0
      • 1
      • 2
      • 3
      Assessment of the Usability of the Linkage between GLORIA and Sentinel-2 Imagery for the Surveillance of Algal Blooms in Freshwater Ecosystems
      Image Image Image Image
      Fig. 1. Study area (Lake Okjung) and sampling sites.
      Fig. 2. The results of three CatBoost algorithms. Left, Alg.1. Middle, Alg.2. Right, Alg.3.
      Fig. 3. The results of applying the CatBoost algorithms to Sentinel-2 satellite data.
      Fig. 4. The comparison results of estimated value by algorithms and measured value by field survey.
      Assessment of the Usability of the Linkage between GLORIA and Sentinel-2 Imagery for the Surveillance of Algal Blooms in Freshwater Ecosystems
      Algorithm Input variables Number
      Alg.1 B2, B3, B4, B5, B6, B7, B8 7
      Alg.2 B2, …, B8, B3/B2, …, B8/B2, B2/B3, …, B8/B3, B2/B4, …, B8/B4, B2/B5, …, B8/B5, B2/B6, …, B8/B6, B2/B7, …, B8/B7, B2/B8, …, B7/B8 49
      Alg.3 B5/B4, (B3+B5)/2-B4 2
      Sentinel-2 Specification
      Sensor Multi-Spectral Imager (MSI)
      Operator European Space Agency
      Operation time S2A since 2015
      S2B since 2017
      Resolution
       Spatial (m) 10, 20, 60
       Temporal (days) 10 (per satellite)
       Spectral (bands) 13
       Radiometric (bits) 12
      Field of view (km) 290
      2024 Aug 14 2024 Aug 19 2024 Sep 23
      Number 26 26 26
      Mean 41.6 47.6 19.5
      Maximum 84.0 89.6 31.2
      Minimum 29.2 30.9 11.0
      GLORIA B2 B3 B4 B5 B6 B7 B8 Chl-a
      Mean 0.0989 0.1585 0.0991 0.1041 0.0442 0.0436 0.0360 28.9
      Maximum 0.4050 0.5709 0.4990 0.5316 0.3970 0.4221 0.3977 449.0
      Minimum 0.0027 0.0099 0.0026 0.0013 0.0001 -0.0051 -0.0118 0.1
      Median 0.0820 0.1358 0.0653 0.0637 0.0210 0.0194 0.0162 10.2
      Item Parameter Alg.1 Alg.2 Alg.3
      Training data Iteration 6,900 3,000 3,500
      Learning rate 0.01 0.01 0.01
      Depth 4 4 4
      R2 0.99 0.99 0.96
      RMSE 4.6 5.2 10.1
      Test data R2 0.88 0.93 0.85
      RMSE 12.9 10.3 18.1
      Number R2 RMSE (mg/m3) MAE (mg/m3)
      Alg.1 76 0.14 82.7 78.9
      Alg.2 76 0.71 49.0 41.7
      Alg.2 76 0.79 10.1 6.6
      Essential
      Field Sub-Category
      Title of Dataset GLORIA
      DOI https://doi.org/10.1594/PANGAEA.948492
      Category Environment
      Temporal Coverage 2024.8.14., 2024.8.19., 2024.9.8., 2024.9.23.
      Spatial Coverage Address The global 450 water bodies (included in the dataset)
      WGS84 Coordinates Included in the dataset per point
      Personnel Name Gibeom Nam
      Affiliation K-water
      E-mail gbnam@kwater.or.kr
      CC License CC BY-NC
      Optional
      Field Sub-Category
      Summary of Dataset GLObal Reflectance community dataset for Imaging and optical sensing of Aquatic environments
      Project The Development of Ground Operation System for Water Resources Satellite
      Instrument Sentinel-2 (ESA)
      Table 1. Input variables by algorithms

      Table 2. Sentinel-2 satellite specifications

      Table 3. Summary statistics of measured chlorophyll-a concentration

      Table 4. Summary statistics of the transformed GLORIA dataset (n=895)

      GLORIA, global reflectance community dataset for imaging and optical sensing of aquatic environments.

      Table 5. Hyper-parameter and statistics result of developed CatBoost algorithms

      RMSE, root mean square error.

      Table 6. Summary statistics of measured chlorophyll-a concentration

      RMSE, root mean square error; MAE, mean absolute error.

      Table 7. Maps of chlorophyll-a concentration distribution in the Lake Okjung for three dates

      Table 8. Maps of chlorophyll-a concentration distribution near Boungeo Island in Okjeong Lake


      GEO DATA : GEO DATA
      TOP