Skip Navigation
Skip to contents

GEO DATA : GEO DATA

OPEN ACCESS
SEARCH
Search

Articles

Page Path
HOME > GEO DATA > Volume 3(4); 2021 > Article
Article
Oceanography
결측치 추정기법을 이용한 동해 남서부 해역의 위성 기반 엽록소-a 농도 자료 재구축
박진구, 이성재, 김현철*
Reconstruction of Satellite Chlorophyll-a Concentration in the Southwestern East Sea using Imputation Method
Jinku Park, Sungjae Lee, Hyun-Cheol Kim*
GEO DATA 2021;3(4):11-17.
DOI: https://doi.org/10.22761/DJ2021.3.4.002
Published online: December 31, 2021

극지연구소 원격탐사빙권정보센터, 인천 21990, 대한민국

Center of Remote Sensing and GIS, Korea Polar Research Institute, Incheon 21990, Republic of Korea

*Corresponding author: kimhc@kopri.re.kr
• Received: October 22, 2021   • Revised: December 17, 2021   • Accepted: December 20, 2021

Copyright © 2021 GeoAI Data Society

This is an Open Access article distributed under the terms of the Creative Commons Attribution Non-Commercial License (http://creativecommons.org/licenses/by-nc/3.0/) which permits unrestricted non-commercial use, distribution, and reproduction in any medium, provided the original work is properly cited.

  • 237 Views
  • 9 Download
  • 해색 센서로 관측된 엽록소-a 농도 자료는 광역적이고 장기적인 식물 플랑크톤의 변화와 같은 다양한 연구에 폭 넓게 사용되어 왔다. 그러나 광학 관측의 고유한 특성인 구름에 의해 발생하는 불규칙적인 결측 발생은 시공간적인 해석에 있어 큰 불확실성을 지니고 있으며, 현재까지도 이러한 결측 문제에 대한 해결이 지속적으로 요구되어 왔다. 본 연구는 해색 기반 엽록소-a 농도자료에 포함된 결측 영역의 값을 추정하기 위하여 폭넓게 사용되어온 Data Interpolating Empirical Orthogonal Function 방식의 동해 남서부해역에 대한 적용 가능성을 타진하고 결측 복원 결과에 대한 평가를 수행하였다. 결측 복원 결과는 실제값과 비교하여 결정계수 0.86, 평균제곱근오차 0.37 mg m−3의 정확성을 보였다. 시공간적으로 평균된 관측 기반 엽록소-a 농도는 추정된 엽록소-a 농도에 비하여 전반적으로 과대 평가되는 것을 확인하였다.
  • The chlorophyll-a concentration (CHL) data observed with the ocean color sensors have been widely used in the various studies related to phytoplankton. However, irregularly distributed missing data induced by clouds, a unique nature of optics, can cause large uncertainty, and a solution to this missing issue has been continuously demanded until now. We investigated the applicability of the data interpolating empirical orthogonal function and evaluated the reconstruction results in the southwestern East Sea. A total of 311 decomposed modes were used, showing a coefficient of determination of about 0.86 and a root mean square error of 0.37 mg m−3, compared to the truth data. Overall, it was confirmed that the observed CHL was overestimated compared to the reconstructed CHL when the spatio-temporal average was taken.
1970년 이래로 시작된 해색(ocean color) 관측은 해양 생지화학 및 기후 연구에 폭넓게 사용되어 왔다. 특히 해색 센서로 추정 가능한 엽록소-a 농도(chlorophyll-a concentration, 이하 CHL) 자료는 유광층 내의 식물플랑크톤 생체량을 대변하며 식물플랑크톤의 성장, 일차 생산성, 그리고 나아가 전 지구적인 탄소 순환과 연관하여 가장 중요한 산출물 중의 하나이다. 해양을 관측하는 다른 위성들에 비하여 상대적으로 높은 공간 해상도(수백 m 이상)를 지니고 있고 초기 해색 센서인 Coastal Zone Color Scanner (CZCS)를 제외하고 1997년 Sea-viewing Wide Field-of-view Sensor (SeaWiFS)를 시작으로, Moderate Resolution Imaging Spectroradiometer (MODIS), Medium Resolution Imaging Spectrometer (MERIS) 등 다양한 후속 센서들에 의하여 연속적인 관측이 수행되어 장기간의 연구를 가능하게 하였다. 그럼에도 불구하고 해색 관측의 가장 큰 단점 중의 하나는 구름이 존재하는 지역에서 관측이 불가능하다는 것이며, 이는 특히나 구름의 발생 빈도가 높은 지역에서 자료의 가용성을 제한한다. 시공간적으로 불균질한 결측의 발생은 자료의 불확실성을 크게 하고 시공간적으로 연속적인 분석에 어려움을 발생시킬 수 있으므로 지속적으로 결측 복원의 필요성이 요구되어 왔다 (Cole et al., 2012).
조사 해역인 우리나라 동해 남서부 지역은 남쪽에서 유입되는 대마 난류와 북쪽에서 유입되는 북한 한류가 만나는 지역이며, 남서 연안 해역의 용승과 중규모 소용돌이의 존재로 인하여 주변 지역에 비해 높은 일차 생산을 나타내는 지역으로 알려져 있다. 특히, 울릉 분지 지역은 외해에 비해서도 높은 생산력을 가진다 (최 등 2020; Kwak et al., 2013; Joo et al., 2014). 이러한 특징으로 인해 본 조사 지역을 대상으로 장기간의 광역적인 관측이 가능한 해색 자료는 꾸준히 활용되어 왔다. 그러나 Figure.1에서 제시된 것처럼 한류가 주로 존재하는 지역에는 약 20%이상의 유효 자료 취득율을 보이며, 난류가 존재하는 지역에서의 자료 획득률은 전체 기간의 10% 미만 수준에 그친다. 시공간적인 자료의 불균질성에 의해 야기되는 부정확성은 연구 결과에 중대한 영향을 미칠 수 있으며, 유효하지 않은 해석을 유발하므로 효율적인 결측 보완이 수행되어야만 한다.
결측을 보완하기 위한 다양한 기법 중 가장 대표적이고 간단한 방식은 시간적인 합성장(주별 및 월별 자료)을 사용하는 것이다. 그러나 이러한 기법이 사용 가능한 자료의 단순 합성에 의존하고 있음을 감안할 때 시간적 분석에 큰 불확실성을 유발할 수 있다. 따라서 보다 더 적절한 고차원적인 기법이 요구된다. 본 연구에서는 결측 복원에 폭넓게 사용되었던 Data Interpolation Empirical Orthogonal Function (DINEOF)을 사용하여 우리나라 동해 남서부 지역에의 해색 자료 복원을 수행하여 결측이 보완된 CHL 자료를 구성하는데 목적을 둔다.
2.1. 엽록소-a 농도
본 연구에서 사용된 CHL 농도 자료는 NASA Ocean Biology Process Group (OBPG)에서 제공하는 Aqua 위성의 MODIS 센서로부터 제공된 것이며(https://oceancolor.gsfc.nasa.gov/), 2003년 1월부터 2020년 12월까지의 자료를 대상으로 한다. 사용된 CHL 자료는 Level-3이며, 공간해상도는 약 4km이다.
2.2. Data Interpolating Empirical Orthogonal Function (DINEOF)
DINEOF를 이용한 복원에 앞서, 복원 결과에 영향을 미칠 수 있는 이상치 (outlier)를 제거하여 한다. 이러한 이상치들은 해색 자료 산출 과정에서 전 처리 실패에 의해 나타나는 오염된 픽셀로 구성되어 있다. 본 연구는 이러한 픽셀들을 제거하기 위하여 normalized median test 방식을 사용하였으며, 자세한 사항은 Westerweel and Fulvio Scarano (2005)를 참조 바란다. 이러한 기법에 모수(parameter)인 sub-window의 크기와 cut-off threshold의 값은 각각 5, 1.2로 설정되었다. 결측 복원을 위해 사용된 방식인 DINEOF는 최초로 Becker and Rixen (2003)에 의해 제시된 방식이다. 그러나 여기서 사용된 방식은 시계열적인 연속성을 보다 효율적으로 모사하기 위해서 시간 공분산 필터가 추가된 개선된 DINEOF 방식을 사용하였다(Alvera-Azcarate et al., 2009). 간략히 설명하자면, 우선 전체 유효한 픽셀 중 일부를 교차 검증을 위하여 랜덤하게 지정한 후 (여기서는 총 유료자료의 5%), 해당 픽셀을 결측값으로 설정한다. 그리고 모든 결측 픽셀을 0으로 설정한 뒤 특이값 분해(Singular Value Decomposition) 방법에 의한 고유벡터 및 고유값을 분해한다. 분해된 첫 번째 모드(mode)에서 교차 검증을 위하여 결측 값으로 변환시켰던 위치의 값들과 실제 값 사이의 실효값(Root Mean Square)을 계산한다. 그리고 재차 특이값 분해를 수행하여 산출된 실효값이 이전의 실효값과 10−5이상의 차이가 나타나지 않을 때까지 반복 수행하게 된다. 다음으로 첫 번째 모드와 두 번째 모드를 합성하여 실효값을 계산하고 위에서 언급한 방식과 동일한 과정이 수행되며, 최종적으로 실효값이 더 이상 개선되지 않는다고 판단되는 모드 개수의 합성과 반복 절차가 완료되면 결측 복원 과정이 완료된다.
Fig. 2a는 본 조사지역을 대상으로 수행된 결측 자료 복원에 최종적으로 사용된 모드의 개수 선정에 대한 결과를 보여준다. 총 311개의 모드가 사용되었으며 이때의 실효값은 0.05 mg m−3 이다. 교차 검증을 위해 사용된 총 자료의 개수는 347,209개이며 실제값과의 비교를 위해 계산된 결정계수(R-squared, R2)는 0.86이며 평균 제곱근 오차(Root Mean Square Error, RMSE)는 0.37 mg m−3로 실제값에 상당히 근접한 결과를 보여주고 있다(Fig. 2b). 복원은 전 조사 지역에 걸쳐 100% 이루어졌다. 결측 복원의 예시로 Fig. 2cFig. 2d는 2017년 7월 27일의 관측된 CHL과 복원된 결과에 대한 공간 분포를 보여주고 있으며, Fig. 2eFig. 2f는 2019년 9월 14일의 예시이다. 전반적으로 공간 분포는 전일과 후일의 연속적인 결과를 참조하였을 때 실제와 가깝게 잘 복원된 것으로 확인되었다.
Fig. 3a는 관측된 CHL의 2003년 1월 1일부터 2020년 12월 31일의 전 기간 평균을 나타낸 것이며, Fig. 3b는 복원된 자료의 전 기간 평균이다. 두 자료 모두 공통적으로 연안지역에서 높은 CHL을 나타내고 있지만 복원된 자료에 비하여 관측된 CHL 자료가 연안을 포함한 외해에서 모두 상대적으로 높게 나타난다(Fig. 3c). 관측된 CHL 평균은 구름으로 인해 시간적으로 불균질하게 획득된 자료를 단순히 합성하여 나타낸 것이므로 복원된 결과와의 그러한 차이를 발생시키는 것으로 보인다. 이는 단순한 통계적인 과정을 통해 산출된 합성장은 결측이 많은 지역에서 활용하기에 상당한 부정확성을 동반할 수 있다는 것을 암시한다. 결과적으로, 복원을 통해서 시공간적으로 균질한 자료를 획득함에 따라 극한 변동없는 안정적인 자료를 확보할 수 있다(Fig. 3d).
본 연구는 우리나라 동해 남서 해역에서 2002년 1월 1일부터 2020년 12월 31일 획득된 MODIS 해색 위성 CHL 자료에서 불규칙적으로 나타나는 결측을 복원하기 위한 DINEOF의 적용 결과와 그에 대한 평가를 수행하였다. 이러한 자료는 향후 장기적인 식물플랑크톤 생체량 변동 연구에 적용되어 결측으로 인하여 발생할 수 있는 오차를 최소화한 정량적인 연구를 가능하게 한다. Fig. 4a는 관측된 자료와 복원된 자료의 공간적으로 평균된 시계열 자료를 바탕으로 산출된 스펙트럼 밀도분포를 보여준다. 두 자료 간의 우세한 주기의 분포는 크게 다르지 않지만, 주기간의 에너지 비율 차이로 인하여 변동 특성은 어느 정도 다를 수 있다. 또한 장기간 경향 분석 측면에서(Fig. 4b), 두 자료는 완전히 상이한 결과를 보여준다. 본 연구에서는 우리나라 동해 남서 해역에서 복원의 가능성 여부를 중점적으로 다루었다. 그러나 복원된 결과의 유효성을 판단하고 정확한 중장기적 변동 특성에 대하여 이해하기 위해서는 반드시 다량의 현장 관측 자료와의 비교 분석이 반드시 필요하며, 분석 결과를 바탕으로 복원 과정의 세부적인 조정이 요구된다.
Acknowledgements
본 연구는 한국해양과학기술원부설 극지연구소 기관고유사업 “북극 빙권변화 정량 분석을 위한 원격탐사 연구(PE21040)”의 지원을 받아 수행되었습니다.
Fig. 1.
The distribution of percentage of valid pixels in the study area.
DJ2021-3-4-002f1.jpg
Fig. 2.
(a) The variation in the root mean square (RMS) with number of modes used for reconstruction. (b) Density scatter plots for cross-validation. The example images of measured (CHLSAT) and reconstructed (CHLREC) chlorophyll-a concentration (CHL) images in (c-d) July 27, 2017 and (e-f) September 14, 2019.
DJ2021-3-4-002f2.jpg
Fig. 3.
The climatology of (a) CHLSAT and (b) CHLREC, and (c) their difference. (d) Time-series of spatially averaged CHLSAT (gray) and CHLREC (orange).
DJ2021-3-4-002f3.jpg
Fig. 4.
(a) Power spectral density of spatially averaged timeseries of CHLSAT (black) and CHLREC (red). (b) Linear trends of CHLSAT (black) and CHLREC (red) for spring bloom season (April).
DJ2021-3-4-002f4.jpg
  • Alvera-Azcarate A, et al (2009) Enhancing temporal correlations in EOF expansions for the reconstruction of missing data using DINEOF. Ocean Science 5(4):475–485Article
  • Beckers JM, Rixen M (2003) EOF Calculations and Data Filling from Incomplete Oceanographic Datasets. J Atmos Ocean Technol 20(12):1839–1856Article
  • Choi JK, et al (2020) Application of GOCI to the Estimates of Primary Productivity in the Coastal Waters of the East Sea. Korean J Remote Sens 36(2):237–247
  • Cole H, et al (2012) Mind the gap: The impact of missing data on the calculation of phytoplankton phenology metrics. J Geophys Res Oceans 117:C08030Article
  • Joo H, et al (2014) Long-term annual primary production in the Ulleung Basin as a biological hot spot in the East/Japan Sea. J Geophys Res Oceans 119(5):3002–3011Article
  • Kwak JH, et al (2013) Monthly measured primary and new productivities in the Ulleung Basin as a biological “hot spot” in the East/Japan Sea. Biogeosci Discuss 10(2):2127–2158
  • Westerweel J, Scarano F (2005) Universal outlier detection for PIV data. Exp Fluids 39:1096ArticlePDF
데이터셋에 대한 메타데이터
Sort Field Subcategory#1 Subcategory#2
Essential *Title Reconstructed chlorophyll-a concentration from 2003 to 2020
*DOI name 10.22761/DATA2021.3.4.033
*Category Oceans
Abstract Reconstructed chlorophyll-a concentration
*Temporal Coverage From 1 Jan 2003 UTC through 31 Dec 2020
*Spatial Coverage Latitude 35oN-39oN
Longitude 128oE-132oE
WGS84 Coordinates Point/Line/Polygon
*Personnel Name Jinku Park
Affiliation Korea Polar Research Institute
E-mail jinku_park@kopri.re.kr
*CC License CC-BY
Optional *Project 북극 빙권변화 정량 분석을 위한 원격탐사 연구 PE21040
*Instrument Ocean color Moderate Resolution Imaging Spectroradiometer

Figure & Data

References

    Citations

    Citations to this article as recorded by  

      Figure

      GEO DATA : GEO DATA