Skip Navigation
Skip to contents

GEO DATA : GEO DATA

OPEN ACCESS
SEARCH
Search

Articles

Page Path
HOME > GEO DATA > Volume 5(3); 2023 > Article
Original Paper
온실가스 지중저장 적지 탐사 데이터 구축: 지질단면도 데이터를 중심으로
고보균1orcid, 박성재2orcid, 이사로3,*orcid
Construction of Exploration Data for Greenhouse Gas Geologic Storage: Focusing on Geological Cross-section Data
Bokyun Ko1orcid, Sungjae Park2orcid, Saro Lee3,*orcid
GEO DATA 2023;5(3):222-229.
DOI: https://doi.org/10.22761/GD.2023.0023
Published online: September 26, 2023

1연구원, 강원대학교 과학교육학부, 강원특별자치도 춘천시 강원대학길 1, 24341, 대한민국

2박사과정, 강원대학교 스마트지역혁신학과, 강원특별자치도 춘천시 강원대학길 1, 24341, 대한민국

3책임연구원, 한국지질자원연구원 지질자원데이터센터, 대전광역시 유성구 과학로 124, 34132, 대한민국

1Researcher, Department of Science Education, Kangwon National University, 1 Gangwondaehak-gil, Chuncheon, 24341 Gangwon-do, South Korea

2Ph.D. Candidate, Department of Smart Regional Innovation, Kangwon National University, 1 Gangwondaehak-gil, Chuncheon, 24341 Gangwon-do, South Korea

3Principal Researcher, Korea Institute of Geoscience and Mineral Resources, 124 Gwahak-ro, Yuseong-gu, 34132 Daejeon, South Korea

Corresponding Author Saro Lee Tel: +82-42-838-3057 E-mail: leesaro@kigam.re.kr
• Received: August 24, 2023   • Revised: September 12, 2023   • Accepted: September 13, 2023

Copyright © 2023 GeoAI Data Society

This is an Open Access article distributed under the terms of the Creative Commons Attribution Non-Commercial License (http://creativecommons.org/licenses/by-nc/3.0/) which permits unrestricted non-commercial use, distribution, and reproduction in any medium, provided the original work is properly cited.

  • 718 Views
  • 66 Download
  • In this study, the most basic data, underground geological structure data, that is, geological cross-section data, were established to select a candidate site for underground storage of greenhouse gases based on AI. As a target area, the Gyeongsang Basin, where a large amount of sedimentary rocks are distributed, was selected as the greenhouse gas can be stored most effectively in sedimentary rocks. To this end, the acquisition and edit step, the refinement step, and the labeling step were carried out in the order of raw data collection, source data and labeling data construction to construct the geological cross-section data. This data can be downloaded through the AI hub site (https://aihub.or.kr/aihubdata/data/view.do?curr Menu=115&topMenu=100&aihubDataSe=realm&dataSetSn=71390) operated by the Korea Institute for Intelligent Information Society Promotion.
기후 변화 정부 간 협의체의 보고서는 지구 평균 온도의 상승폭을 1.5℃로 제한하려면 사회 모든 부문에서 신속하고 광범위하면서 전례 없는 변화가 필요하다고 지적하였다(Intergovernmental Panel on Climate Change, 2018). 최근 온실가스감축의 방법으로 이산화탄소 지중저장이 많은 관심을 받고 있지만 석유 자원 관련 전·후방 산업의 발달이 미약하며, 기술 시장이 미성숙된 국내의 경우 이산화탄소 지중저장소 특성화를 위한 핵심요소 기술의 조기 개발 및 자립화가 필요하며, 온실가스 지중저장의 적지 선정을 위해서는 지질도, 지질시추 데이터, 지구물리탐사 데이터, 지질단면도 데이터 등 기존에 산재되어 있는 각 지질데이터를 표준화하여 구축하고 인공지능(AI) 기술을 활용한 지하 지층의 지질구조 파악이 필수적이다. 또한 최근 AI 기술은 정확도 향상을 위한 지도학습 기반 ‘딥러닝(deep learning) 알고리즘’ 개발을 포함하여 양질의 학습을 위한 고품질의 AI 데이터셋 구축이 필수이며, 이산화탄소의 지중저장 적지 선정을 위한 근본적 해결을 위한 지하 지층의 지질구조를 AI 기반으로 분석, 지중 저장 적지 선정을 위한 AI 학습데이터 구축이 필요하다. 따라서 본 연구에서는 AI 기반으로 온실가스 지중저장 후보지 선정을 위해 가장 기본적인 데이터인 지하 지질구조 데이터, 즉 지질단면도 데이터를 구축하였다. 온실가스는 퇴적암에 가장 효과적으로 저장될 수 있으므로, 다량의 퇴적암이 분포하는 경상도 일대(경상분지; 1:50,000 축척 지질도 62장 지역; Fig. 1)를 대상 지역으로 선정하여 데이터 구축을 실시하였다.
지질단면도는 지질도에 표현된 지표의 암석 분포와 지질구조 등을 활용하여 지하의 지질 요소를 추정한 단면도로, 생성 시기와 종류가 다른 암층들 간의 상호관계, 암층들의 형태나 두께, 깊이에 따른 지질구조 변화 등이 포함된다. 지질단면도 데이터 구축을 위해 획득 및 편집을 수행하는 원시데이터 수집 단계, 수집된 데이터를 기본 지질단면도를 작성하는 원천 데이터 정제 단계, 마지막으로 구획 영역을 설정하고 어노테이션 지정 및 학습데이터를 생성하는 라벨링 단계의 3단계를 거쳐 최종 지질단면도 이미지 데이터를 구축하였다(Table 1).
2.1 원시데이터
원시데이터는 지질단면도 이미지 데이터를 구축하기 위한 최초 자료이며, 한국지질자원연구원에서 보유한 1:50,000 축척 수치지질도이다. 원시데이터 유형은 1:50,000 축척 수치지질도를 4분할한 지질도 이미지이며, 암상, 지질경계선, 단층, 지층의 주향과 경사, 지질단면선, 광산 기호 등을 포함한 벡터 파일이다. 원시데이터 포맷은 한국지질자원연구원에서 제공하는 수치지질도의 래스터 파일(TIFF)과 벡터 파일(SHP)이다. 원시데이터 규모는 경상도 지역의 경상분지에 해당하는 1:50,000 축척 수치지질도 62개를 각각 4분할한 수치지질도 248개이다. 원시데이터는 한국지질자원연구원에서 운용 중인 지오빅데이터 오픈플랫폼(https://data.kigam.re.kr/)에서 수치지질도를 직접 다운로드하며, 부족하거나 누락된 정보가 있는 경우에는 한국지질자원연구원에 데이터를 요청하여 수집하였다. 수집된 수치지질도는 4분할하였고 각각의 분할한 지질도에 20개의 지질단면선을 작성하였다(Fig. 2).
2.2 원천데이터
원천데이터는 원시데이터인 4분할 축척 수치지질도에서 불필요한 요소를 제거한 후 작성된 지질단면도이다(Fig. 3). 원천데이터 포맷은 암상의 종류와 지질경계선, 단층, 단층의 운동 방향, 습곡, 배사구조, 향사구조를 포함하는 TIFF 파일이다. 원천데이터 규모는 4분할한 지질도에서 각각 20개의 지질 단면도를 작성하였고, 따라서 1개의 1:50,000 축척 지질도에서 80개의 지질단면도를 작성하였다. 추가적으로 온실가스 지중적지로 예상되는 포항 지역의 장기분지 일대에 대하여 상대적으로 좁은 간격의 지질단면도 98개를 작성하였으며, 전체적으로 1:50,000 수치지질도 62개에서 총 5,058개의 지질단면도를 작성하였다. 각 지질단면선에 대한 지질단면도는 GIS 프로그램인 QGIS를 이용하여, 높이와 거리를 나타내는 그래프 작성 → 그래프 내부에 해당 지질단면선에 대한 지표면 작성 → 지질경계선 작성 → 각 암상에 대한 패턴(+색상) 삽입순으로 작성하였다.
2.3 라벨링 데이터
라벨링 데이터는 인공지능 학습용 이미지 데이터이며, 정제된 원천데이터의 구성 요소(암상, 암상에 대한 지질 기호, 지질 경계선, 단층, 단층의 운동 방향, 습곡, 배사구조, 향사구조)를 확인하고 구별할 수 있도록 라벨링된 이미지 데이터이다. 라벨링 데이터의 종류는 라벨링 데이터와 메타데이터로 구분되며, 라벨링 데이터의 포맷은 TIFF이고 메타데이터의 포맷은 JSON이다. 라벨링 데이터 규모는 원천데이터에 대해 라벨링을 실시한 5,058개이다(Table 2).
라벨링을 위해 정제된 원천데이터의 구성 요소(암상, 암상의 지질 기호, 지질경계선 등)를 확인하고 구별할 수 있도록 신생대 제4기 충적층, 신생대 제3기 연일층군 연일셰일, 신생대 제3기 범곡리안산암 및 응회암 등 44개 항목의 객체클래스를 설계하였고(Table 3), 이에 대한 JSON 파일 제작을 위해 메타데이터를 설정하였다(Table 4).
이러한 설계안을 바탕으로 라벨링 데이터 제작을 위해 QGIS를 활용하였으며, 지층의 지질기호, 방위, 높이와 거리에 대한 그래프 등을 제거하고, 메타데이터에 대한 JSON 파일을 작성하였다. 그리고 그래픽 편집 프로그램을 이용하여 암상 패턴을 제거하고 색상으로만 표기하였으며, 지질도를 참고하여 지질단면도를 생성하는 어노테이션 작업을 수행하였다(Fig. 4). 작성된 어노테이션 데이터는 미태깅, 오태깅, 과태깅 등의 오류 항목을 제거하는 품질 검수 과정을 거쳤다(Table 5). 품질에 이상이 없는 것으로 검수된 어노테이션 데이터는 실질적인 온실가스 지중적지 탐사를 위한 훈련 자료를 구축하기 위하여 사전에 설계된 grayscale 색상으로 변환하였다(Fig. 5).
본 연구에서는 온실가스 지중저장 적지를 선정하기 위해 가장 중요하면서 기초적인 자료인 지질단면도를 경상분지 지역에 대해 구축하였다. 인공지능 학습용 지질단면도 이미지 데이터를 활용하여 효율적인 지질 조사 및 연구 수행이 가능하다. 즉, 구축된 지질단면도 이미지 데이터는 온실가스 지중저 장뿐만 아니라 지하 지질구조 파악이 필수적인 석유나 천연가스, 지하수 개발에도 적극 활용될 수 있고, 지질단면도 이미지 데이터는 효율적인 지하자원 개발을 위해 활용될 수 있다. 지하지원 개발을 위해서는 지하에 존재하는 광체의 특성을 파악하는 것이 매우 중요하며, 다량의 지질단면도 이미지 데이터는 자원 탐사 시간과 경비를 줄여 경제적이고 효과적인 자원 개발을 가능하게 한다. 본 지질단면도 데이터는 한국지능정보사회진흥원에서 운영하여 AI 허브사이트(https://aihub.or.kr/)에서 다운로드할 수 있다.

Conflict of Interest

Saro Lee has been an Editorial Board of GEO DATA; however, he was not involved in the peer reviewer selection, evaluation, or decision process of this paper. Otherwise, no other potential conflicts of interest relevant to this paper were reported.

Funding Information

This work was supported by the “Construction of Artificial Intelligence Training Data; 2-93. Exploration Data of Greenhouse Gas Geologic Storage, 2022” grant funded by the National Information Society Agency and Ministry of Science and ICT. This work was also supported by Basic Research Project of the Korea Institute of Geoscience and Mineral Resources (KIGAM).

Data Availability Statement

The data that support the findings of this study are openly available in AI Hub at https://aihub.or.kr/, reference number. The data that support the findings of this study are available on request from the corresponding author. The data are not publicly available due to privacy or ethical restrictions.

Fig. 1.
Geological map of Gyeongsang-do area (A) and index map of 1:50,000 scale geological map of Gyeongsang Basin (red line: boundary of Gyeongsang Basin, blue line: corresponding maps) (B).
GD-2023-0023f1.jpg
Fig. 2.
The process for acquisition and refinement of raw data. (A) Digital geological map of 1:50,000 scale. (B) Splitting the digital geological map. (C) Making a geological profile line on the split map (red line: geological profile line for Fig. 3).
GD-2023-0023f2.jpg
Fig. 3.
Geological cross-section image.
GD-2023-0023f3.jpg
Fig. 4.
Annotated geological cross-section data using QGIS. Refer to Table 3 for the formation of the legend.
GD-2023-0023f4.jpg
Fig. 5.
AI training data of geological cross-section in grayscale. Refer to Table 3 for the formation of the legend.
GD-2023-0023f5.jpg
Table 1.
The steps of constructing geological cross-section data
Step Data Type Data format
Acquisition and edit step Raw data Geological map based data TIFF, SHP
Refinement step Source data Geological cross-section based data TIFF
Labeling step Labeling data Geological cross-section labeling data TIFF
Meta data Meta data JSON
Table 2.
Type and quantity of labeling data
Type Quantity Entire quantity
Lithology Depending on the number of the lithology included in each geological cross-section image The quantity of each geological cross-section
Geological boundary Depending on the number of the geological boundary included in each geological cross-section image × 5,058
Fault Depending on the number of the fault included in each geological cross- section image
Sense of fault motion Depending on the number of the sense of fault motion included in each geological cross-section image
Table 3.
Object class (R, G, and B denote RGB color model)
Code Item (Korean) R G B Image
Qa 신생대 제4기 충적층 255 255 115
Ted 신생대 제3기 연일층군 두호층 232 237 54
Tesh 신생대 제3기 연일층군 연일셰일 234 227 51
Tecg 신생대 제3기 연일층군 천북역암 235 217 48
Tcpa 신생대 제3기 범곡리층군 범곡리안산암 및 응회암 201 159 244
Tcca 신생대 제3기 범곡리층군 진전동안산암 및 응회암 195 152 237
Tcma 신생대 제3기 범곡리층군 망해산안산암 및 응회암 186 141 229
Tcpp 신생대 제3기 범곡리층군 방산리진주암 175 129 218
Tcga 신생대 제3기 범곡리층군 창암안산암 및 응회암 163 116 206
Tcbr 신생대 제3기 범곡리층군 갈평동각력암 236 202 44
Tcyt 신생대 제3기 범곡리층군 연일현무암 및 양휘석안산암 149 101 192
Tcub 신생대 제3기 장기층군 상부현무암질 응회암 136 86 179
Tcat 신생대 제3기 장기층군 금오리안산안질 응회암 124 72 165
Tcuc 신생대 제3기 장기층군 상부함탄층 236 185 39
Tclb 신생대 제3기 장기층군 하부현무암질 응회암 111 57 152
Tclc 신생대 제3기 장기층군 하부함탄층 225 167 34
Tcsh 신생대 제3기 장기층군 금광동셰일(식물층) 234 153 31
Tcsa 신생대 제3기 장기층군 신정동안산암 100 43 141
Tcka 신생대 제3기 장기층군 구룡포안산암 90 28 130
Tctr 신생대 제3기 장기층군 눌태리조면암 82 14 122
Tccg 신생대 제3기 장기층군 장기역암 233 142 28
Kv 중생대 백악기 경상누층군 유천층군 화산암류 76 0 115
Kyjm 중생대 백악기 경상누층군 유천층군 장목리층 81 176 42
Kdd 중생대 백악기 경상누층군 유천층군 다대포층 77 172 58
Kjk 중생대 백악기 경상누층군 유천층군 정각산층 72 169 73
Kygs 중생대 백악기 경상누층군 유천층군 고성층 66 165 87
Kgc 중생대 백악기 경상누층군 하양층군 건천리층 60 160 100
Kyjp 중생대 백악기 경상누층군 하양층군 장평리층 53 154 112
Km7 중생대 백악기 경상누층군 하양층군 진동층 45 148 124
Km6 중생대 백악기 경상누층군 하양층군 함안층 37 141 136
Ke6 중생대 백악기 경상누층군 하양층군 점곡층 31 134 146
Km5 중생대 백악기 경상누층군 하양층군 신라역암층 23 127 155
Km4 중생대 백악기 경상누층군 하양층군 칠곡층 19 121 164
Ky1 중생대 백악기 경상누층군 하양층군 울련산층 15 113 171
Km3 중생대 백악기 경상누층군 신동층군 진주층 14 106 179
Km2 중생대 백악기 경상누층군 신동층군 하산동층 16 99 186
Km1 중생대 백악기 경상누층군 신동층군 낙동층 19 92 192
Km 중생대 백악기 묘곡층 20 86 195
Mi 중생대 관입암류 158 38 0
Cls 캠브리아기 옥천층군 변성사질암 168 112 0
PCEgn 선캠브리아기 변성암류 137 68 68
Rv 지중저장 적지 255 0 0
NRv 지중저장 비적지 0 255 0
At 대기 255 255 255
N01 지질경계선 0 0 0
N02 단층 220 220 220
N04 추정단층 240 240 240
Table 4.
Meta data
No Item Item (Korean) Type Requirement Example (Korean)
1 Info 기본정보 Object Y
1-1 File_name 파일명 String Y GM_SD_HE22
2 Lithology 암상정보항목 Array Y
2-1 Ligtho_idx 암상기호 Number Y 105
2-2 Litho_name 암층명 String Y 낙동층군 하산동층 다인층원
2-3 Age 생성시기 String Y 중생대 백악기
2-4 Ref_rock 주요암석 String Y 실트스톤, 사암, 역질사암
2-5 Litho_depth_S 암상 시작심도 Number N 622
2-6 Litho_depth_E 암상 종료심도 Number N 623
3 Boundary 지질경계선 정보 항목 Object N
3-1 B_Count 지질경계선의 수 Number N 1
4 Fault 단층 정보 항목 Object N
4-1 F_Count 단층의 수 Number N 1
4-2 F_Length_m 단층의 길이(m) Number N 623
4-3 F_Depth_m 단층의 깊이(m) Number N 600
4-4 F_Angle 단층의 각도(deg) Number N 45
5 Inf_fault 추정단층 정보 항목 Object N
5-1 I_Count 추정단층의 수 Number N 1
5-2 I_Length_m 추정단층의 길이(m) Number N 623
5-3 I_Angle 추정단층의 각도(deg) Number N 45
6 Etc 기타정보 Object N
6-1 D_Direction 경사의 방향 String N E
6-2 D_Degree 경사의 각도(deg) Number N 17
7 Range 위치, 심도 정보 항목 Object N
7-1 Coord_sys 좌표계 String Y WGS84
7-2 Start_pt 시점 좌표 String Y 35.464640, 128.240040
7-3 End_pt 종점 좌표 String Y 35.465105, 128.372622
7-4 Length_m 측선길이(m) Number N 1400
7-5 Start_depth 시작 심도 Number N 622
7-6 End_depth 종료 심도 Number N 623
7-7 Elevation_MIN 최저고도 Number N 0 (고정)
7-8 Elevation_MAX 최고고도 Number N 2,450 (고정)
7-9 Elevation_BL 시추공 고도 Number N 10
Table 5.
Example of errors on the annotated geological cross-section data
GD-2023-0023i1.jpg
  • Intergovernmental Panel on Climate Change (IPCC) (2018) Global warming of 1.5°C. Cambridge University Press, Cambridge, 616p
MetaData for Dataset
Sort Field Subcategory#1 Subcategory#2
Essential *Title Geological Cross-section Data
*DOI name https://aihub.or.kr/aihubdata/data/view.do?currMenu=115&topMenu=100&aihubDataSe=realm&dataSetSn=71390
*Category
Abstract Geological Cross-section Data for Selecting Suitable Sites of Greenhouse Gas Geologic Storage
*Temporal Coverage Permanent
*Spatial Coverage Address 62 Geological maps of the Gyeongsang Basin
WGS84 Coordinates Point/line/polygon
*Personnel Name Saro Lee
Affiliation Korea institute of Geoscience and mineral resources (KIGAM)
E-mail leesaro@kigam.re.kr
*CC License CC BY-NC-ND
Optional *Project Construction of Exploration Data for Greenhouse Gas Geologic Storage
*Instrument

Figure & Data

References

    Citations

    Citations to this article as recorded by  

      Figure

      GEO DATA : GEO DATA