바로가기메뉴

본문 바로가기 주메뉴 바로가기

GeoData

지질학, 생태학, 해양학, 우주과학, 극지과학에서의 데이터 저널

논문목록

다목적실용위성 광학영상을 활용한 AI 학습용 도로 검출 데이터셋

AI Dataset for Road Detection using KOMPSAT Images

초록

인공위성의 광학영상에 보이는 도로의 형태 및 종류 정보는 수치적 지도 제작 및 도로 변화 감시에 유용하다. 다목적실용위성 3호와 3A호에 탑재된 광학 카메라로부터 수집되는 광학영상 데이터를 가공하고 구조화하면 도로 검출 알고리즘의 개발과 이러한 분석 도구를 이용한 도로 정보 산출 작업을 가속화할 수 있다. 특히, 딥러닝(Deep Learning) 학습 기술을 적용할 수 있도록 준비된 AI (Artificial Intelligence)용 학습 데이터셋으로 구축되면 컴퓨터 과학 분야의 최신 인공지능 기술을 위성영상 기반 도로 검출 분야에 스핀오프(Spin-off)하여 폭넓은 분석을 시도할 수 있다. 한국항공우주연구원은 국내 여러 업체와 함께 위성 광학영상을 이용하여 AI 학습용 도로 영상 데이터셋을 구축하였으며 본 논문에서는 이 데이터셋의 활용 예시와 함께 데이터셋의 종류, 규모 등에 관하여 설명한다. 구축된 데이터는 aihub.or.kr 웹사이트를 통해 이용할 수 있다.

Abstract

Information on shape and type of road present in an optical image of satellite is useful for digital mapping and monitoring of road changes. Processing and structuring optical image data collected from payloads mounted on KOMPSAT 3 and 3A can accelerate the development of road detection algorithms and the extraction of road information using them. In particular, if it is built with a learning dataset for AI (Artificial Intelligence) prepared to apply deep learning technology, the latest artificial intelligence technology in the field of computer science can be spun off to the field of satellite image-based road detection to attempt a wide range of analysis. Korea Aerospace Research Institute constructed an image dataset for AI learning using satellite optical images with Korean companies, and this paper explains the type and size of datasets along with examples of the use of the dataset. The established data can be used through the website, aihub.or.kr.

1. 서론

특정 시점의 도로 윤곽이나 종류에 대한 정보는 토지 이용 변화, 수치 지도 제작, 도시 개발 계획, 자율 주행/ 비행, 재난/재해 모니터링, 도로 경계 결정, 지도 정합 등 다양한 분야에 활용될 수 있다. 이러한 정보의 원천은 다양하나 관측 위치와 시각의 변화에 따른 광학 영상은 도로를 포함할 가능성이 높으며 가용 데이터의 양이 풍 부하고 사용자에게 접근성이 높다. 이러한 광학 영상 촬영 데이터 확보 방법은 지상 이동체에 탑재된 모바일매핑 시스템(Mobile Mapping System)을 이용하여 접근이 가능한 지상 영역에서 항법 정보에 대응하는 도로 영상을 수 집하는 방법, 항공 이동체에 탑재된 광학영상 촬영 장치를 이용하여 비행 궤적에 따라 영상을 취득하는 방법, 인 공위성에 탑재되는 광학영상 센서를 이용하여 특정 시각에 궤도 상의 촬영영상을 얻는 방법 등이 있다 (Paparoditis et al., 2012). 특히, 인공위성을 이용한 관측은 상대적으로 특정 시점에서 관측할 수 있는 영역이 넓으 며 비용 대비 촬영 주기가 짧아 도로 정보 추출 알고리즘에 유용한 광학 영상을 제공한다.

한편 영상 내에서 원하는 물체나 영역을 구별하고 변화를 탐지하는 최고 성능의 최신 알고리즘은 심층 인공 신경망을 활용한 딥러닝 기술을 기반으로 구현하는 추세이다. 이러한 첨단 인공지능 기술을 위성 광학 영상처리 분야에 적용하여 도로 정보를 정확하고 원활하게 추출할 수 있는 알고리즘을 제작하고 이 알고리즘으로 분석한 도로 형태 및 종류 정보를 다방면에 활용할 수 있다. 해외의 스페이스넷(SpaceNet) 경연대회는 도로 종류, 재질, 다리, 고유 도로 번호 등의 정보를 포함하는 도로 데이터셋을 공개하고 도로의 연결 라인을 추출하는 알고리즘을 경쟁하도록 환경을 제공하였다(Van Etten et al., 2018).

본 연구에서는 국가위성인 다목적실용위성 3/3A의 광학영상을 대상으로 다양한 도로가 포함된 지역에 대해서 AI (Artificial Intelligence) 학습용 도로 데이터셋을 구축한 결과를 설명한다. 또한 Convolution 기반의 인공신경망 에서 샘플 광학 영상에 대한 도로 추출 예시를 보이고 도로 검출 알고리즘의 개발 가능성을 제시한다.

새창으로 보기
Figure 1

Results from the roads challenge, SpaceNet (Van Etten et al., 2018)

GEODATA-4-1-43_F1.tif

2. AI 학습용 도로 데이터셋 정의

다목적실용위성 영상을 활용한 AI 학습용 도로 데이터셋은 정부의 인공지능 학습용 데이터 구축사업을 통해 웹(aihub.or.kr)에 공개되었다. AI 학습용 데이터셋은 해상도가 각각 70 cm, 55 cm 인 3호와 3A호 광학영상을 원천데이터로 사용하고 학습에 효과적이고 유효한 데이터를 필터링한 후 라벨링 작업이 진행되었다. 작업이 완료된 데이터는 여러 단계의 검수 절차를 통하여 학습 : 검증 : 시험 용이 각각 전체의 70% : 20% : 10%가 되도록 목표를 설정하였다. 한국항공우주연구원은 AI 알고리즘 개발을 위하여 도로 검출을 위한 의미론적 영상 분할(semantic image segmentation)을 위한 도로 데이터셋을 국내 참여업체(에스아이에이, 에스아이에스, 슈퍼브에이아이)와 함께 가공하고 구축하였다.

원시데이터 영상의 크기는 약 24,000 x 24,000 px2 이며 AI 학습에 유용하고 라벨링에 용이한 1,024 x 1,024 px2 패치 형태로 제작하였다. 픽셀 당 해상도는 16 비트이며 파일 형식은 TIFF (Tagged Image File Format)으로 생성하였다. 도로가 포함된 영역을 사전에 검색하기 위한 목적으로 개방형 지도자료 재단인 OpenStreetMap에서 사전 파악한 후 도로 영역이 존재하는 해당 지역에 대한 다목적실용위성 영상을 조건 검색을 통하여 패치 제작까지 이어진다. 이렇게 검색한 데이터셋의 대상은 총 4 개의 지역으로 미국의 로스엔젤레스, 독일 볼프스부르크, 중국 상하이, 이집트 뉴카이로이다.

도로의 종류는 고속도로를 미국에서 highway, 영국에서 motorway 등으로 다르게 사용지만 OpenStreetMap 분류 방법에서 고속도로(Motorway), 제 1 도로(Primary), 제 2 도로(Secondary), 제 3 도로(Tertiary), 주거 도로(Residential), 미분류 도로(Unclassified) 로 나누어 라벨링이 이루어 졌다. 이 라벨 값은 순서대로 0, 1, 2, 3, 4, 5 로 할당이 되었고 AI 학습 과정에서 픽셀 당 각 클래스 정답이 된다.

새창으로 보기
Figure 2

Labeled samples of KOMPSAT 3/3A images

GEODATA-4-1-43_F2.tif

데이터셋의 도로 전체 길이는 총 약 6,709 km에 이르며 총 용량은 약 15 GB이고 1,591개의 영상과 라벨 정보로 구성되었다. 구성 비율은 앞서 언급된 도로 분류 순서대로 약 5% : 10% : 13% : 5% : 33% : 33% 으로 구성된다. 해당 라벨링 정보가 있는 파일은 지역 공간정보 표준인 GeoJson (RFC7946) 형식으로 되어 있으며 영상의 지리적 위경도 좌표, 도로의 폴리곤 좌표, 도로의 종류(클래스) 및 명칭이 포함되어 있다.

3. 도로 데이터셋의 활용

구축된 도로 데이터셋을 이용하여 도로 검출용 AI 기반 알고리즘의 기술 연구나 도로 정보 분석의 토대를 만들 수 있다. 한국항공우주연구원은 영상분할용 CNN 계열 심층 인공신경망의 대표적 알고리즘인 Deeplabv3을 위성 광학영상 분야에 적용하여 도로 데이터셋을 학습한 후 인공지능 기반의 도로 추출을 실시하였다(Chen et al., 2017).

Fig. 3은 데이터셋의 AI 학습용 데이터 외의 별도 시험 영상에서 도로의 종류와 윤곽을 찾도록 하였고 라벨 정답 영상(a, c)과 이에 대응하는 추출 결과 영상(b, d)의 샘플 영상을 얻을 수 있었다. 성능은 약 0.406 mIoU (mean Intersection over Union)으로 고속화도로에서 가장 높은 성능이 나타났고 반면에 제 2 도로에서 가장 낮은 성능을 보였다. 이러한 경향은 상대적으로 도로 폭이 넓고 단조로운 형태인 고속화도로보다 건물 사이의 좁은 도로의 인식 성능의 저하에 기인한 것으로 보인다. 그림 b에서 제 1 도로가 고속도로와 유사한 특징이 있어 구별이 용이치 않으나 인공지능으로 인간이 수동적으로 파악하여야 할 촘촘하고 다양한 도로를 한번에 신속하게 검출하여 도로 검출용 AI 학습 데이터셋의 유용함을 확인하였다.

새창으로 보기
Figure 3

Inference results from the road datasets. True labeled image (a, c), Inference image (b, d)

GEODATA-4-1-43_F3.tif

4. 기대효과

민간에 우주로의 접근성을 높이는 Space 2.0 시대에서 정부가 인공위성 광학영상을 가공하여 AI 학습용 데이터를 공개하여 데이터를 기반으로 하는 인공신경망 기술과 빅데이터 기술 산업에 소프트 인프라를 제공함으로써 지구 근방에서 우주 밖으로 영역이 확장되는 우주산업의 원동력이 될 것으로 기대된다. 도로에 대한 분류 및 윤곽 정보를 지구 전역에 대해서 경위도 좌표와 픽셀 정보로 정리된 AI 학습용 도로 데이터셋은 인공지능 기반 광역 도로 모니터링 및 수치 지도 갱신 등의 신산업 창출에 활용될 것이다. 또한 인공지능 기반의 인프라 시설 변화 탐지 알고리즘이나 지도 정합 기술 등의 첨단 기술의 국제 경쟁력 제고에 기여할 것으로 보인다. 이를 위하여 계속해서 발사되는 고해상도 영상탑재체와 누적되는 수신 영상에 대한 추가적인 AI 학습 데이터의 구축이 요구된다.

5. 사사

본 논문은 한국항공우주연구원 위성정보활용 (FR22H00) 과제의 일환으로 진행되었다.

6. 참고문헌

Chen L C et al. (2017). Rethinking atrous convolution for semantic image segmentation. arXiv preprint arXiv:1706.05587

Paparoditis N et al. (2012) Stereopolis II: A multi-purpose and multi-sensor 3D mobile mapping system for street visualisation and 3D metrology. Revue française de photogrammétrie et de télédétection, 200(1):69-79 https://doi.org/10.52638/rfpt.2012.63

Van Etten A Lindenbaum D Bacastow TM (2018) Spacenet: A remote sensing dataset and challenge series. arXiv preprint arXiv:1807.01232

7. 데이터셋에 대한 메타데이터


투고일Submission Date
2022-03-10
수정일Revised Date
2022-03-28
게재확정일Accepted Date
2022-03-29

Geo Data