J Coast Disaster Prev > Volume 12(2); 2025 > Article
해안지역 홍수예측 및 위험관리를 위한 GIS-딥러닝 통합 시뮬레이션 체계 구축

Abstract

This study proposes a GIS and deep learning-based integrated simulation framework to enhance the prediction and management of coastal flood risks. The framework integrates spatial datasets—including digital elevation models (DEMs), storm surge data, and terrain characteristics—preprocessed through ArcGIS Pro and Jupyter-based pipelines to estimate flood heights. A hybrid deep learning model, combining convolutional neural networks (CNNs) and long short-term memory (LSTM) networks in a parallel structure, is designed to learn spatial features and temporal dynamics simultaneously from time-series flood maps. The fused output is used to generate a probabilistic flood risk index. Experimental results using coastal datasets from Busan demonstrated that the hybrid model outperformed standalone CNN and LSTM models, achieving superior macro and weighted averages across multiple performance metrics. Notably, CNN exhibited perfect recall for early warnings, while LSTM showed the highest precision for policy decision support. The hybrid model balanced both strengths, proving robust even under imbalanced data conditions. The integration with ArcGIS Pro allows for high-resolution flood visualization and intuitive risk mapping, supporting real-time alerts and disaster response planning. This approach offers strong scalability to other coastal regions and practical utility for real-world early flood warning systems and climate resilience strategies.

1. 서 론

본 연구는 해안지역 홍수예측과 예방 및 관리를 위한 통합된 접근 방식의 시급한 필요성(Kirezci et al., 2022)과 위험관리 의사결정지원 체계 구축을 지원하고자 수행되었다. 이는 기후변화로 해수면 상승과 점차 강도가 증가하고 있는 태풍에 의한 집중호우 등으로 인한 연안지역 홍수 위협이 증가하고 있기 때문이다(Park and Lee, 2020). 기존의 전통적인 방법들은 특히 부산과 같은 취약 지역에서 복잡하게 진화하는 재해 양상을 효과적으로 관리하는 데 한계가 있다. 이러한 문제를 해결하기 위해, 본 연구에서는 ArcGIS Pro의 지리공간 처리 기능과 고급 딥러닝 알고리즘을 결합한 새로운 방식을 제안한다. 해안 고도, 표면 체적, 해일 데이터, 지표면 거칠기와 같은 다양한 데이터를 통합하여 단일 홍수 훈련 모델을 구성하였고, 이를 통해 홍수 발생을 시뮬레이션하고 예측하는 강건한 프레임워크를 개발하였다. 사용자 정의형 하이브리드 딥러닝 구조는 예측 정확성과 신뢰성을 크게 향상시키며, ArcGIS Pro와의 최적화 및 검증 과정을 통해 상세한 시각화가 가능하고 재난 예측 및 대응 의사결정을 지원한다.

2. 관련 연구

지리정보시스템(GIS)은 홍수 시뮬레이션에 있어 핵심적인 역할을 하며, 고급 홍수 위험관리를 위한 필수적인 공간 분석 도구를 제공한다. Dong et al.(2022)은 GIS와 딥러닝을 결합한 실시간 유역 홍수 모니터링 시스템을 개발하여 매우 높은 예측 정확도를 달성하였다. 유사하게, Wang et al. (2018)은 증거 가중치법과 랜덤 포레스트 모델을 활용한 GIS 기반의 홍수 위험 지도 작성 방법을 제안하여, 산사태 취약성 평가에서 GIS 기능을 강화하는 데 머신러닝이 갖는 강점을 입증하였다.
딥러닝(DL)은 모델의 정확도와 신뢰성을 개선함으로써 홍수 예측을 점점 더 혁신적으로 변화시키고 있다. Ali et al. (2022)은 기존 전통적인 방법을 훨씬 능가하는 DL 기반 홍수 예측 프레임워크를 제시하였으며, Sit et al.(2020)은 수문학 분야에서의 딥러닝 응용을 종합적으로 검토하면서 예측 모델의 정밀도를 개선하는 데 있어 DL의 영향을 강조하였다. Kratzert et al.(2019)은 수문학 데이터의 시계열 종속성을 고려한 예측을 위해 LSTM(Long Short-Term Memory) 네트워크를 적용하였고, 이를 통해 복잡하고 비선형적인 관계를 모델링하며 홍수 예측 정확도를 크게 향상시킬 수 있음을 보여주었다. 이들 연구를 종합하면, DL은 홍수 위험관리의 발전에 있어 매우 중요한 역할을 하고 있음을 알 수 있다.

3. 제안 방법

본 연구에서는 해안지역에서의 홍수 위험을 효과적으로 예측하기 위해, Convolutional Neural Network(CNN)과 Long Short-Term Memory(LSTM) 네트워크를 병렬 구조로 결합한 하이브리드 딥러닝 모델을 제안한다. 이 모델은 침수 여부가 라벨링된 시계열 이미지 데이터를 입력으로 사용하여, CNN은 각 시점의 이미지로부터 공간적 특징을 학습하고, LSTM은 연속된 이미지 시퀀스를 바탕으로 시간적 패턴을 학습한다. 이후 두 분기에서 생성된 특징 벡터를 병합(concatenate)하여 완전 연결 계층(Dense)을 통해 최종 침수 위험도를 예측한다. 홍수 시뮬레이션을 위한 데이터들은 ArcGIS Pro를 이용하여 전처리 되었으며, 홍수 예측 시뮬레이션 결과도 ArcGIS Pro로 제공 가능하다. ArcGIS Pro는 지도 데이터들을 기반으로 다양한 기능을 연계하거나 공간적 정보들을 활용할 수 있는 툴로, 본 연구에서 제안하는 홍수 예측 모델은 ArcGIS Pro를 기반으로 실제 공간에서 발생 가능한 다양한 재해에 대응하기 위한 시스템 개발의 목표 중 일부이다.
Fig. 1은 ArcGIS Pro 내에서 다양한 소스를 통합하여 홍수 수위 및 범람 지도를 생성하는 데이터 처리 흐름도를 보여준다. 이 프로세스는 지형고도 정보를 포함한 DEM(TIFF) 파일을 입력 받아서 Jupyter Notebook을 이용한 Surface Volume to CSV 도구를 통해 표면 체적을 계산하고 CSV 형식으로 출력된다. 이후 또 다른 Jupyter Notebook 프로세스를 통해 해당 CSV 파일을 활용하여 홍수 수위를 추정한다. 이러한 데이터는 최종적으로 연구 지역 전반에 걸친 여러 CSV 결과로 이어지며, ArcGIS Pro를 통해 수위 래스터 및 범람 영역 지도(SHP, TIFF 등)로 시각화된다. 도식의 범례에는 사각형은 처리 과정을, 그림자가 있는 사각형은 입력/출력 파일을 나타내며, 단일 또는 복수 파일 여부도 구분하여 표시된다.
Fig. 1
The main steps of the flood prediction and simulation model
JCDP-2025-12-2-107f1.jpg
Fig. 2는 ArcGIS Pro를 이용하여 시각화한 부산 지역의 디지털 고도 모델(DEM)로, 해안선은 빨간색, 수면선은 파란색으로 표시된다. 이 시각화는 지형과 수계 경계를 명확히 나타내어 해안 동역학과 홍수 위험 분석에 있어 필수적인 자료로 활용된다.
Fig. 2
Visualization of the study area: Digital Elevation Model (DEM) data displayed in ArcGIS Pro, highlighting the coastline in red and the waterline in blue across Busan city
JCDP-2025-12-2-107f2.jpg

3.1 ArcGIS Pro 기반 데이터 전처리

본 연구의 주요 목적은 ArcGIS Pro 내에서 과거 및 공간 데이터를 활용한 홍수 시뮬레이션 프레임워크를 개발하고, 제안한 홍수 예측 모델을 적용하여 극심한 홍수 조건에서의 성능을 입증하고자 하였다. 연구 대상 지역을 분석하기 위해, 조위, 해수면 상승, 기상 데이터, 과거 강수량, 부산 지역의 디지털 고도 모델(DEM) 파일 등을 포함한 공개 데이터셋을 활용하였다. 이러한 데이터셋은 홍수 예측 모델의 요구 사항에 맞게 전처리되었으며, 이에 대한 전체적인 처리 흐름은 Fig. 1에 자세하게 나타나 있다.
본 연구에서 제안하는 홍수 예측 모델은 ArcGIS Pro와의 연결을 통해 최적화 및 검증되었으며, 재난 대비 및 대응에 대한 의사 결정을 지원하는 상세한 시각화 및 분석 기능을 제공한다.
Fig. 1은 홍수 시뮬레이션 데이터 처리, 다양한 데이터 소스 및 도구를 ArcGIS Pro에 통합하여 홍수 높이 및 침수 지역 지도를 생성하는 프로세스를 보여준다. 사각형은 데이터 전처리 단계에서 수행되는 특정 프로세스를 나타내고 입력 및 출력 파일은 그림자가 있는 사각형으로 표현하였다. 또, 해당 기호들을 겹치거나 단일로 표현하여 전처리 단계에서 사용되는 파일이 단일 파일인지 다중 파일인지도 명확하게 파악할 수 있도록 하였다. 본 연구에서 제안하는 홍수 예측 시뮬레이션의 전체 프로세스에서 ArcGIS Pro를 통해 홍수 데이터의 공간 분석 및 시각화를 하고, 홍수 위험에 대한 상세한 매핑 및 평가를 수행할 수 있다. Fig. 2는 ArcGIS Pro를 사용하여 부산광역시 내 임의의 지역의 수치 표고 모델(DEM)을 시각화한 결과이다. 이 이미지에서 해안선은 빨간색으로, 수위선은 파란색으로 표시된다. 이 상세한 시각화는 해당 지역의 해안 역학 및 홍수 위험 분석에 필수적인 지형 및 수역 경계를 명확하게 보여준다. 입력 이미지 시계열은 디지털 고도 모델(DEM), GeoTIFF, 강수량, 조위, 해수면 온도 등 다양한 공간 및 기상 데이터를 ArcGIS Pro 기반으로 융합하여 생성되었으며, 수집된 데이터는 Q-GIS 및 Global Mapper를 통해 정규화되어 시계열 예측 학습에 적합한 구조로 구성되었다. 전체 데이터는 약 6개월간 수집된 기상 및 해양 데이터를 기반으로 구성되었으며, ArcGIS Pro 내 공간 타일 단위로 변환하여 64×64 크기의 시계열 이미지 약 5,000개를 생성하였다. 시간 데이터는 모든 공간 레이어와 동기화하였다. 침수 여부 라벨은 ArcGIS Pro에서 계산된 수위 기반 시뮬레이션 결과에서 특정 임계 수위(예: 0.5m)를 기준으로 이진화하여 생성된 것으로, 라벨링된 값은 이미지화되어 입력에 사용하였다.
아래 제안 모델의 설명에서는 모델의 구조와 작동 원리에 대한 이해도를 높이기 위해 64×64 크기의 단일 채널(1 channel)을 가지는 흑백 침수 지도 이미지로 입력 데이터 1개의 샘플을 구성하며, 해당 샘플은 총 10일간의 변화를 파악할 수 있는 시계열 형식의 이미지 시퀀스로 구성한다고 가정한다. 각 시점의 이미지는 해당 일자의 침수 상태를 나타내며 전체 시퀀스를 통해 10일간의 공간적 및 시간적 변화를 확인할 수 있다. 입력 텐서는 (B, T=10, H=64, W=64, C=1)의 다차원 구조를 가지며, 제안 모델은 CNN과 LSTM의 두 분기로 병렬 입력하여 각각 공간적 특징과 시간적 흐름을 독립적으로 학습하고 최종적으로 통합된 예측을 수행한다.

3.2 병렬 CNN 및 LSTM 분기 구조

Fig. 3은 해안지역에서의 홍수 위험을 효과적으로 예측하기 위해, Convolutional Neural Network(CNN)과 Long Short- Term Memory(LSTM) 네트워크를 병렬 구조로 결합한 하이브리드 딥러닝 모델의 구조를 보여준다. 이 모델은 침수 여부가 라벨링된 시계열 이미지 데이터를 입력으로 사용하여, CNN은 각 시점의 이미지로부터 공간적 특징을 학습하고, LSTM은 연속된 이미지 시퀀스를 바탕으로 시간적 패턴을 학습한다. 이후 두 분기에서 생성된 특징 벡터를 병합(concatenate)하여 완전 연결 계층(Dense)을 통해 최종 침수 위험도를 예측한다. 병렬로 구성된 CNN과 LSTM의 내부 구조와 연산 과정은 3.2.1절에서 자세하게 설명한다.
Fig. 3
Hybrid Flooding prediction model integration of CNN and LSTM
JCDP-2025-12-2-107f3.jpg

3.2.1 CNN 분기: 공간적 특징 학습

  • • Conv2D (32 filters, kernel=3×3, activation=ReLU)

  • • MaxPooling2D (2×2)

  • • Conv2D (64 filters, kernel=3×3, activation=ReLU)

  • • MaxPooling2D (2×2)

  • • Conv2D (64 filters, kernel=3×3, activation=ReLU)

CNN의 학습 과정에서는 특정 공간 패턴(예: 범람된 수로, 저지대 침수 영역 등)이 침수와 관련된 지형적 특징을 학습하게 된다. CNN 분기에서는 TimeDistributed 구조를 기반으로 각 시점의 이미지를 독립적으로 처리하며, 시계열 간의 연속성은 고려하지 않는다. 이는 지형적 변화가 어떤 상태인지에 대해서는 알 수 있지만, 해당 지역의 연속적인 지형적 변화까지는 고려하지 않는다는 말로 해석할 수 있다.
제안 모델의 CNN에서는 3단계의 합성곱(Convolutional)과 풀링(Pooling) 계층을 통해 각 이미지에서 공간적 패턴을 추출하고, 마지막 단계에서 1차원 벡터로 평탄화한다. CNN의Conv연산에ReLU함수를 적용한 수식은 다음과 같다:
(1)
Oi,j,k=ReLU(m,n,cWm,n,c,kIi+m,j+n,c+bk)
Eq. (1)에서 O는 출력 특징 맵, W는 필터 가중치, I는 입력 이미지 텐서, b는 바이어스로 정의된다. 따라서, Ii+m,j+n,c 는 입력 이미지 텐서에서 c번째 채널의(i+m,j+n) 위치의 픽셀 값이며, Wm,n,c,kk번째 필터의 m×n 위치에서 c채널에 대한 가중치이다. bk는 해당 필터의 바이어스이며, ReLU(•)는 활성화 함수로, ReLU(x)=max(0,x)의 형태로 비선형성을 부여한다. 이는 입력 x가 0 이하이면 0으로 만들고, 양수는 그대로 통과 시키는 것으로 이는 복잡한 패턴이나 비선형적 분포를 학습할 수 있게 만들어 준다. ReLU를 통해 계산된Oi,j,k는 CNN 출력 텐서의 k번째 채널에서(i,j)위치의 출력값을 의미한다. ReLU는 필터가 입력 이미지 위를 슬라이딩하면서 각 위치에서 입력 패치와 필터 간의 가중합을 계산하고, 음수는 제거한 후 양수만을 통과시키는 구조를 통해 CNN이 침수 경계, 도심 수로, 지형의 경사와 같은 공간 구조적 특징을 자동으로 감지하고 강조할 수 있게 한다. ConvReLU함수를 거친 결과값은 다시 MaxPooling연산이 적용되어 공간 차원을 축소하는 과정을 거친다. MaxPooling은 다음과 같은 수식으로 정의된다.
(2)
Pi,j,k=max(O2i+m,2j+n,k|m,n0,1)
Eq. (2)에서 Pi,j,k는 풀링된 출력 텐서에서 k번째 채널의 (i,j)위치값을 의미하며, 2×2 윈도우 내의 최대값을 취하여 지역적 특징을 요약한다. 이 과정을 통해 공간 해상도는 절반으로 줄어들면서도 가장 강력한 특징이 보존된다.
제안 모델에서 CNN은 훈련 데이터로부터 주어진 정답 레이블을 기반으로 반복적으로 오류를 줄이는 방향으로 가중치 W 와 바이어스 bk 를 최적화한다. 3.1절에서 밝힌 바와 같이, 64×64 크기의 단일 채널(1 channel)을 가지는 흑백 침수 지도 이미지 10장으로 구성된 1개의 샘플 데이터를 입력할 경우 CNN 출력은 평탄화되어 9216차원의 벡터로 변환되고 평균 풀링 또는 마지막 시점 벡터 선택 방식으로 요약되어 전체 시퀀스에 대한 공간 특징 벡터를 생성한다. 제안 모델에서 구성한 CNN은 일반적인 CNN의 구조와 연산 과정을 그대로 거친 후, Dense 계층에서 LSTM 결과와 함께 입력되어 예측에 활용된다.

3.2.2 LSTM 분기: 시간적 패턴 학습

LSTM 분기에서는 동일한 시계열 이미지 시퀀스를 입력으로 받아, 시간 흐름에 따른 픽셀 값의 변화나 공간 구조의 전개 양상을 기반으로 시계열적 침수 패턴을 학습한다. CNN의 설명과 마찬가지로64×64사이즈의 1채널 흑백 이미지 데이터 10장으로 구성된 샘플 1개를 입력 데이터를 사용하는 것으로 가정한다.입력 시퀀스는 (B, T=10, H=64, W=64, C=1)의 형상으로 투입되며, 전처리 과정을 통해 각 시점의 이미지를 평탄화하여 (B, T=10, F=4096) 형태의 시계열 벡터로 변환한 후 다음과 같은 LSTM 계층에 전달된다.
  • • LSTM Layer 1 (128 units, return_sequences=True)

  • • LSTM Layer 2 (128 units, return_sequences=False)

이 구조는 LSTM이 시계열 전체를 순차적으로 읽어가며 시간 흐름에 따른 침수 패턴의 변화를 학습할 수 있도록 구성되어 있다. LSTM은 각 시점에서 과거 은닉 상태와 현재 입력을 바탕으로 게이트 연산(입력 게이트, 망각 게이트, 출력 게이트)을 수행하고, 시계열 데이터의 내재된 시간적 의존성을 반영한 최종적으로 은닉 상태 벡터 h10R128 을 생성한다. 이 벡터는 10일 간의 누적된 시계열 정보를 요약한 벡터로, 학습 과정에서는 LSTM이 출력한 최종 은닉 상태 벡터h10가 침수 여부와 관련된 시간적 특징을 잘 반영할 수 있도록, 라벨과의 오차를 기반으로 가중치가 반복적으로 조정된다. 이는 단순히 이미지의 현재 상태를 학습하는 것이 아니라, 수일에 걸친 수위 상승, 물 흐름 변화, 침수 영역 확산 등과 같은 시간 축 상의 연속적 변화를 반영하는 패턴을 학습하는 데 초점을 둔다. LSTM의 내부 연산은 다음과 같이 정의된다
(3)
ft=σ(Wfxt+Ufht1+bf)
(4)
it=σ(Wixt+Uiht1+bi)
(5)
C˜t=tanh(Wcxt+Ucht1+bc)
(6)
Ct=ftCt1+itC˜t
(7)
Ot=σ(Woxt+Uoht1+bo)
(8)
ht=ottanh(Ct)
위 Eq. (3)에서 Eq. (8)까지의 연산을 통해 LSTM은 긴 시계열에서도 과거 정보를 효과적으로 유지하고, 침수와 관련된 시계열적 변화(예: 수위 상승 패턴, 침수 확산 양상 등)를 학습할 수 있게 된다. 게이트 연산을 통해 과거 정보와 새로운 정보를 동적으로 조절하면서 축적된 시간 정보를 반영한 은닉 상태 벡터ht를 생성하며, 최종 시점의 벡터h10은 시퀀스 전체의 의미를 요약한 표현으로 사용된다. 출력된 마지막 은닉 상태 벡터h10은 시계열 전체의 요약 정보를 포함하며, CNN 출력과 병합된다.

3.3 특징 병합 및 예측 단계

본 모델은 CNN과 LSTM 분기에서 각각 추출한 공간적 특징 벡터와 시간적 특징 벡터를 병합(concatenation) 함으로써, 두 분기에서 학습된 정보를 통합한다. CNN 출력 벡터는 각 시점의 이미지에서 추출된 공간 패턴을 반영하는데 사용되며, LSTM 출력 벡터는 전체 시퀀스를 따라 계산된 최종 은닉 상태 벡터로 시계열의 요약 정보가 포함되어 침수가 발생하는 과정에서 보이는 연속적인 변화를 분석하는데 사용된다. 이 두 벡터는 하나의 특징 벡터 f_merged로 병합되어 다음의 Dense 계층에 입력된다.
  • • Dense Layer 1 (64 units, ReLU) : 병합된 벡터 f_merged를 입력 받아 비선형 변환을 수행하며, CNN과 LSTM에서 추출된 특징 간의 상호작용을 학습한다.

  • • Dense Layer 2 (1 unit, Sigmoid) : sigmoid 활성화 함수를 통해 0~1 사이의 침수 확률 값을 출력한다. 임계값 (0.5)을 기준으로 침수 여부를 확인한다.

최종 출력은 침수 확률(0~1)로 해석되며, 일반적으로 0.5 이상일 경우 침수 위험이 있다고 판단한다. 학습 시에는 실제 라벨과의 오차를 기반으로 전체 모델의 가중치가 최적화되며, 예측 시에는 학습된 모델 구조를 고정하여 침수 여부를 판단한다. 출력되는 확률은 단순한 분류 결과를 넘어 시계열 기반의 위험도 점수로 해석될 수 있으며, 실시간 침수 경보 체계의 주요 지표로 활용 가능하다. Fig. 4는 순차적인 이미지 데이터를 처리하기 위해 합성곱 신경망(CNN)과 장단기 메모리(LSTM) 네트워크를 결합한 하이브리드 딥러닝 모델의 결과를 보여준다. Fig. 4는 ArcGIS Pro의 기하학적 간격 분류를 활용한 유량 누적 분석 결과를 시각화한 것이다. 밝은 노란색은 전체 지형을, 파란색 선은 주요 수로 및 유량 경로를 나타낸다. 빨간색 구역은 집중호우 또는 해안 홍수 시 침수 위험이 높은 지역이며, 파란색 음영은 인접한 해역을 의미한다. 이 시각화는 지역 내 물 흐름 축적 양상과 침수 가능성을 직관적으로 파악하는 데 도움을 준다.
Fig. 4
Flood modelling results of water flow using geometric interval classification in ArcGIS Pro
JCDP-2025-12-2-107f4.jpg
모델 학습에는 Table 1과 같은 주요 하이퍼파라미터를 사용하였다. 이 설정은 검증 데이터셋을 기반으로 튜닝되었다.
Table 1
Hyperparameters for proposed method
Hyperparameter Value
Epoch 100

Batch Size 32

Optimize Adam

Learning Rate 0.001

CNN Filter 32

Kernel Size 3×3

LSTM Unit 128

Dropout Rate 0.3

4. 실험 결과

제안된 모델의 학습에는 시간, 메모리, 연산 성능 등 상당한 기술 자원이 요구되었으며, 이를 위해 GPU 환경인 NVIDIA GeForce RTX 3060을 사용하여 실험을 수행하였다. CNN과 LSTM 모델은 각각 독립적으로 학습된 후, 두 구조의 출력을 통합하여 최종 예측을 수행하는 하이브리드 모델로 구성되었다. CNN은 이미지의 공간적 특성을 병렬로 처리할 수 있어 학습 시간이 약 9분으로 가장 짧았으며, 반면 LSTM은 시계열 데이터를 순차적으로 처리하기 때문에 약 11분이 소요되었다. 흥미롭게도 CNN과 LSTM을 병렬적으로 결합한 하이브리드 모델은 구조적으로 더 복잡함에도 불구하고, 모델 최적화 설정을 통해 약 8분 만에 학습을 완료하였다.
모델의 예측 성능은 Table 2에서와 같이 머신러닝 기반 분류 모델의 표준 평가 지표인 정밀도(Precision), 재현율(Recall), F1 점수(F1-score), Macro 평균, Weighted 평균을 기준으로 분석되었다. 이들 지표는 단순한 정확도 이상의 정보를 제공하며, 예측의 신뢰성과 실효성을 다면적으로 평가할 수 있도록 해준다. 전체 데이터는 학습 70%, 검증 15%, 테스트 15%로 분할하였으며, Table 2는 학습이 완료된 모델에 테스트 데이터 세트를 사용하여 성능 평가를 수행한 결과를 나타낸다.
Table 2
Test results of the flooding prediction models
CASE Precision Recall F1-score Macro.avg Weighted.avg
CNN 0.948 1.00 0.975 0.95 0.93
LSTM 0.961 0.975 0.982 0.96 0.95
Hybrid 0.957 0.942 0.942 0.97 0.97
먼저, 정밀도는 모델이 예측한 ‘홍수 발생’ 중 실제로 발생한 비율을 의미하며, 잘못된 경보(False Positive)를 얼마나 억제했는지를 나타낸다. 재현율은 실제 홍수 발생 중 모델이 이를 얼마나 잘 탐지했는지를 보여주는 지표로, 놓친 홍수(False Negative)가 얼마나 적은지를 평가하는 데 핵심적인 역할을 한다. F1 점수는 정밀도와 재현율의 조화 평균으로, 두 지표 간의 균형을 기반으로 모델의 종합적 예측 성능을 나타낸다. 예측 성능을 하나의 숫자로 요약하면서도 불균형을 보완해주기 때문에, 홍수 예측과 같은 응용 분야에서 매우 유용한 평가 척도다.
Macro 평균은 클래스별(홍수 발생/비발생) 지표를 각각 산출한 뒤 단순 평균을 내는 방식으로, 클래스 간 데이터의 비율과 무관하게 각 클래스에 동일한 가중치를 부여한다. 이는 데이터가 불균형한 환경에서도 소외된 클래스의 성능을 균형 있게 반영할 수 있다는 장점이 있다. 반면, Weighted 평균은 클래스별 샘플 수를 고려해 전체 분포를 반영하므로, 현실적 데이터 구성에서의 평균 성능을 보여주는 실용적인 지표로 활용된다.
실험 결과, CNN 모델은 정밀도 94.8%, 재현율 100%, F1 점수 0.975를 기록하며 강수 이벤트 탐지에 매우 뛰어난 성능을 보였다. 특히 재현율 100%는 실제 발생한 모든 홍수 사건을 탐지했다는 점에서, 위험 회피가 최우선인 재난 대응 또는 경보 시스템에 매우 적합한 모델임을 나타낸다. LSTM 모델은 정밀도 96.1%, F1 점수 0.982로 가장 높은 정밀성과 종합 성능을 보였다. 이는 잘못된 경보를 최소화하면서도 실제 탐지 성능 또한 뛰어난 모델임을 의미하며, 정책적 의사결정이나 자원 운영이 중요한 현장에 적합하다. 하이브리드 모델은 CNN과 LSTM의 장점을 결합하여 정밀도 95.7%, 재현율 94.2%, F1 점수 0.942를 달성하였고, 특히 Macro 평균과 Weighted 평균 모두 0.97로 클래스 간 일관성 있는 성능과 실용적 예측력을 동시에 보여주었다. 이러한 수치를 바탕으로 각 모델 간의 성능을 종합적으로 비교해보면, 제안된 Hybrid 모델이 단순히 평균적으로 높은 성능을 보였다는 것에 그치지 않고, 실용성과 확장성 측면에서도 강점을 갖는다는 점을 확인할 수 있다. CNN 모델은 모든 홍수 발생 사례를 놓치지 않고 탐지하는 뛰어난 재현율을 보여 조기 경보 시스템이나 실시간 감시 환경에 적합하다. 반면 LSTM 모델은 정밀도와 F1 점수가 가장 높아, 거짓 경보를 최소화하면서도 높은 정확도를 유지할 수 있는 구조로, 자원 효율성과 판단 신뢰성이 요구되는 정책적 환경에 유리하다.
제안된 Hybrid 모델은 이러한 두 모델의 구조적⋅기능적 장점을 병렬적으로 융합한 형태로 설계되어, 공간 정보 처리(CNN)와 시계열 패턴 학습(LSTM)의 특성을 모두 반영한다. 실험 결과에서도 나타나듯이 Hybrid 모델은 Macro 평균과 Weighted 평균이 모두 0.97로 가장 높아, 클래스 간 균형 잡힌 예측 성능을 달성하였고, 이는 실제 현장처럼 데이터 불균형이 존재하는 환경에서도 안정적이고 일관된 성능을 유지할 수 있는 가능성을 보여준다. 이와 같은 성능 특성은 향후 다양한 재난 유형, 지역적 조건, 운영 목적에 따라 모델을 유연하게 적용할 수 있는 기반이 되며, 단순 예측 정확도를 넘어선 실질적인 활용성과 전략적 가치를 갖는 모델로 판단된다.

5. 결 론

본 연구는 ArcGIS Pro 기반의 공간 분석 기능과 딥러닝 기반 예측 모델을 융합하여, 해안지역에서 발생할 수 있는 홍수 위험을 효과적으로 시뮬레이션하고 예측할 수 있는 통합 프레임워크를 제안하였다. 특히, CNN과 LSTM의 장점을 병렬 구조로 결합한 하이브리드(Hybrid) 모델을 중심으로 예측 정확도와 처리 효율성을 모두 고려한 구조를 설계하였다.
부산 지역의 디지털 고도 모델(DEM), 조위, 해수면 상승, 강우량 등의 다양한 공간⋅시간 데이터를 활용하여 제안 모델을 학습한 결과, CNN은 재현율 100%로 모든 홍수 사건을 탐지할 수 있는 특성을 보여주었고, LSTM은 정밀도와 F1-score에서 가장 높은 값을 기록하며 오탐률을 최소화하는 데 효과적인 성능을 보였다. 제안된 하이브리드 모델은 두 모델의 장점을 통합하여, 정밀도와 재현율 간의 균형을 유지하면서도 Macro 평균과 Weighted 평균 지표에서 가장 높은 수치를 기록하였다. 이는 단순히 예측 정확도뿐만 아니라, 클래스 간 성능의 일관성과 데이터 불균형에 대한 대응 능력 면에서도 하이브리드 모델이 실용적인 우수성을 지닌다는 것을 의미한다.
이와 같은 결과는 제안된 모델이 단순 이론적 성능 향상을 넘어, 실제 재난 관리와 예측 기반 정책 수립에 적용될 수 있는 실질적 가능성을 지니고 있음을 시사한다. 특히 ArcGIS Pro와의 통합은 시뮬레이션 결과를 직관적으로 시각화함으로써, 비전문가인 정책 결정자 및 현장 대응자에게도 예측 결과를 효과적으로 전달할 수 있는 기반을 제공한다는 점에서 활용 가치가 높다.
따라서 본 연구는 공간 정보 처리와 딥러닝 기술을 융합하여 해안 홍수 예측 시스템의 고도화를 달성하였다는 점에서 학문적⋅실용적 의의를 지닌다. 특히, 공간 데이터와 시계열 데이터를 복합적으로 학습할 수 있는 하이브리드 딥러닝 아키텍처를 설계하고, 다양한 모델 간의 실험적 성능 비교를 통해 각 구조의 상대적 장단점을 체계적으로 분석하였다. 또한, ArcGIS Pro 기반의 시각화 기능과 연계함으로써 예측 결과를 직관적으로 표현할 수 있는 해안 홍수 예측 시스템의 구현 가능성을 실증적으로 입증하였다.
향후 연구에서는 입력 변수 확장(예: 토지 이용 정보, 배수 인프라 데이터 등), 실시간 데이터 수집 및 자동 학습 시스템 구현, 복합 재난(해일, 태풍, 폭우 등) 상황에 대한 예측 모델로의 확장 등을 고려할 수 있을 것으로 예상된다. 일반적으로 시공간 학습에는 ConvLSTM이 널리 사용되지만, 본 연구에서는 CNN과 LSTM을 병렬 구조로 연결하여 CNN과 LSTM의 강점을 가지면서 모델의 유연성을 확보하고자 하였다. 향후 연구에서 CNN과 LSTM을 직렬로 연결하여 CNN으로 공간적 특징을 학습한 후 LSTM에서 각 프레임 별 변화의 연속성을 학습하여 시퀀스에서의 예측을 하는 방법과 본 제안 방법과의 비교를 통해 침수 예측에 더 적합한 예측 모델이 무엇인지 비교하는 연구도 수행할 예정이다. 또한, 국내외 다양한 해안도시 지역을 대상으로 일반화된 모델의 적용 가능성을 검토함으로써, 기후위기에 대응하는 연안지역 침수 및 홍수 회복력 향상 전략으로 발전시킬 수 있을 것으로 기대된다.

감사의 글

This research was funded by the Ministry of Trade, Industry, and Energy (MOTIE) of Korea under the “Regional Innovation Cluster Development Program (PN92750, P0025418)”, supervised by the Korea Institute for Advancement of Technology (KIAT). This research was also supported by KIOST In-house Project (PEA0331), “Research of Prediction Techniques to Reduce Damage from Marine Disasters”.

REFERENCES

1. Ali, M.H.M., Asmai, S.A., Abidin, Z.Z., Abas, Z.A., Emran, N.A. (2022). "Flood prediction using deep learning models." International Journal of Advanced Computer Science and Applications, Vol. 13, No. 9, pp. 972-981.
crossref
2. Dong, S., Yu, T., Farahmand, H., Mostafavi, A. (2022). "Predictive multi-watershed flood monitoring using deep learning on integrated physical and social sensors data." Environment and Planning B:Urban Analytics and City Science, Vol. 49, No. 7, pp. 1838-1856.
crossref pdf
3. Kirezci, E., Young, I.R., Ranasinghe, R., Muis, S., Nicholls, R.J., Lincke, D., Vafeidis, A.T., Hinkel, J. (2020). "Projections of global-scale extreme sea levels and resulting episodic coastal flooding over the 21st Century." Scientific Reports, Vol. 10, No. 1, pp. 11629p.
crossref pmid pmc pdf
4. Kratzert, F., Klotz, D., Brenner, C., Schulz, K., Herrnegger, M. (2019). "Toward improved predictions in ungauged basins:Exploiting the power of machine learning." Water Resources Research, Vol. 55, No. 12, pp. 11344-11354.
crossref pdf
5. Park, S.J., Lee, D.K. (2020). "Prediction of coastal flooding risk under climate change impacts in South Korea using machine learning algorithms." Environmental Research Letters, Vol. 15, No. 9, pp. 094052p.
crossref pdf
6. Sit, M., Demiray, B.Z., Xiang, Z., Ewing, G.J., Sermet, Y., Demir, I. (2020). "A comprehensive review of deep learning applications in hydrology and water resources." Water Science &Technology, Vol. 82, No. 12, pp. 2635-2670.
crossref pmid pdf
7. Wang, P., Bai, X., Wu, X., Yu, H., Hao, Y., Hu, B.X. (2018). "GIS-based random forest weight for rainfall-induced landslide susceptibility assessment at a humid region in southern China." Water, Vol. 10, No. 8, pp. 1019.
crossref
TOOLS
METRICS Graph View
  • 0 Crossref
  •  0 Scopus
  • 139 View
  • 17 Download
Related articles


ABOUT
BROWSE ARTICLES
EDITORIAL POLICY
FOR CONTRIBUTORS
Editorial Office
1105ho, 280, Gwangpyeong-ro, Gangnam-gu, Seoul 06367, Korea
Tel: +82-2-444-7494    Fax: +82-2-444-7264    E-mail: kscdp@kscdp.or.kr                

Copyright © 2025 by Korean Society of Coastal Disaster Prevention.

Developed in M2PI

Close layer
prev next