1. 서 론
월파 현상은 주로 파고와 해안구조물 마루높이에 의해 좌우되고, 파도의 불규칙성 때문에 연속적으로 발생하지 않으며 내습하는 파도의 특성에 따라 불규칙적으로 발생한다(Goda, 2010). 이러한 특성을 고려하여 월파량(overtopping discharge)의 단위는 평균적인 개념으로 구조물 연장의 단위 폭 및 단위 시간당 월파 수량 부피로 나타내며 q(m3/s/m)로 표기한다. 월파량은 항만구조물 설계 시 주요한 설계 인자로써 국내 항만 및 어항설계기준⋅해설(해양수산부, 2017)에서는 항만구조물의 마루높이 및 구조의 설계 시 월파 허용량이 중요한 요소이며, 배후지역의 사용 용도에 따라 적절히 선정해야 한다고 언급하고 있다. 따라서 다양한 구조물 형식과 마루높이에 대하여 월파량을 정확히 계산하는 것은 필수적이며, 이를 통해 배후지의 중요성에 따라 결정된 허용 월파량을 만족시키는 적절한 설계가 가능하다.
우리나라 항만 및 어항 설계기준⋅해설(2017)에서는 월파량 산정을 위해 기존의 연구성과를 이용할 수 있도록 하였지만, 이는 일본 항만설계기준 및 동해설(일본 국토교통성, 2007)에 수록된 월파량 산정도표(Goda, 1975)를 그대로 사용하는 것으로 최신의 연구성과를 반영하고 있지 못하고 있다. Goda(1975)의 월파량 산정도표는 대상 구조물 형식과 파랑 조건이 제한적일 뿐만 아니라 상대수심이 대략 3.6 이상에 대해서는 준 이론적 결과의 외삽(extrapolation)을 통하여 산출하였기 때문에 결과에 대한 신뢰성 문제가 발생한다. 또한, 도표를 통해 월파량 값을 산정해야 하기 때문에 작업자에 따라 다소 상이한 결과가 도출될 가능성이 있다.
해외에서는 월파에 대한 연구가 활발하게 진행되고 있다. 미국의 CEM(USACE, 2006)의 경우 다양한 구조물 형식에 대하여 Owen et al.(1982), Bradbury and Allsop(1988) 등의 연구성과들을 제시하고 있다. 유럽에서는 세계 각국의 실험 데이터들을 수집 및 분석하고 다국적 연구자들이 참여하여 작성한 쳐오름과 월파량에 대한 별도의 매뉴얼인 EurOtop (Pullen et al., 2007)을 최초로 발행하여 많은 프로젝트에서 설계기준으로 사용되었으며, 이후 진행된 연구성과들을 반영한 개정판 EurOtop(2016)과 EurOtop(2018)을 발간하였다. EurOtop(2018)은 방대한 데이터베이스를 기반으로 작성된 매뉴얼로서 다양한 구조물 형상과 피복 재료에 따른 산정식을 별도로 제공하고 있다.
국내 설계기준(해양수산부, 2017)에서 제시한 월파량 산정도표는 다양한 해상조건을 갖는 우리나라의 해역특성과 다양해진 항만구조물에 적용하기에 제한되는 사항이 많다. 따라서 빅데이터에 기반하여 산출된 EurOtop(2018)과 같이 범용적으로 적용 가능한 월파량 산정방법에 대한 연구의 필요성이 지속적으로 제기되고 있다. 이에 본 연구에서는 EurOtop 데이터베이스를 기반으로 세 가지 형식의 월파 제어 구조물(Fig. 1)에 대한 월파량 산정 모델을 심층신경망(DNN, Deep Neural Network) 기법을 적용하여 구축하였다. 각 모델의 학습과 평가는 서로 다른 데이터셋에 대하여 수행하도록 구성하였으며, 수립된 최적의 심층신경망 모델을 통해 다양한 구조물 형상과 외력조건에 대한 월파량을 산정하였다. 심층신경망 모델의 성능을 검토하기 위해 다중 선형회귀 분석을 동일한 데이터베이스를 통해 도출하였고, 월파량 산출 결과를 비교하여 성능을 검토하고 정량적인 분석 결과를 제시하였다. 본 연구의 주요 내용과 흐름은 Fig. 2와 같다.
2. 신경망 학습데이터
2.1 차원해석
월파량에 영향을 미치는 인자에는 크게 구조적인 특성, 파랑의 특성 및 자연적 특성으로 분류할 수 있다. 구조적인 특성에는 대표적으로 천단고(Rc), 마루여유고(Ac), 구조물 경사(cotα), 피복재의 거칠기 계수(γf) 등이 있고, 파랑 특성으로는 파고(H), 파장(L) 그리고 자연적 특성으로는 수심(h), 해저면경사(S) 및 중력(g)이 있다. 이들 인자들의 물리적 의미 파악과 무차원 관계식을 수립하기 위해 Buckingham’s II 이론(김경호, 2010)을 사용하여 차원해석(dimensional analysis)을 수행하였고 결과를 Eq. (1)에 나타내었다.
Eq. (1)에서 보는 바와 같이 무차원 월파량은 7개의 무차원 변수의 함수로서 나타낼 수 있으며 여기서 Rc/H는 상대 천단고, Ac/H는 상대 마루여유고, H/L은 파형경사, h/H는 상대수심을 의미한다.
2.2 EurOtop 데이터베이스
초기 EurOtop 데이터베이스는 European research program인 CLASH 데이터베이스(van der Meer et al., 2009)를 기반으로 하였다. CLASH 데이터베이스(van der Meer et al., 2009)는 전 세계 자료를 수집하여 약 10,000개의 데이터셋을 구성하였다. 이후 CLASH 데이터베이스의 오류를 수정하고, Bologna 대학에서 THESEUS 프로젝트(Zanuttigh et al., 2014)의 자금을 일부 지원받아 추가적인 작업을 통해 약 17,000개 이상의 데이터셋으로 확장하였으며, Formentin et al. (2017) 및 Zanuttigh et al. (2016) 등의 연구내용 또한 반영되었다. EurOtop 데이터베이스는 총 42개의 파라미터로 구성되어 있으며 Fig. 3에 CLASH에 기반한 구조물 모식도를 나타내었다. Zanuttigh and van der Meer (2008) 이래로 EurOtop 데이터베이스를 구조물의 형상과 파랑조건에 따라 Table 1과 같이 7개로 분류하였다. 본 연구에서는 구조물의 형식을 경사식 소파호안(A+B+C), 경사호안(D), 직립호안 (F)으로 분류하여 각각의 심층신경망 모델을 구축하고 학습하였다.
2.3 학습데이터 전처리
월파량에 영향을 미치는 인자들은 EurOtop 데이터베이스가 42개의 파라미터로 구성되어 있는 것과 같이 다양하게 선정할 수 있다. 하지만 본 연구에서는 가장 영향이 클 것으로 생각되는 파라미터들을 Eq. (1)과 같이 선정하였기에 EurOtop 데이터베이스에서 해당되는 파라미터를 취사선택하여 사용하였고, 심층신경망 학습에 사용할 수 있는 데이터들을 선별하였다. 첫째로 월파량이 0인 데이터는 예측변수들과 종속변수의 연속적인 관계를 파악하는 회귀문제에서는 불연속점으로 작용할 수 있기에 삭제하였다. 두번째로는 동일한 저자의 실험에서 이상치(outlier)로 보이는 값들은 주관적인 판단하에 삭제하였다. 마지막으로 Berm의 영향은 무시하였으며 기타 부적절한 데이터들을 삭제하였다. 상기의 작업 후 데이터 개수는 경사식 소파호안 2,813개, 경사호안 2,252개, 직립호안 2,039개로 감소하였다.
앞선 과정을 통해 선별한 데이터들을 Eq. (1)과 같이 무차원 변수 형태로 변환하였다. 이때, 경사호안의 거칠기 계수는 Fig. 4에서 나타난 것과 같이 3가지 값만 가지며 이러한 데이터 분포를 갖는 변수는 회귀 문제에서 무의미하고 심층신경망의 학습과정에서 결과에 미치는 영향이 매우 적고 신경망의 복잡도만 증가시킨다. 따라서 경사호안 심층신경망 모델의 경우 Eq. (1)의 7가지 무차원 변수에서 거칠기 계수를 제외한 함수 형태로 수정하였다. 직립호안 심층신경망 모델의 경우 거칠기 계수와 구조물 경사는 적용되지 않으므로 Eq. (1)에서 두 변수를 제외하였다.
무차원 변수의 형태로 나타낸 데이터들을 정규화(normalization)하기 위해 Eq. (2)에 나타낸 최소-최대 정규화 공식을 사용하여 심층신경망 학습을 위한 최종적인 데이터 형태로 가공하였다. 각 월파량 산정 모델에 사용되는 데이터들은 랜덤하게 60:20:20 비율의 훈련데이터, 검증데이터, 테스트데이터로 분리하여 사용하였다. 경사식 소파호안과 직립호안의 경우 월파량이 상대적으로 매우 큰 일부 데이터로 인해 대부분의 월파량 학습데이터가 정규화 이후 0 근처로 변환되기 때문에 월파량이 너무 큰 데이터들은 학습데이터에서 제외하였다. 제외한 데이터들은 테스트데이터에 포함시켜 큰 월파량값에 대한 심층신경망의 예측 성능을 평가할 수 있도록 하였다.
3. 심층신경망 기반 월파량 추정
3.1 초기 심층신경망 구축
본 연구에서 심층신경망 학습은 R 프로그램의 ANN2 패키지를 사용하여 수행하였다. ANN2 (Lammers, 2020) 패키지는 은닉층의 개수 및 뉴런의 개수, 비용함수, 활성함수, 최적화 기법, 학습률, 학습횟수, 정칙화 기법 등의 다양한 하이퍼 파라미터를 선택하고 설정할 수 있다.
심층신경망 구축을 위해 Fig. 5와 같은 신경망 구조를 구성하였다. 신경망에 기본적인 하이퍼 파라미터들을 설정하고 학습을 진행시켜 봄으로써 학습에 사용하는 데이터별로 적합한 하이퍼 파라미터를 선정하여 경사식 소파호안, 경사호안, 직립호안 각각의 심층신경망 학습 모델을 구축하였다. 경사식 소파호안의 학습 모델을 M1, 경사호안의 학습 모델을 M2, 직립호안의 학습 모델을 M3라고 하였으며, 1차적으로 선정한 초기 심층신경망의 하이퍼 파라미터는 Table 2와 같다. 학습 모델별로 활성함수의 종류, 학습률, 은닉층의 개수, 은닉층 노드의 개수를 세 가지씩 조합하여 총 81개의 조건에 대해 학습을 수행하였다. 학습 횟수(epoch)는 몇 번의 시험 테스트 결과 오차의 수렴이 빠르게 진행되고 이후 학습진행에 따라 완만하게 감소하였기 때문에 1,000회로 통일하였다.
학습 결과는 Eq. (3)에 나타낸 평균 로그 제곱근 오차(RMSLE, Root Mean Square Logarithmic Error)를 사용하여 평가하였다. RMSLE는 상대적인 오차를 측정하기 때문에 절대적 크기에 따라 변동이 생기지 않는 평가 결과를 얻을 수 있다. 또한, 예측 결과가 과소평가된 경우 과대평가된 경우보다 더 큰 RMSLE가 산출되기 때문에 보수적으로 평가해야 하는 월파량의 평가 기준으로서 적절하다고 볼 수 있다. 계산 과정에서 예측값이 음수가 되는 경우는 계산이 불가피하기에 제외하고 계산하도록 코딩하였다.
여기서, yi는 실제값, y ^ i 는 예측값, n은 데이터의 개수이고 p는 편향(절편)을 제외한 입력변수(예측변수)의 개수이다. 학습 결과는 무작위로 부여된 초기 가중치에 따라 모두 다른 결과를 나타내고 그 성능의 편차가 초기에 심층신경망을 구성할 때 특히 크다. 따라서 81가지의 학습조건에 대해 각각 3회씩 반복 수행하여 그 중 RMSLE가 가장 낮은 모델을 선택하였다. 학습결과 각 구조물 형식에 대하여 RMSLE가 가장 낮은 조건과 큰 조건을 Table 3에 나타내었다. Table 3에서 보는 바와 같이 RMSLE가 가장 높게 나타난 학습조건에서의 활성함수는 모두 Sigmoid였으며, Fig. 6에 나타난 것처럼 경사소실로 인해 학습이 진행되지 않아 모든 조건에 대해 같은 결과가 산출되었다. 반대로, RMSLE가 가장 낮게 나타난 학습조건에서의 활성함수는 모두 ReLU였다. 따라서 최적 심층신경망의 활성함수로 ReLU를 채택하였으며, tanh의 경우 M1, M2, M3에서 가장 낮은 RMSLE가 각각 0.8586, 0.5468, 0.7159로 나타나 Simoid보다는 개선되었으나 ReLU보다는 성능이 낮아 최적 심층신경망의 활성함수로 채택하지 않았다. 학습조건 M1-60은 월파량이 큰 구간에서 과소평가하는 경향이 나타났으며, 예측값이 관측값과 같은 대각선을 기준으로 분산이 크게 나타났다(Fig. 6). 이에 반해 M2-63의 경우 Fig. 6과 같이 월파량이 작은 경우에 분산이 커지는 경향이 나타나지만 공학적으로 의미가 큰 월파량이 큰 구간에서 좋은 성능을 보여주고 있으며, RMSLE값이 0.5170으로 전체 81개의 학습조건 중 가장 낮게 나타났다. 직립호안의 경우는 경사식 소파호안과 직립호안의 중간 정도의 결과가 나타났다(Fig. 6).
3.2 최적 심층신경망 구축
초기 심층신경망 모델의 성능 향상을 위해 ANN2 패키지에서 제공하는 정칙화와 최적화 기법을 적용하였다. 정칙화는 L2 규제를 사용하였고 하이퍼 파라미터 λ의 값을 5가지(0.1, 0.3, 0.5, 0.7, 0.9)로 설정하였다. 최적화는 초기 심층신경망 학습에 사용된 MGD(Mini-batch gradient descent)에 RMSProp와 Adam 최적화 기법을 추가하였다. 초기 심층신경망에서 구조물 형식별로 RMSLE가 가장 낮게 나타난 모델(M1-60, M2-63, M3-57)에 정칙화 5가지, 최적화 3가지를 조합한 15개의 학습조건을 적용한 학습 모델 중 최상의 결과를 나타낸 조건을 Table 4에 나타내었다.
정칙화 및 최적화를 적용한 최적 심층신경망의 RMSLE 값이 모든 학습 모델에서 감소하였고, Fig. 7에서 보는 바와 같이 월파량 예측 성능이 개선된 것을 확인할 수 있다. 최적 심층신경망의 공통적인 특징으로는 활성함수로 ReLU 함수, 학습률은 0.001, 은닉층 노드의 개수는 30개를 사용하였다는 점이다.
3.3 월파량 산정결과 비교분석
앞서 구조물 형식별로 다양한 조건의 심층신경망 모델을 구성하고 이들의 월파량 산정결과를 평가하여 최적의 심층신경망 모델을 구축하였다. 구축된 심층신경망 월파량 산정 모델의 타당성 검토와 성능 비교를 위해 인공신경망과 유사점이 많은 다중선형회귀 분석을 수행하여 월파량 산정 회귀식을 도출하였다. 각 구조물 형식별로 도출한 월파량 산정 회귀식은 Eq. (9)~(11)과 같으며, 경사식 소파호안, 경사호안, 직립호안 순으로 나타내었다.
구조물 형식별로 심층신경망이 산정한 결과와 회귀식 및 EurOtop 공식으로 산출한 월파량 결과 Fig. 8에 같이 나타내었다. 경사식 소파호안의 경우 심층신경망 M1-60-14의 결과는 대각선 부근에 밀집하여 분포하고 있어 실제값과 예측치의 차이가 적게 나타났으며, RMSLE 값은 회귀식 Eq. (9)의 0.9096보다 낮은 0.6543이 산출되었다. 다만 월파량이 매우 큰 10-1 부근에서는 과소평가 되는 경향이 나타났으며, 월파량이 대략 10-5 보다 작은 구간에서는 월파량 예측치가 음수로 산출되는 문제가 존재하였다. 경사식 소파호안 구조물에서 소파블럭의 종류는 매우 다양하며, 소파블럭에 의한 파랑의 쇄파과정은 매우 복잡한 비선형성을 갖는다. 따라서 강한 비선형성을 보이는 파랑의 쇄파 현상을 소파블럭의 종류에 따라 구분한 거칠기 계수로 담아내기에는 한계가 있는 것으로 판단되며, 이와 같은 이유로 다른 구조물 형식보다 분산이 크게 나타난 것으로 사료된다. EurOtop 공식의 경우 월파량 10-5 ~ 10-4 부근에서 실제 월파량에 비해 과소평가되었다. 경사호안의 경우 Fig. 8에서 보는 바와 같이 예측치의 분산이 적은 높은 예측 성능이 나타났다. 예측치의 분산성은 월파량이 작아질수록 커지는 경향을 나타내지만, 공학적으로 유의미한 월파량이 큰 구간에서는 대각선 부근에 분포하는 것을 확인할 수 있다. RMSLE 값은 심층신경망 M2-63-10의 경우 0.3782, 회귀식 Eq. (10)의 경우 0.5124, EurOtop 공식의 경우 0.5793으로 산출되었다. 직립호안의 경우 경사호안과 마찬가지로 공학적으로 의미가 큰 월파량이 큰 구간에서는 3가지 방법 모두 좋은 예측 성능이 나타났으나, 월파량이 작은 구간에서는 분산성이 커지는 경향이 나타났다. RMSLE 값은 심층신경망 M3-57-11의 경우 0.6235, 회귀식 Eq. (11)의 경우 0.8393, EurOtop 공식의 경우 1.0143으로 산출되었다. 구조물 형식에 대해서는 경사호안, 직립호안, 경사식 소파호안 순으로 결과가 좋았으며, 월파량 산정방법에 대해서는 심층신경망, 다중선형회귀 분석을 통해 산출한 회귀식, EurOtop 공식 순으로 RMSLE가 낮게 나타났다(Table 5). 지금까지의 결과를 종합해 보았을 때 심층신경망 기법은 기존 인공지능 기법을 활용한 연구성과(Tracey et al., 2020)에서 보는 바와 같이 월파량을 산정함에 있어 충분히 고려할 수 있는 방법으로 판단되며, 데이터가 추가될수록 보다 일반화되어 지속적인 성능 향상이 가능할 것으로 보인다.
4. 결 론
항만구조물 설계의 주요 인자인 월파량 산정을 위해 심층신경망 기법과 전통적인 다중선형회귀 방법을 사용하였고, 3가지 형식으로 구분한 월파제어 구조물에 대하여 각각 심층신경망과 회귀방정식을 수립하였다. 심층신경망 학습에는 전 세계 월파량 실험자료를 집대성한 EurOtop 데이터베이스와 R의 ANN2 패키지를 사용하였고, 정칙화와 최적화 학습기법을 적용하여 최적의 심층신경망을 구축하였다. 월파량 산정 결과 심층신경망을 통한 월파량 산정이 모든 구조물 형식에서 가장 좋은 성능을 나타내었다. 구조물 형식에 대해서는 경사호안에서 RMSLE가 가장 낮게 산출되었고, 이는 경사호안의 정규화된 학습데이터의 분포가 가장 균등하게 분포하여 변수의 값이 존재할 수 있는 모든 구간이 심층신경망 학습에 잘 반영되어 특정 데이터에 의한 영향이 감소되었기 때문인 것으로 사료된다. 심층신경망 구성에서 은닉층의 활성함수로 시그모이드를 사용할 경우 경사소실 문제로 가중치 갱신이 이루어지지 않아 심층신경망 학습이 진행되지 않는 문제가 발생하였다. 초기 심층신경망 학습 결과 모든 구조물 형식에서 활성함수 ReLU, 은닉층 노드개수 30개, 학습률 10-3의 학습조건이 적용되었을 때 가장 낮은 RMSLE가 산출되었다. 신경망 학습에 EurOtop 데이터베이스를 사용하는 경우 앞서 언급한 하이퍼 파라미터들을 참고하여 활용할 수 있을 것으로 사료된다.
본 연구를 통해 구축한 월파량 산정 심층신경망 모델을 Goda(1975) 월파량 산정도표와 비교하는 연구가 과제로 남아있다. EurOtop 데이터베이스의 구조물 앞의 파고(Hm0)를 Goda(1975)의 월파량 산정도표에 적용하기 위해서는 환산 심해파고(H0')로 변환하는 작업이 선제적으로 요구된다. 심층신경망의 월파량 산정 결과 일부에서 음수가 산출되는 경우가 발생하였고 이 부분은 개선해야 할 점으로 남아있다.