J Coast Disaster Prev > Volume 9(3); 2022 > Article
해양과학기지 RangeFinder 파랑 시계열 자료의 특성 분석 및 품질개선을 위한 알고리즘 개발

Abstract

Ocean Research Station is a comprehensive ocean research infrastructure built to collect and provide real-time data with state-of-the-art observation systems. This station operates various research facilities, and the data is actively used for research in each field. In particular, since wave data is produced through the remote-sensing observation method, they are valuable as observation data. Unlike the direct observation method, they can stably collect data and store long-term observation data on severe weather. However, there is a limitation that outlier may occur due to the process of measuring and collecting data or the effects of temporary environmental changes. This study improves the remote wave data quality of MIROS RangeFinder installed at the Socheongcho Ocean Research Station using an algorithm and confirms the reliability by comparing it with the wave buoy observation data operated by the Korea Meteorological Administration. The algorithm used is a Spike removal median filter, which is applied after adjusting the conditions and variables according to the characteristics of the Socheongcho wave data. Also, we developed a new filter using a variable threshold to increase the outlier detection rate. As a result, the final algorithm shows a high outlier detection rate, but some outliers are still not removed, so improvements are required to enhance the algorithm’s performance. In addition, continuous research on the remote-sensing wave observation method is required to compensate for the limitation that the accuracy is slightly lower than that of the direct observation method.

1. 서 론

해양과학기지는 최첨단 관측체계를 갖추고 자료를 실시간으로 수집 및 제공할 수 있도록 건설된 종합 해양연구 인프라를 의미한다(Shim and Chun, 2004). 기지는 구조물에 의한 간섭 최소화와 안정적인 파랑 자료의 수집을 위해 연안으로부터 100km 이상 떨어진 외해에 위치해 있으며 해저면에 견고하게 고정되어 있다. 따라서 육지의 영향을 적게 받아 공간 대표성이 높은 관측자료를 안정적으로 생산할 수 있다는 장점을 가진다 (Min et al., 2017). 기지에선 다양한 연구시설을 통해 수온, 염분, 해상풍, 파랑 등 해양의 핵심요소들을 실시간으로 수집하고 있으며 데이터는 각 분야의 연구에 활발하게 활용되고 있다(Shim and Min, 2004). 특히 파랑 자료는 원격관측장비를 통해 생산하므로 해양에서 주로 사용해 온 파랑부이(Waverider Buoy)와 다르게 장기관측자료 수집 및 모니터링이 가능하다. 이는 태풍이나 고파랑과 같은 재해요인 예측, 파랑 변화 추세 파악 등에 활용될 수 있어 그 가치가 높다. 하지만 대부분의 원격파랑관측장비는 직접 관측에 비해 정확도가 떨어진다는 한계를 가지므로 기지에서 생산하는 파랑 자료를 활용하기 위해선 자료의 품질을 개선하기 위한 연구가 필수적이다.
해양과학기지에 설치 및 운영되고 있는 원격파랑관측장비는 MIROS사에서 개발한 Wave and Currunt Radar(SM-050 MKⅢ, MWR)와 RangeFinder(SM-140)로 마이크로파를 해수면에 주사하여 해양을 관측한다. 해양에서 원격파랑관측에 사용하는 장비는 본 연구에서 언급하는 장비뿐만 아니라 Synthetic Aperture Radar(SAR), X-band marine radar, HF coastal radar 등 관측범위나 목적에 따라 다양하다. 하지만 원격관측은 해양에서 널리 사용된 부이나 압력계를 이용하는 직접관측에 비해 정확도가 낮다는 한계가 있으므로 이에 대한 원인과 데이터 처리 방식에 대한 연구가 국내외에서 수행되고 있다(Krogstad et al., 1999; van der Vlugt and van der Vlugt, 2014; Wyatt, 1990). 그러나 기지에서 운용 중인 원격 파랑관측장비에 대한 연구는 제한적으로 수행되었으며 국내에선 2018년 소청초 해양과학기지와 2020년 독도에서 수행한 MWR 연구가 전부이다. 소청초 기지에서 수행된 연구는 MWR System software(SW-002)를 사용하여 1월부터 약 2.5개월 동안 관측한 파랑 자료를 재분석하였다(Min et al., 2017). 하지만 이 연구에선 이벤트성 기상에 의해 발생하는 고파랑에 대한 신뢰도를 검증하지 못하였다. 이를 보완하기 위해 독도에서 수행된 연구는 상위 버전의 SW-002를 사용했으며 대체된 새로운 필터를 이용하여 약 2년간의 MWR 자료를 재분석하였다(Jun et al., 2020). 반면, 본 연구에서 활용하는 RangeFinder는 주로 선박에 설치하여 얻은 실시간 해수면 자료의 정확도나 항해의 안정성을 높이기 위한 데이터 분석 및 검보정을 위한 국외 연구에 사용되었다(Gangeskar, 2014; Zinchenko et al., 2021). 이는 Radar를 기반으로 한 장비간의 비교 분석으로 원격관측장비에서 나타날 수 있는 이상 자료나 직접관측에 비해 낮은 정확도가 고려되지 못했다. 따라서 본 연구에선 소청도에서 약 37km 거리에 있는 소청초 해양과학기지에 설치된 RangeFinder로부터 얻은 자료를 이용하여 원격파랑관측장비에서 나타날 수 있는 이상자료(Outlier; 시계열 자료 중 급격하게 자료가 발산하여 정상자료가 아닌 것으로 판단되는 자료)에 대한 연구를 수행하였다. RangeFinder는 기상상태와 무관하게 관측이 가능하고 선박이나 구조물에 고정되어 관측을 수행하므로 유지관리가 용이하다는 장점을 가진다(MIROS, 2020). 하지만 파랑관측시에 후방산란효과를 사용하기 때문에 다중 반사(Multiple reflection)나 약한 반사신호(Weak reflection)로 이상자료가 발생한다는 단점이 있다. 따라서 본 연구에서는 소청초의 RangeFinder 파랑 자료를 분석하고 정상자료와 이상자료를 구분할 수 있는 알고리즘을 개발하고 이를 적용하여 파랑 자료의 신뢰도를 높이기 위한 품질관리를 수행하였다.

2. 파랑관측장비 및 이상자료

2.1 RangeFinder 파랑관측장비 및 검증 자료

소청초 해양과학기지에 설치된 MIROS사의 RangeFinder(SM-140)는 해발고도 약 40m인 Roof Deck 북동쪽에 설치되어 2016년부터 파랑관측을 수행하고 있으며(Fig. 1), 본 연구에서는 2018년 2월부터 5월까지의 0.5초 간격 원시자료를 확보하여 분석을 수행하였다. RangeFinder는 고성능 원격센서로 마이크로파를 해수면에 수직으로 주사하고 반사되는 신호를 이용하여 장비와 해수면 사이의 거리를 측정한다. 본 장비에는 통신 기능이 포함되어 있어 인터넷 연결이 가능하면 실시간으로 관측자료 확인이 가능하며 Sensor GUI Software를 통해 측정값이나 장비의 상태 및 설정을 확인할 수 있다. RangeFinder는 9.6GHz의 마이크로파를 사용하며 해당 주파수는 더 높은 주파수에서 작동하는 레이저 기반 센서보다 안개나 우천과 같은 악기상에 덜 민감하고 높은 샘플링 속도(2Hz)로 비교적 정확한 측정값을 제공한다는 장점을 가진다. 또한 설치 위치에 따라 주사 범위를 선택할 수 있으며 소청초 기지에선 Narrow beam model(5°)을 관측에 이용하고 있다. 이외에 본 장비의 범위, 해상도 및 정확도 등의 구체적인 제원은 Table 1과 같다(MIROS, 2018).

2.2 RangeFinder 파고계의 이상자료

본 원격파랑관측장비인 RangeFinder는 안정적으로 데이터를 수집하고 장기간 관측자료 축적이 가능하다는 점에서 관측자료로서의 가치가 높다. 하지만 시계열 관측자료는 측정 및 수집 과정이나 갑작스러운 환경의 변화로 교란이 발생할 수 있으므로 데이터 분석에 있어 이상자료 탐지는 중요한 과정 중 하나이다(Battaglia and Orfei, 2005). 특히 Radar를 이용한 관측의 경우 다중 반사(Multiple reflection)나 약한 반사 신호(weak reflection)로 인하여 비정상 데이터가 발생할 수 있으므로 이상자료 확인이 필수적이다(van der Vlugt, 2012). 소청초 RangeFinder 관측자료를 확인한 결과, 분석기간 내에서 이상자료는 다양한 규모와 형태로 나타났다. 이상값들은 주로 진폭이 작은 기간(0.4m 이하)에 급격하게 하강하는 형태로 발생했으며 전체 기간 내에서 일정한 주기없이 지속적으로 나타났다. 이는 단순하게 이상값을 제거하는 방식이 아닌 자료의 특성에 맞게 단계적인 제거가 필요함을 의미하며 이에 대한 전반적인 구성 및 순서를 Fig. 2에 나타내었다. 먼저 장비 스스로 이상자료라고 판단하여 일정한 값(-999.99)으로 기록된 구간을 한꺼번에 제거한 후, 전체 시계열에서 여전히 남아있는 이상자료는 알고리즘을 이용해 순차적으로 제거하였다. 이 때 이상자료는 형태에 따라 3가지로 분류가 가능하다(Fig. 3). Spike 유형(Fig. 3a)은 데이터가 단일로 발산하는 형태로 가장 빈번했으며 기간에 따라 다양한 크기로 나타났다. Spike 다발 유형(Fig. 3b)은 크기가 일정하지 않은 spike가 연속적으로 나타나는 형태로 약 2분에서 15분까지 지속시간이 다양하다. 마지막으로 Bar 유형(Fig. 3c)은 구간의 진폭을 벗어나 발산하는 데이터가 나타난 후 일정 시간동안 유사한 값이 반복적으로 나타나 bar 모양을 만드는 유형으로 이상자료 중 가장 발생 빈도가 적었다. Spike 다발 유형이나 Bar 유형과 같은 일정 시간 이상 지속되는 이상자료는 분석 기간 내에서 짧게는 3초, 길게는 약 15분갸량 지속된다. 이는 앞서 언급했듯이 단순하게 이상 데이터를 제거하는 방식에는 한계가 있으며, 소청초 데이터에 적합한 알고리즘 검토 및 테스트가 필요함을 의미한다.

3. 원격파랑관측자료 품질개선을 위한 알고리즘 개발

3.1 이상자료에 적용한 알고리즘

본 연구에서는 소청초에 설치된 RangeFinder 자료에 분포하는 이상자료의 정량화를 위해 전체 시계열을 30분 단위로 나눠 총 5,760개의 구간으로 재배열하였으며 86개의 구간에서 이상값을 확인하였다. 그리고 이를 탐지하기 위해 Spike removal median filter를 적용하고 소청초 파랑 자료에 적합하게 수정하였다. 해당 알고리즘은 이상값이나 지진 해일을 탐지하기 위하여 개발되었으며 데이터 내의 spike를 탐지할 때 사용되는 함수를 포함한다(Chierici et al., 2017). 알고리즘은 사용자가 직접 조절할 수 있는 변수(Windowsize, Threshold)를 포함하고 있으며 사용되는 기법은 MATLAB의 내장함수인 Gradient와 Median이다.
Gradient는 데이터 입력 시 이웃값과의 기울기를 출력하는 함수이다. Water level 전체 시계열 데이터를 입력인수(data)로 지정하고 출력 인수 중 제곱값이 0.1보다 큰 값의 인덱스(flag)를 이상자료로 처리하도록 알고리즘을 구성하였으며 이를 Eq. (1)에 나타내었다. 본 알고리즘은 앞장에서 구분한 이상 데이터 유형 중 주로 spike 유형을 감지하는 데 효과적이었다.
(1)
flag=find(gradient(data)2>0.1)
하지만 소청초 파랑 자료는 조석의 영향이 뚜렷하게 나타나고 시간에 따라 진폭이 다양하게 나타난다는 점에서 알고리즘을 전체 데이터에 동일하게 적용하는 것은 부적합하다. 이상자료는 주로 진폭이 작은 구간에서 발생하므로 평균 진폭 값으로 구간을 분류한 후 선택적으로 알고리즘을 적용하였다. 이때 이상값이 주로 나타나는 구간의 평균 진폭은 0.2m 이하이지만, Gradient 함수를 이용한 알고리즘은 평균 진폭 0.1m 이하 구간에 적용했을 때 이상자료 탐지에 가장 효과적이었다. 또한, 정상데이터를 이상자료로 탐지하는 오류를 최소화하기 위하여 하강하는 형태에서만 알고리즘이 적용될 수 있도록 세부 조건을 추가하였다.
Median은 지정구간 데이터들의 중간값을 출력하는 함수이다. 이 함수를 이용한 알고리즘은 사용자가 직접 조절이 가능한 변수(Windowsize, Threshold)를 포함한다. Windowsize는 median 함수의 출력값을 얻을 때 사용할 데이터의 범위로 알고리즘에선 실시간 데이터(x)의 이전 시간 데이터로만 지정되며, Threshold는 이상값을 판단하는 기준값이다. 출력한 중간값과 실시간 데이터(x)의 차가 임계치(threshold)보다 큰 경우 flag 처리하도록 알고리즘을 구성하였으며 조건을 Eq. (2)에 나타내었다.
(2)
|data(x)-median(data(x-windowsize:x-1))|>threshold
본 알고리즘은 시계열의 맨 앞에서부터 1초 간격으로 차례대로 이상값과 정상값을 구분하여 연속적으로 발생하는 이상 데이터까지 탐지하도록 구성되어 있다. 또한, 해당 데이터(x)의 주변 자료(x-1, x+1)에도 Eq. (2)와 같은 조건이 동일하게 적용되어 있어 앞 장에서 구분한 이상 데이터 유형 중 spike 다발 유형과 bar 유형을 감지하는 데 효과적이었다.
Gradient를 활용한 알고리즘에서와 마찬가지로 median 알고리즘 또한 구간별 평균 진폭을 이용하여 선택적으로 알고리즘을 적용하였다. Gradient 알고리즘에서 적용하지 못했던 이상값 발생 구간을 포함하여 평균 진폭 0.2m 이하인 구간까지 알고리즘을 적용하였을 때 효과적이었다.

3.2 Spike removal median filter 변수 최적화

앞서 언급한 바와 같이 알고리즘은 입력인수를 필요로 한다. 알고리즘 내에서 활용된 변수는 데이터의 범위(windowsize)와 임계치(threshold)이며 본 연구에서는 두 가지 입력변수를 조절하여 최적의 값을 산출하였다. 특히 소청초 과학기지는 조석의 영향으로 인해 해수면 변위의 변동이 크므로 기본 설정치보다는 작게 입력하는 것이 효과적이었다.
Spike removal median filter에서 데이터 범위(windowsize)의 기본 설정값(default)은 1일(1day)이며, 이는 실시간 데이터를 기점으로 24시간 이전까지의 데이터(총 86,400개)를 의미한다. 하지만 진폭이 다양한 소청초 파랑 자료에 데이터 범위를 기본 설정값 그대로 적용하면 다수의 정상데이터를 이상 자료로 탐지하는 오류(Overdetected data)가 발생했다. 이를 개선하기 위하여 이상값의 최대 지속 시간이 약 15분임을 고려하여 windowsize를 30분부터 4시간까지 30분 단위로 테스트를 진행하였다. 본 연구에서는 데이터 범위에 작은 값을 적용할수록 계산 시간이 짧았으며 2시간을 초과하여 입력할 경우 다수의 Overdetected data가 발생하는 것을 확인하였다. 따라서 데이터 범위에 30분 또는 1시간을 입력했을 때 알고리즘이 가장 효과적이었다.
또 다른 변수 중 하나인 임계치(threshold)의 기본 설정값은 1이며 이는 1초 간격의 데이터를 차례대로 이상자료인지 판단할 때 기준으로 사용된다. 데이터 범위 설정값을 결정할 때와 마찬가지로 적절한 값을 찾기 위해 임계치의 범위를 나누어 테스트를 진행하였다. 0.5부터 기본 설정값인 1까지 0.1 단위로 적용했으며 임계치가 작을수록 이상구간을 많이 감지하는 것을 확인하였다. 하지만 임계치가 0.7보다 작아질 경우 정상구간을 이상구간으로 판단하는 다수의 Overdetected data가 나타났다. 알고리즘 내의 최적의 입력변수를 결정하기 위해 진행한 테스트 결과를 Table 2에 나타내었다. 그리고 이를 바탕으로 본 연구에서는 Overdetected data가 없고 이상자료 탐지율이 높은 최적의 입력변수 (windowsize=30, threshold=0.7)를 결정하였다.
최적의 변수라고 판단된 windowsize와 threshold를 입력하여 알고리즘을 적용한 결과, 이상값을 포함하는 구간 86개 중 55개를 감지(63.95%)했으며 정상구간을 이상구간으로 판단하는 오류는 나타나지 않았다. Fig. 4에 Spike removal median filter를 적용한 전체 시계열 자료를 나타냈으며 시인성을 위해 이상값이 존재하는 월별 대표 구간을 확대하여 subplot에 함께 제시하였다. 왼쪽부터 2018년 2월 25일, 3월 10일, 4월 9일, 5월 7일 시계열 자료이다. 알고리즘을 이용해 이상값으로 판단한 데이터를 빨간색 점으로 표시했으며 subplot을 통해 구간 내에 존재하는 이상값을 감지하지 못하거나 일부만 감지하는 한계를 확인하였다.

3.3 새로운 알고리즘 개발 및 최적의 알고리즘 도출

본 연구에서 개발 및 적용하는 알고리즘은 정상자료를 이상자료로 감지하는 오류가 없으면서 대부분의 이상자료를 탐지하는 것이 주목적이다. 앞 장에선 테스트를 통해 최적의 입력변수를 결정했으나 이상자료를 충분히 감지하지 못하는 문제가 나타났다. 따라서 이상값을 포함하는 구간 86개 중 기존 알고리즘으로 감지하지 못한 31개의 구간을 추가로 탐지하기 위해 새로운 알고리즘에 대한 연구를 진행하였다.
새로운 알고리즘은 앞에서부터 1초 간격으로 windowsize를 이동시키며 데이터를 확인한 기존 filter 방식과 다르게 전체 시계열을 동일한 크기의 구간으로 나눠 데이터를 일괄적으로 확인하는 방식이다. 이때 시간에 따라 진폭이 달라지므로 정상과 비정상 데이터를 구분하는 임계값도 구간에 따라 달라져야 한다(Clark et al., 2019). 따라서 30분 단위 구간별로 detrend 함수를 이용하여 추세를 제거한 후, 구간마다 진폭의 평균(mean)과 표준편차(std)를 이용하여 가변 임계값Variable threshold)을 설정했으며 임계치를 벗어나는 데이터를 flag 처리하도록 알고리즘을 구성하였다. 즉, 구간의 통계값에 따라 임계값이 달라지며 더 정밀하게 이상값을 탐지하기 위해 평균 진폭 값에 따라 임계치의 가중치(w)를 다르게 설정하였다(Eq. (3)).
(3)
(Variablethreshold)=mean+w×std
전체 구간의 평균 진폭을 정렬하여 3가지로 구분했으며 경계값은 0.15m와 0.35m이다. 즉, 평균 진폭이 0.15m 이하인 구간, 0.15m와 0.35m 사이인 구간 및 0.35m 이상인 구간으로 나누고 이상값이 나타나지 않는 0.35m 이상 구간(약 10%)은 정상자료를 이상자료로 판단하는 오류를 최소화하기 위해 알고리즘을 적용하지 않았다.
앞서 활용한 Spike removal median filter로 탐지하지 못한 31개의 이상구간 중 평균 진폭이 0.15m 이하인 구간은 20개, 0.15m와 0.35m 사이인 구간은 11개였으며 각각 적절한 가중치를 결정하기 위하여 테스트를 진행하였다. 이상값이 가장 빈번하게 발생하는 0.15m 이하 구간의 경우 이상값이 급격하게 하강하는 정도가 다른 구간에 비해 크므로 overdetected data를 최소화하기 위해 다른 구간보다 임계치의 가중치(w1)를 크게 설정하였다. 반면에 0.15m와 0.35m 사이인 구간은 표준편차 값이 크고 이상값이 아래로 하강하는 규모가 작아 가중치(w2)를 w1에 비해 작게 설정하는 것이 효과적이었다. 가장 효과적인 가중치를 선정하기 위하여 앞에서 분류한 진폭에 해당하는 모든 데이터를 대상으로 테스트를 진행하였다. 이에 대한 결과를 Table 3에 가중치 별로 나타내었으며 평가 기준으로 사용된 Detection data는 적절하게 탐지된 구간 개수를, Overdetected data는 정상구간을 이상구간으로 판단한 오류 개수를 의미한다. 결과적으로 Overdetected data가 나타나지 않으면서 탐지 수준(Detection data)이 가장 높은 가중치를(w1 = 8, w2 = 6) 선정하여 최종 알고리즘에 적용하였다. 소청초 RangeFinder 파랑 자료에 기존 알고리즘과 함께 새로운 알고리즘을 추가로 적용한 결과, 이상값을 포함하는 86개의 구간 중 82개의 구간을 감지(95.35%)하는 높은 탐지율을 보였다. Fig. 5에 두 가지 filter를 모두 적용한 전체 시계열 자료를 나타냈으며 비교를 위해 Fig. 4에서 제시한 4개의 구간과 동일한 구간을 확대하여 subplot에 함께 제시하였다. 기존 알고리즘을 이용해 이상값으로 판단한 데이터는 빨간색 점으로, 새로운 알고리즘을 이용해 이상값으로 판단한 데이터는 파란색 점으로 표시했으며 새로운 알고리즘을 추가로 적용함으로써 대부분의 이상값이 탐지되는 것을 확인하였다.

4. 데이터의 신뢰도 검증을 위한 유의파고 확인

본 연구에서는 원격파랑관측장비인 RangeFinder 파랑 자료의 신뢰도를 검증하고 향상 시키기 위해, 비교적 정확도가 높다고 알려져 있는 Datawell사의 Waverider Buoy (DWR-MK Ⅲ)를 활용하였다. 장비는 소청초 과학기지에서 북동쪽으로 약 570m 떨어진 지점에 설치하였으며(Fig. 6), 자료는 4개월(2018.02.14. ~ 2018.06.01) 동안 취득하였다. DWR의 파랑 자료에는 유의파고, 유의파주기, 최대파고, 최대파주기, 파향 등의 파라미터가 30분 단위로 저장되어 있다(Datawell, 2006). 따라서 두 장비의 관측자료를 비교하기 위해 이상데이터를 포함한 구간을 제거한 RangeFinder 파랑 데이터에 Zero-upcrossing 기법을 사용하여 30분 단위 유의파고를 계산하였다.
앞 장에서 제시된 알고리즘을 순서대로 적용하여 이상값들을 제거한 RangeFinder와 DWR의 유의파고를 비교한 결과를 Figs. 7a and 7b에 Scatter plot과 Time series로 나타내었다. 두 관측자료의 유의파고 양상은 비슷하나 약간의 차이를 보인다. Fig. 7a에서 x축은 DWR을, y축은 RangeFinder의 유의파고를 나타내며 선형회귀식을 계산하여 도출한 기울기는 0.909로 RangeFinder가 DWR 비해 유의파고를 과소평가하는 경향이 나타났다. Fig. 7b의 회색 선은 DWR의 유의파고를, 빨간색 선은 RangeFinder의 유의파고를 의미하며 마찬가지로 두 관측장비 간의 유의파고는 일정하게 약 0.1m의 차이를 보였다. 이러한 차이는 소청초 해양과학기지 설치 구조물의 영향으로 추정되며 DWR 파랑 파라미터 중 파향을 통해 확인하였다. 기지 내에서 RangeFinder는 북동쪽(NE)에 설치되어 있으며 Fig. 8에서와 같이 분석 기간동안 파향은 소청초 해양과학기지에 설치된 RangeFinder 위치와 정반대인 SW 계열이 지배적이다. 따라서 기지의 구조물이 RangeFinder 파고데이터에 영향을 주었을 것으로 판단하였다.

5. 결 론

본 연구에서는 소청초 해양과학기지에 설치된 원격파랑 관측장비인 RangeFinder로부터 얻은 파랑 자료의 품질을 개선하기 위해 데이터를 분석하고 최적의 알고리즘을 도출 및 적용한 후, 자료의 신뢰도를 확인하기 위해 기지로부터 약 570m 떨어진 곳에서 관측한 파고부이(DWR) 자료와 비교하였다. 원시자료에서 발견된 Error를 제거하고 다양한 형태로 나타나는 이상값을 탐지 및 제거하기 위해 outlier 및 지진해일 탐지를 목적으로 개발된 Spike removal median filter를 활용하였다. 이때 소청초 파랑 데이터에 알고리즘을 적용할 경우 효과를 높이기 위해선 사용되는 조건과 변수의 최적화가 필수적이었다. 따라서 변수별로 범위를 나눠 테스트를 진행하였으며 적절한 변수(Windowsize=30, Threshold=0.7)를 도출하였다. 소청초 파랑 자료에 알고리즘을 적용한 결과, overdetected data는 발생하지 않았지만 저조한 탐지율(63.95%)로 이상자료 탐지에 한계를 보였다. 이를 보완하기 위해 추가로 적용할 새로운 알고리즘을 개발하였으며 각 구간의 평균과 표준편차 값에 따라 임계값(Threshold)를 달리하여 이상값을 탐지하였다. 시간에 따라 진폭의 크기가 다양하고 주로 진폭이 작은 구간에서 이상값이 나타나는 소청초 파랑 자료를 고려하여 알고리즘을 적용할 적절한 진폭 구간을 선정하였으며 진폭의 규모에 따라 가중치(weight)를 다르게 설정하여 이상자료 탐지율을 높이고 정상자료의 손실을 최소화하였다. 결과적으로 기존 알고리즘과 새로운 알고리즘을 순차적으로 적용한 최종 알고리즘은 높은 탐지율(95.35%)을 보였다. 하지만 여전히 제거되지 않은 이상자료가 존재하므로 다른 소청초 파랑 자료에 알고리즘을 적용하여 성능을 평가하고 추가 이상값 탐지를 위한 연구가 요구된다. 또한, 신뢰도 높은 장기간 파랑관측 자료의 수집 및 분석을 위해 비교적 정확도가 떨어진다는 단점을 가진 원격파랑관측자료에 대한 지속적인 연구가 필요하다.

감사의 글

이 논문은 한국연구재단 이공분야기초연구사업(NRF-2022 R1I1A3065599)과 2021년 해양수산부 재원으로 해양수산과학기술원의 지원(종합해양과학기지 구축 및 활용연구)을 받아 수행된 연구입니다.

Fig. 1
Location of MIROS RangeFinder
kscdp-2022-9-3-171f1.jpg
Fig. 2
The outlier detection algorithm scheme
kscdp-2022-9-3-171f2.jpg
Fig. 3
Outlier type in Socheongcho RangeFinder data
kscdp-2022-9-3-171f3.jpg
Fig. 4
Time series of water level by applying Spike removal median filter
kscdp-2022-9-3-171f4.jpg
Fig. 5
Time series of water level by applying Spike removal median filter and New filter
kscdp-2022-9-3-171f5.jpg
Fig. 6
Location of Datawell Waverider Buoy(DWR-MKIII)
kscdp-2022-9-3-171f6.jpg
Fig. 7
Comparison of RangeFinder and DWR wave data
kscdp-2022-9-3-171f7.jpg
Fig. 8
Time series of DWR wave direction
kscdp-2022-9-3-171f8.jpg
Table 1
Specifications of MIROS RangeFinder(SM-140)
Range Resolution Accuracy
Distance(air-gap) 1-23m 1mm <5mm
3-95m
Wave height <22m 1cm 1<cm
<92m
Wave period 0.5-128s 0.1s 0.1s
Table 2
Performance of the Spike removal median filter using windowsize and threshold for RangeFinder wave data
Windowsize Test result 30 60 90 120 150 180 210 240
threshold
0.5 Detection data 64 65 65 69 70 70 70 69
Overdetected data 36 233 1050 1592 1962 2207 2366 2466
0.6 Detection data 60 58 58 62 67 66 66 67
Overdetected data 3 27 510 1131 1565 1849 2064 2213
0.7 Detection data 55 56 55 55 59 60 64 65
Overdetected data - 1 156 727 1179 1523 1770 1944
0.8 Detection data 50 52 52 50 49 53 57 61
Overdetected data - - 24 355 864 1220 1482 1679
0.9 Detection data 49 49 48 46 49 47 51 55
Overdetected data - - 2 128 539 942 1236 1440
1.0 Detection data 46 46 43 45 43 42 44 49
Overdetected data - - - 23 273 683 975 1229
Table 3
Comparison of weight(w1,w2) for each section
4 5 6 7 8 9
w1 Detection data - 18 18 18 17 14
Overdetected data - 486 93 10 0 0
w2 Detection data 10 10 10 9 8 -
Overdetected data 17 2 0 0 0 -

References

Battaglia, F.., Orfei, L.. (2005). "Outlier detection and estimation in nonlinear time series." J. Time Ser. Anal, Vol. 26, pp. 107-121. https://doi.org/10.1111/j.1467-9892.2005.00392.x.
crossref
Chierici, F.., Embriaco, D.., Pignagnoli, L.. (2017). "A new real-time tsunami detection algorithm." J. Geophys. Res. Ocean, Vol. 122, pp. 636-652. https://doi.org/10.1002/2016JC012170.
crossref
Clark, J.., Liu, Z.., Japkowicz, N... 2019;Adaptive threshold for outlier detection on data streams. In: Proceedings - 2018 IEEE 5th International Conference on Data Science and Advanced An alytics, DSAA 2018; Institute of Electrical and Electronics Engineers Inc; pp 41-49. https://doi.org/10.1109/DSAA.2018.00014.
crossref
Datawell BV. (2006). Datawell Waverider Reference Manual WRSG DWR-MkIII DWR-G.
Gangeskar, R.. (2014). "An algorithm for estimation of wave height from shadowing in X-band radar sea surface images." IEEE Trans. Geosci. Remote Sens, Vol. 52, pp. 3373-3381. https://doi.org/10.1109/TGRS.2013.2272701.
crossref
Jun, H.., Min, Y.., Jeong, J.-Y.., Do, K.. (2020). "Measurement and Quality Control of MIROS Wave Radar Data at Dokdo." J. Korean Soc. Coast. Ocean Eng, Vol. 32, pp. 135-145. https://doi.org/10.9765/kscoe.2020.32.2.135.
crossref
Krogstad, H.E.., Wolf, J.., Thompson, S.P.., Wyatt, L.R.. (1999). "Methods for intercomparison of wave measurements." Coastal Engineering.
crossref
Min, Y.., Jeong, J.., Shim, J.-S.., Do, K.. (2017). "Quality Enhancement of Wave Data Observed by Radar at the Socheongcho Ocean Research Station." Korea Soc. Coast. Disaster Prev, Vol. 4, pp. 189-196. https://doi.org/10.20481/kscdp.2017.4.4.189.
crossref
MIROS. (2018). RangeFinder User manual, MIROS, Norway..
Shim, J.S.., Chun, I.. (2004). "Construction and Operation of L-eodo Ocean Research Stations." Journal of the Korean Society of Civil Engineers, Vol. 52, No. 4, pp. 28-36.
Shim, J.S.., Min, I.K.. (2004). "Construction of IEODO Ocean Research Station." KOSHAM, Vol. 4, No. 2, pp. 59-70.
van der Vlugt, T.., Vlugt van der, R.. (2014). Comparison of Directional WaveGuide Radar with Directional WaveRider Buoy, Delft, Netherlands.
van der Vlugt, T.. (2012). Intercomparison of a WaveGuide radar and two Directional Waveriders, Delft, Netherlands..
Wyatt, L.R.. (1990). "A relaxation method for integral inversion applied to HF radar measurement of the ocean wave directional spectrum." Int. J. Remote Sens, Vol. 11, pp. 1481-1494. https://doi.org/10.1080/01431169008955106.
crossref
Zinchenko, V.., Vasilyev, L.., Halstensen, S.O.., Liu, Y.. (2021). "An improved algorithm for phase-resolved sea surface reconstruction from X-band marine radar images." J. Ocean Eng. Mar. Energy, Vol. 7, pp. 97-114. https://doi.org/10.1007/s40722-021-00189-9.
crossref
TOOLS
METRICS Graph View
  • 0 Crossref
  •  0 Scopus
  • 120 View
  • 13 Download
Related articles


ABOUT
BROWSE ARTICLES
EDITORIAL POLICY
FOR CONTRIBUTORS
Editorial Office
A-114, College of Engineering, Konkuk University, 120 Neungdongro, Gwangjin-gu, Seoul 05029, Korea
Tel: +82-2-444-7494    Fax: +82-2-444-7264    E-mail: kscdp@kscdp.or.kr                

Copyright © 2022 by Korean Society of Coastal Disaster Prevention.

Developed in M2PI

Close layer
prev next