Wave Prediction in a Harbour using Deep Learning with Offshore Data

Geun Se Lee; Dong Hyeon Jeong; Yong Ho Moon; Won Kyung Park; Jang Won Chae

doi:10.9765/KSCOE.2021.33.6.367

요약

본 연구에서는 항내 파고를 신속하고 비교적 정확하게 예측할 수 있는 딥러닝 모델을 구축하였다.다양한 머신러닝 기법들을 외해파랑의 항내로 전파 변형 특성을 감안하여 모델에 적용하였으며 스웰로 인해 하역중단 문제가 심각했던 포항신항을 모델적용 대상지로 선정하였다. 모델의 입력 자료는 외해의 파고, 주기, 파향 그리고 출력 및 예측 자료로는 항내 파고자료로 하여 모델을 학습시켰다. 이때 자료의 전처리 과정으로 항내·외 파랑 시계열자료의 상관성을 감안하여 파향 자료를 분리하는 방법을 적용하고 딥러닝 기법을 이용하여 모델을 학습하였다. 결과적으로 모델을 통해 예측한 값이 항내관측치의 파고 시계열자료를 잘 재현하였으며 모델의 안정성을 크게 향상시켰다.

핵심용어: 딥러닝, 머신러닝, 파랑 예측, 자료 전처리

Abstract

In this study, deep learning model was set up to predict the wave heights inside a harbour. Various machine learning techniques were applied to the model in consideration of the transformation characteristics of offshore waves while propagating into the harbour. Pohang New Port was selected for model application, which had a serious problem of unloading due to swell and has lots of available wave data. Wave height, wave period, and wave direction at offshore sites and wave heights inside the harbour were used for the model input and output, respectively, and then the model was trained using deep learning method. By considering the correlation between the time series wave data of offshore and inside the harbour, the data set was separated into prevailing wave directions as a pre-processing method. As a result, It was confirmed that accuracy and stability of the model prediction are considerably increased.

Keywords: deep learning, machine learning, wave prediction, pre-processing

1. 서론

최근 이상기후로 인해 해안 및 해양시설에 많은 피해가 보고되고 있다. 이러한 피해를 줄이기 위해서는 파랑을 미리 예측하여 선제적으로 대응하는 것이 중요하다. 일반적으로 수치모델을 통해 파랑 발달 및 전파변형을 예측하지만 항내 측과 같은 경우에는 Boussinesq type 모델(Park et al., 2014) 을 사용하는데 계산시간이 많이 소요된다. 예보의 측면에서는 위험상황을 더욱 빠르게 예측하는 것이 중요하므로 머신 러닝(LeCun et al., 2015)을 이용하여 단시간에 예측하는 방법이 좋은 대안이 될 것이다.

머신러닝 모델은 신뢰성 있고 충분한 자료가 축적된 경우에 자료의 패턴이나 선형 및 비선형적인 관계를 손쉽게 도출 해내는 방법이다. 해안·해양분야에서도 관측 자료나 추산자료 등 많은 양의 데이터가 축적되고 있어 머신러닝을 활용한 연구가 많이 진행되었다. 국외에서는 목표지점 인근의 다양한 지점에서 추산 및 관측된 파랑자료와 바람자료를 이용하여 파고와 주기를 예측하는 연구를 진행하였다(James et al., 2018). 또한 국내에서는 관측 자료의 결측된 구간에 대한 추정을 목표로 딥러닝 모델을 구축하여 유의파고 및 풍속을 예측하였다(Kim, 2020). 머신러닝을 이용하여 쇄파를 예측하는 연구 (Lee et al., 2020)와 머신러닝의 다양한 기법들을 적용하고 모델구조에 따른 민감도 분석을 수행하는 연구(Park et al., 2021)를 진행하였다. 이밖에도 방파제 피복석의 안정성과 월파량을 계산하는데 활용되는 머신러닝 모델들을 제시하고 소개한 연구가 있다(Suh et al., 2019).

항내에 너울성 파랑이나 장주기파에 의해 하역중단 사례가 많은 대표적인 항만으로 포항 신항을 들 수 있다. 이 문제를 해결하기 위해 장기간의 항내·외 파랑관측(포항지방해양항만청(PROOP), 2012)과 관련 연구들이 이루어졌다(Jeong et al., 2011, Oh et al., 2016). 외해에는 기상청의 포항부이와 해양수산부의 영일만 신항 부이가 설치되어 해양기상자료를 관측 중이다. 또한, 인근에 연안설계파 산정을 위한 참고지점들이 다수 위치하고 있어 다양한 자료를 수집할 수 있다(해양수산부(MOF), 2019). 이와 같은 파랑관측 및 추산자료, 하역중단사례를 통해 분석한 하역한계파고 등의 자료를 활용하면 항내·외 파랑의 비선형적인 상관성을 머신러닝을 통해 계산할 수 있다.

따라서 본 연구에서는 머신러닝의 다양한 기법을 활용하여 해안·항만분야에 대한 적용성을 검토하고 파랑예측 방법의 하나로 제안하고자 한다. 세부적으로는 외해 지점의 관측자료 및 추산자료를 입력자료(input)로 항내측 관측 자료의 파고를 출력자료(output)로 활용하여 항내측 파고자료를 신속하고 비교적 정확하게 예측할 수 있는 머신러닝 모델을 수립하고자 한다.

2. 모델 구축

2.1 딥러닝 기법

딥러닝이란 머신러닝의 수많은 기법 중 하나로 인간의 신경망 구조를 착안하여 컴퓨터로 인공신경망을 구현하여 학습을 하는 방법이다. 특히, 딥러닝 모델은 고차원의 데이터 (speech, image process, sequential data 등)에서 복잡한 구조의 패턴이나 트렌드 등을 처리하는데 성능이 매우 우수하다. 입력층, 중간층, 출력층으로 구성되어 다중의 중간층을 가진 신경망을 Deep Learning 또는 Multi-Layer Perceptron (MLP) 모델이라고 한다(Aurélien, 2019). 각각의 층(layer)은 상호 연결된 노드(node)로 구성되며 학습을 통해 입력 자료와 출력 자료의 차이가 최소일 때의 가중치(weights)를 저장하여 예측 시 노드의 기여도로 사용된다.

2.2 학습대상지 선정

본 연구에서는 2008년부터 2011년까지 약 3년간의 항내· 외측 관측자료를 가용할 수 있는 포항 신항 및 영일만을 학습대상지로 선정하였다. Fig. 1은 대상지의 위치 및 활용할 수있는 자료의 지점을 보여준다. 포항신항의 내측 8점과 외측 1점에서 관측이 이루어졌으며, 본 연구에서는 항내 관측지점인 W3의 관측 자료를 이용하여 항 내측 파고를 판단하였다. 이외에도 기상청이나 해양수산부에서 제공하는 해양관측부이 자료(Jeong et al., 2018)나 포항 인근 연안 설계파 격자점 자료(해양수산부(MOF), 2019)를 이용할 수 있다는 점에서 다양한 데이터의 활용이 가능하다. 또한 포항신항은 너울성 파랑으로 인해 항내 하역작업이 상당기간(194일/3년) 동안 중단되기도 했기 때문에 머신러닝을 적용하면 이러한 문제를 예측하여 하역작업 스케줄 수립에 도움을 줄 수 있을 것이다.

2.3 활용자료에 대한 검증

본 연구에서는 입력자료 중 하나로 외해 쪽에 위치한 여러 개의 연안 설계파 격자점 중 3개(122, 123, 124)만을 사용하였는데, 이는 기상청(KMA) 날씨누리 해양기상 수치예보자료와 연계가 용이할 것으로 판단했기 때문이다. 다양한 종류의 자료를 이용하여 모델구축이 가능한 머신러닝의 특성상 학습에 사용되는 자료의 신뢰성에 대한 검증이 필요하다. 따라서 학습에 앞서 이미 신뢰성이 검증된 파랑관측 자료와 SWAN 모델 추산결과를 비교하여 SWAN 모델 결과의 정확도를 분석하는 방법으로 연안 설계파 격자점 자료에 대해 간접적으로 검증하였다.

대상지인 포항 신항 및 영일만의 인근에 위치한 기상청의 포항부이와 해양수산부의 영일만 신항 부이에서 취득한 관측 자료를 바탕으로 1시간 간격의 파고, 주기, 파향에 대해 검증하였으며, Fig. 2와 Fig. 3은 검증결과 중 2020년 10월의 파고, 주기, 파향 자료에 대한 시계열 비교그래프를 보여준다. 검증결과 파고, 주기, 파향 모두에서 연안 설계파 격자점 자료가 관측치와 높은 일치성을 보이는 것을 확인하였다. 또한 전반적인 경향성을 잘 재현하는 것을 확인하여 연안 설계파 격자점 자료를 학습 자료로 적용할 수 있다고 판단하였다.

2.4 학습모델의 선정

본 연구에서는 파이썬(python, Pedregosa et al., 2011) 3.7을 기반으로 분류모델 및 딥러닝 모델을 구축하여 그 적용성을 분석하였다. 분류 모델로는 KNN(K-Nearest Neighbor) 모델과 AdaBoost 모델을 이용하였으며, 딥러닝 툴킷(toolkit)으로는 tensorflow 2.4.1 버전과 keras 2.4.3 버전을 사용하였다.

연구에서 진행한 케이스들의 입력 및 출력자료에 대한 내용을 Table 1에 제시하였다. 먼저 Case 0의 조건과 같이 분류모델을 적용하여 머신러닝의 파랑예측에 대한 가능성을 확인하고자 하였는데 라벨링(labelling) 자료를 출력자료로 학습하는 분류모델의 특성을 고려할 필요가 있었다. 이를 위해 출력자료인 항내측 파고 관측자료에서 0.25 m를 기준으로 하여 라벨링 자료를 추가적으로 생성하였으며 이는 항 내측에서 0.25 m보다 큰 파고가 발생했는지의 유무를 판단할 수 있는 자료로 활용이 가능하다. Fig. 4는 KNN(K-Nearest Neighbor) 과 AdaBoost 분류모델을 적용하여 항내 고파의 발생유무를 예측한 결과이며, 고파 및 고파가 아닌 구간에서의 시계열에 따른 예측 성공 여부가 나타난다. 전체 데이터에 대해서 관측치와 비교했을 때 각각 96%와 97%의 정확도를 보였다. 하지만 세부적으로 고파 구간에 대한 예측 성능만을 보면 KNN 모델이 17%, AdaBoost 모델이 47%의 정확도로 고파인 시점을 예측하여 항내측에서 중요한 고파에 대한 예측이 제대로 이루어지지 않았다. 이러한 문제점으로 인해 딥러닝 기법을 적용하여 분류된 파고의 시계열에 대한 예측 연구를 진행하였다.

Fig. 5에는 딥러닝 기법을 이용해 구축한 모델의 개략도가 나타난다. 입력조건과 출력조건이 많지 않기 때문에 은닉층은 가진 2개의 층으로 두었으며 각각의 실험 Case에 따라 노드(node)의 개수를 조정하여 모델을 구성하였다. 노드/뉴런의 값을 계산하는 활성화함수(activation function)는 최근 Google team이 개발하여 reLU 함수 (f(x) = (0, x))보다 성능이 우수한 swish 함수 (f(x) = (x))를 적용하였으며, 전체자료 중 80%는 학습자료, 나머지 20%는 검증자료로 활용하였다. 학습에 사용한 파고의 시계열 자료는 1시간 간격으로 샘플링한 자료를 사용하였다. 외해 파랑이 항내로 전파하는 시간과 관측 파랑의 분석 시 파고, 주기 등을 1시간 동안은 steady state로 가정하는 특성을 고려하여 동일 시간의 입력 및 출력자료를 이용하여 모델을 학습시켰다.

2.5 데이터 분석 및 전처리

딥러닝 모델의 예측 정확성과 안정성을 높이고자 학습데이터의 특성을 분석하여 이에 알맞은 전처리과정을 선정하였다. 입력 자료인 122, 123, 124 연안 설계파 격자점의 파고, 주기, 파향 자료와 출력자료인 W3 관측지점의 파고자료의 관계를 파악하기 위해 산포도(scatter diagram)를 Fig. 6에 제시하였으며 각 그래프에는 자료 간의 상관도를 의미하는 상관 계수(correlation coefficient)가 나타나 있다. 출력자료의 파고와 입력자료의 주기 관계를 나타내는 그래프의 경우 그 값이 약 0.7 정도로 상당히 scattered 되어 있다. 따라서 전체 자료에 딥러닝 모델을 적용하여 비선형적인 관계를 구하는 데에는 어려움이 있다.

일반적으로 항내에서 관측되는 파고 중 항내 하역문제와 관련된 중요한 파고는 하역한계파고보다 큰 고파임을 고려하여 입력 자료의 항외측 파향과 출력 자료인 항내측 파고 간의 산포도를 분석하였다. 이 결과 대부분의 고파가 NE, NNE, N 파향에서 발생하였음을 확인하였다. 이를 바탕으로 Fig. 7에 나타난 것과 같이 주요 파향에 대하여 자료를 분리하여 추가적인 전처리 작업을 하였다. 주기의 경우 상관계수가 작아진 구간도 있었지만 파고의 상관계수 값이 크게 증가하였다.

3. 모델결과

3.1 Case 1 학습 및 예측 결과

딥러닝 모델의 파랑예측에 대한 적용성을 확인하기 위해 항외측 관측지점 중 항 인근에 위치한 W2 지점과 항내측 W3 지점의 자료를 활용하였다. W2 지점은 항 외측에 위치하고 있긴 하지만 항 입구와 매우 인접하며 파향 자료의 대부분이 NNE와 NE 방향에 분포하고 있다. 이러한 특성을 고려하여 본 실험에서는 파향자료가 상대적으로 중요한 영향을 미치지 않을 것으로 판단하여 W2 지점의 파고, 주기 자료만을 입력 자료로 활용하였다. 모델의 은닉층은 5개의 노드를 갖는 2개의 층으로 구성하였으며, 항내측 W3 지점의 파고자료를 출력자료로 하여 학습시켰다.

Fig. 8은 학습한 모델의 예측치와 관측치를 비교한 결과이다. 평균절대오차는 0.02 m, 평균제곱근오차(RMSE)는 0.12 m로 같은 조건으로 모델 학습을 반복하더라도 예측치가 약간의 차이를 보이는 것을 확인하였지만 그 크기가 매우 작았으며 관측치의 경향을 잘 재현하고 있어 안정적인 예측 모델이 구축되었다고 판단하였다. 다만 파고가 급격히 변하는 부분에서는 모델의 예측치가 관측치에 비해 다소 낮게 예측하였는데 이러한 오차는 학습에 사용된 파고자료가 전체적으로 낮은 구간에 분포하여 발생한 것으로 사료되며 학습 자료의 양이 많아져 더욱 다양한 파고분포에 대한 학습이 진행된다면 줄어들 것으로 판단된다.

3.2 Case 2 학습 및 예측 결과

앞 절의 Case 1을 통해 항외측 방파제 전면의 불규칙파랑이 항내로 전파하면서 굴절 회절 반사등 복잡한 파랑변형현 상의 결과로 나타난 시계열 파고의 크기를 잘 재현함으로써 만족스러운 모델예측 결과를 얻을 수 있었다. 이를 통해 모델의 적용성이 확인하였다.

그러나 모델의 입력자료 지점이 항과 인접하여 위치하고 있었기 때문에 모델의 항내파랑 예측에 대한 활용도면에서 큰 효과를 보지 못할 것이라고 판단했다. 이에 따라 입력자료의 위치를 외해까지 이동시켜 기상청의 해양수치예보모델과 연계하기 좋은 연안 설계파 격자점(122~124) 만 의 파고, 주기, 파향 자료를 입력 자료로 활용하였다. 모델의 은닉층은 15개의 노드씩 2개의 층으로 구성하였으며, 출력자료는 앞 절의 Case 1과 동일하게 W3 지점의 파고자료를 이용하여 모델을 학습시켰다.

Fig. 9는 학습한 모델의 예측치를 관측치와 비교한 결과이다. 평균절대오차는 0.04 m, 평균제곱근오차(RMSE)는 0.11 m 로 대부분의 관측치의 경향은 잘 재현하였지만 모델예측치가 관측치에 비해 전반적으로 파고를 높게 예측하는 것을 확인할 수 있었다. 또한 관측치와 무관하게 값이 튀는 현상을 볼수 있었는데 이는 파향 자료에 대한 충분한 학습이 되지 않아 모델이 불안정하게 예측을 하는 것으로 판단하였다.

3.3 Case 2 파향 전처리 후 학습 및 예측 결과

앞 절(3.2) 실험결과의 예측 안정성이 낮은(튀는) 부분을 개선하기 위해 2.5절에서 소개한 파향 분리 전처리 방법을 적용하여 예측의 안정성을 높이고자 하였다. 122, 123, 124번의 연안 설계파 격자점 자료에서 N~NE 파향에 분포한 자료의 파고, 주기자료를 입력 자료로 활용하였다. 모델의 은닉층은 15개의 노드씩 2개의 층으로 구성하였으며, 출력자료는 앞선 실험과 동일하게 W3 지점의 파고자료를 활용하였다.

Fig. 10은 학습한 모델의 예측치와 관측치를 비교한 결과 Fig. 10. Comparison between measured and predicted wave heights (Case 2) after pre-processing. Top: predicted time series. Bottom: high wave height period is enlarged for convenience. 이다. 평균절대오차는 0.04 m, 평균제곱근오차(RMSE)는 0.11 m 로 예측치 오차가 매우 작고, 전체데이터를 학습한 결과(Case 1)의 오차의 크기와 별 차이가 없다. 파고가 급격히 튀는 일부분에서는 모델예측치가 관측치에 비해 다소 낮게 예측하는 경향을 보였지만 관측치의 시계열 자료(항내 파고)를 전반적으로 잘 재현하는 것을 확인할 수 있다. 또한 관측치와 무관하게 값이 튀는 현상이 발생하지 않고 안정적으로 파고를 예측하는 것도 확인할 수 있다. 이를 통해 파랑자료의 학습 시파향에 대한 분리를 통해 예측의 안정성을 높일 수 있다는 것을 확인할 수 있었다.

4. 결론 및 제언

본 연구에서는 머신러닝을 이용하여 해안·항만분야에 대한 적용성을 검토하고자 하였다. 파랑자료의 특성(시계열 자료, 고파, 파향 등)을 감안한 분류모델 및 딥러닝 모델을 구축하여 항내측 고파에 대한 정확도를 높이고, 모델의 안정적인 학습을 위해 주 파향에 대한 자료를 분류하는 전처리 과정을 적용한 딥러닝모델을 구축하였다. 모델 적용결과, 항내측 파고에 대해 모델 예측치가 관측치의 시계열자료와 잘 일치하는 것을 확인하였다. 다만 갑작스럽게 파고가 급격히 변하는 부분에서는 모델이 파고를 다소 낮게 예측하는 경향을 보였는데 이는 학습에 사용된 파고자료가 전체적으로 낮은 구간에 분포하여 발생한 것으로 사료되며 학습 자료의 양이 많아져 더욱 다양한 파고분포에 대한 학습이 진행된다면 줄어들 것으로 판단된다.

항내에서 하역중단 기준을 넘는 고파가 발생되는 상황을 외해 해양기상 수치예보자료와 연계하여 미리 예측한다는 면에서 본 연구를 통해 구축한 모델의 안정성이 확보되었다고 판단된다. 또한 전체 파향 자료를 학습시키는 것보다 고파가 많이 발생하는 파향을 따로 분류하여 학습시켜서 안정적인 학습(예측)결과를 도출할 수 있었다. 결과적으로, 본 연구에서 구축한 딥러닝 모델을 이용해 항내측 파고를 신속하고 비교적 정확하게 예측함으로써 모델의 적용성이 입증되었다.

또한 방대한 양의 자료가 필요한 머신러닝학습에서 장기간의 자료가 충분히 축적되지 않은 우리나라 인근 관측 자료의 대안으로 연안 설계파 격자점의 장기간 자료를 활용할 수 있을 것이다. 기상청의 해양기상 수치예보와 연계하여 수립된 딥러닝 모델로 항내 파고를 예측한다면 하역 스케줄을 효율적으로 조정해 하역작업 중단문제 해결에도 도움을 줄 수 있을 것으로 사료된다.

딥러닝을 이용한 외해 해양기상자료로부터의 항내파고 예측