• 대한전기학회
Mobile QR Code QR CODE : The Transactions of the Korean Institute of Electrical Engineers
  • COPE
  • kcse
  • 한국과학기술단체총연합회
  • 한국학술지인용색인
  • Scopus
  • crossref
  • orcid

  1. (Dept. of Electrical and Electronics Engineering, Konkuk University, Korea.)
  2. (Dept. of Electrical and Electronics Engineering, Kangwon National University, Korea.)



Gradient boosting machine, Short-term demand forecasting, Support vector machine

1. 서 론

전력거래소의 전력수요 예측 목표는 전날까지 수요를 예측하고, 이를 기준으로 경제 급전 계획을 수립하여, 당일에는 수요와 공급 사이의 균형을 맞추어 전력가격과 전력계통의 안정화를 꾀하는 것이다.(1) 따라서 전력 시장의 전력 가격과 전력 계통의 안정도가 예측된 수요에 의존하기 때문에, 수요예측의 정확도가 높아지면 전력계통 운영의 경제성과 안정도도 높아진다.(2) 이 과정에서 전력거래소는 전날까지 수요 예측을 위해 단기 전력수요 예측 프로그램 (KPX Short-term Load Forecaster : KSLF)을 운영한다. 현재 KSLF의 예측오차는 최대수요 대비 1.4%이다.(3)

최근의 전력시장 개편은 전력거래소가 전력수요 예측 정확도를 더 높이기 위해 더 정확한 기상 데이터를 활용할 것을 요구한다.(4) 첫째, 지붕에 설치된 태양광 발전 패널은 자체적으로 전력수요를 담당하거나, 전력계통에 전력을 공급함으로써 전력수요를 줄여 전력수요가 과다하게 예측될 수 있다. 둘째, 수요 자원 시장에 참가하는 건물들이 태양광 패널과 에너지 저장 장치를 활용해서 수요 감축을 시도하다가 갑자기 날씨가 흐려지면 수요가 과소하게 예측될 수 있다.(5) 따라서 냉난방 수요가 큰 비율을 차지하는 건물 수요와 태양광 발전량은 날씨에 크게 의존하기 때문에, 과소 예측을 막기 위해서는 정확한 기상 데이터를 활용해야 한다.(6)

본 연구에서는 15분 단위로 다음 날 하루 동안의 전력수요를 전날에 예측한다. 우리는 예측의 정확도를 높이도록 다양한 방법들을 활용한다. 첫째, 예측에 사용되는 기상 데이터의 정확도가 시간이 지남에 따라서 떨어지는 것을 고려하여 매시간 서로 다른 예측모델을 설계하여 병렬 구조로 수요를 예측한다. 둘째, Ridge regression, Support Vector Machine (SVM), 그리고 Gradient Boosting Machine (GBM)의 최신 예측 알고리즘을 조합하여 예측 정확도를 높이고, 조합된 모델들의 평균값을 구하여, 다양한 예측 알고리즘들이 서로의 성능을 보완하도록 한다. 셋째, 예측 정확도 기반의 기상 데이터, 데이터 연도, 그리고 기상관측소들을 선정하여, 최적 데이터 조합을 찾는다. 특히 최근 전력수요 증가율이 낮아지고 있으므로, 2018년도의 전력수요와 비슷한 특징을 가진 연도들을 선택하여 예측 정확도를 높인다. 이로써 최적의 데이터 조합을 결정하여 데이터의 차원을 줄임으로써 과적합(overfitting)을 줄여 정확도를 개선한다. 이 논문에 기술한 연구내용과 그 연구에 대한 전력수요예측에 대한 기여도를 나열하면 아래와 같다.

• 기상 데이터의 정확도가 시간이 지남에 따라 변하는 것을 고려하여, 시간 변수를 고려한 병렬 구조 예측모델 설계를 통해 전력수요의 가변적 특성을 반영했다.

• 최신 예측모델 중에 가장 정확도가 높은 모델을 사용했다.

• 정확도를 최대화하는 최적 기상 데이터 조합을 찾았다.

2. 사례 조사

이 장에서는 본 연구와 연관된 국내외 전력수요 예측에 관한 논문들을 소개하고, 본 연구와 비교한다.

2.1 국내 연구 사례

국내에서는 전력수요를 정확히 예측하기 위해 다양한 예측 알고리즘을 개발해 왔다. 첫째, 시계열 모델을 이용해 향후 2년간의 최대 전력수요를 예측했다.(7) 하지만 시계열분석은 과거 시계열의 형태가 미래에도 같은 형태로 반복된다는 가정하에서 모델을 구축하여 미래에 대해 예측을 한다. 그러나 예측된 기온 같은 외부여건을 활용하기가 쉽지 않기 때문에 예상치 못한 특정 현상(폭염, 태풍)이 발생할 때 오차가 커진다는 한계가 있다. 둘째, 다중회귀분석방법을 이용하여 전력수요를 예측했다.(8) 이 논문에서는 기온과 전력수요 사이에 2차 다항식을 세워 수요를 예측했으나 3차 이상의 모든 다항식에 대한 범용 모델은 구축하기 어렵다는 한계점이 있다. 셋째, 인공지능 알고리즘 중 하나인 SVM을 이용해 수요를 예측했으나(9), 이 또한 수요의 특정 특징들만 학습 할 수 있으므로, 다양한 예측 알고리즘을 조합한다면 더 좋은 예측 성능을 얻을 수 있을 것이다.

그뿐만 아니라 국내에는 예측 정확도를 높이기 위한 기상 데이터 선택방법 및 활용에 관한 연구가 많이 되어 있다. 첫째, (5)에서는 인구수를 기준으로 상위 5개 도시를 선택한 후, 5대 도시의 가중 평균 기온을 전체 전력수요에 해당하는 기온으로 가정하고 전체 전력수요를 예측했다. 이 과정에서 5대 도시가 전국의 전력수요를 모두 사용한다고 가정했다. 그러나 지역별 기온의 전체수요에 대한 기여도를 직접 분석하지 않았기 때문에 가중치 선택이 최적이 아닐 수 있다. 둘째, (10)에서는 여름철에는 일 최저기온을 적용하고, 겨울철에는 일 최고기온을 적용하여 전력수요를 예측하였으나 여름철과 겨울철 사이의 절기에 사용할 기온 선택에 대한 언급은 없었다. 셋째, (11)에서는 제주계통의 수요를 예측하기 위해 기온을 활용하는 방법을 개발했다. 관광산업이 발달한 제주도의 경우 냉난방에 의한 전력사용량이 많아서 기온변화에 따른 전력사용량 변화에 대한 분석이 필수적이다. (11)에서는 기온변화에 대한 수요 민감도를 이용해서 전력수요를 예측했으나, 수요 민감도를 기온변화에 대한 범용 함수로 표현하진 않았다.

따라서 본 논문에는 SVM을 비롯한 다른 최신 인공지능 알고리즘들을 이용해서 수요를 기온변화에 대한 범용 함수로 나타내어 전력수요 예측 정확도를 높인다. 또한, 기상 데이터(기온, 구름)로 구성된 기상 관측소 조합을 선택하여 예측 정확도를 더 높일 수 있는 새로운 방법을 제시하여 기존 데이터 조합 방법들의 한계점들을 극복한다.

2.2 해외 연구 사례

해외에서도 수요예측 정확도를 높이기 위해 다양한 알고리즘들을 개발해 왔다. 첫째, 기상 데이터를 이용하여 ANN (Artificial Neural Network)과 여러 개의 결정 나무를 만들어 합치는 앙상블 방법인 Bagging을 이용하여 수요를 예측했다.(12) ANN과 Bagging의 성능을 비교한 결과 Bagging의 성능이 더 좋았다. 둘째, (13)에서는 무작위로 뽑힌 데이터를 이용해 만들어진 결정 나무들의 결과를 평균한 앙상블 모델을 활용하여 예측 정확도를 높였다. 셋째, (14)에서는 멀티 코어를 활용한 병렬 연산을 통해 많은 양의 데이터들을 빠르게 선별한 후 선별된 데이터별 선형 회귀 모델 계수들을 찾았다. 이 과정에서 병렬 연산을 사용하였기 때문에, 많은 데이터를 신속히 처리할 수 있었다.

그뿐만 아니라 해외에서는 예측 정확도를 높이기 위해 다양한 지역의 전력수요 그리고 풍력과 전력수요 사이의 상관계수(correlation)를 활용하는 연구를 진행해 왔다. 첫째, 지역 간의 거리와 수요 예측오차 사이의 상관계수를 분석했다.(15) 선전(shenzhen)에서 떨어진 20개 지역 간의 거리와 전력수요 예측오차 간의 상관계수를 조사해 보았을 때 선전에서 먼 지역일수록 예측오차가 커졌고 가까운 지역일수록 예측오차가 작아졌다. 이 방법을 이용하면 거리가 가까운 지역의 기상 데이터를 우선적으로 선택해야 하나, 상관관계를 이용한 기상 데이터 선택이 높은 예측 정확도를 항상 보장하지 않는다. 둘째, (16)에서는 풍속 데이터를 구할 수 없는 경우 수요와 풍력 사이의 상관관계를 이용하여 장기 전력수요를 예측했다. 풍력은 기상 데이터에 크게 의존하기 때문에 기상 데이터와 전력수요 사이의 상관관계를 이용한다면 예측 정확도를 더 높일 수 있다. 그러나 여러 기상 데이터가 주어질 때는 전력수요와 여러 기상 데이터 사이의 상관계수는 계산하기 힘들다.

따라서 본 논문에서는 (12)에서 ANN보다 Bagging의 예측 정확도가 더 높아서 예측 정확도를 높이기 위해 Bagging 기반의 GBM을 사용한다. 이에 더해, 다양한 예측 알고리즘들이 상호작용을 하여 예측 정확도를 높이도록 앙상블 모델을 사용한다. 그리고 연산시간을 줄이기 위해 병렬 연산을 활용한다. 또한, 기상 데이터와 전력수요 사이의 상관관계 대신 예측 정확도에 대한 기여도를 이용하여 기상 데이터를 선별한다.

3. 예측 데이터 및 데이터 구조

이 장에서는 본 연구의 알고리즘을 검증하기 위해 참가한 수요예측 대회 규칙과 데이터 구조를 설명한다.

3.1 예측 대회 규칙 및 수요 데이터와 기상 데이터

우리는 예측 알고리즘 성능을 검증하기 위해 프랑스 전력회사 RTE에서 2018년 1월에 주최한 수요예측 대회에 참가했다. 대회에서는 15분마다 프랑스 전체 수요를 24시간 앞서서 예측한다. 프랑스 시간 (CET; Central European Time)으로 0시부터 23시 45분까지 15분마다 24시간 동안의 수요를 매일 전날 21시까지 예측해야 한다. 따라서 예측 값의 개수는 96개가 된다. 참고로 현재 전력거래소의 단기 예측 프로그램의 예측 주기도 15분이다. 예측 마감 시간과 첫 예측 목표 시간과의 차이가 3시간이므로 직전 측정 수요를 모르게 된다. 게다가 수요예측에 필요한 시간이 있기 때문에 대략 18시까지의 측정 수요만 활용할 수 있다.

수요예측 대회에서는 프랑스 전체 전력수요와 예측된 기상 데이터 두 세트가 주어진다. 전체 전력수요는 2012년 1월부터 2017년 11월까지는 30분마다 측정되었고, 2017년 12월부터 예측 대회가 끝나는 2018년 2월 14일까지는 15분마다 측정된다. 기상 데이터는 프랑스의 35개 기상관측소에서 매시간 측정 및 예측된 기온과 운량으로 구성되어 있는데 기온과 운량의 예측확률분포의 중앙값과 분산도 주어진다. CET 시간으로 예측 전날 15시에 앞으로 72시간 동안의 예측값이 주어진다. 또한 5시간 전과 전달 순간의 기상 측정값도 제공되기 때문에 모두 78개의 기온과 운량이 주어진다. 데이터의 시간별 구성은 그림 1에 잘 나와 있다.

그림. 1. 시간에 따른 데이터 구조

Fig. 1. Hourly data structure

../../Resources/kiee/KIEE.2019.68.7.834/fig1.png

그림 1을 보면 수요를 예측해야 하는 목표 시간에는 9(= 24-15)시간 전에 예측된 값이 가장 빠른 값이다. 예측에 사용된 전력수요 데이터와 예측된 기상 데이터는 다음의 RTE 홈페이지(17)에서 제공받아 활용한다.

3.2 기상 데이터의 정확도에 따른 예측 모델 작성

이 절에서는 예측 정확도를 높이기 위한 기상 데이터 활용방법을 설명한다. 우리는 수요를 예측하는 시점에서 가장 정확한 기상 데이터를 활용하기 위해서 세 가지 독특한 데이터 구조를 활용한다. 첫째, 마지막 예측값 후에 그다음 날 자정에 해당하는 예측값을 포함하여 매시간 별로 25개의 독립적인 예측모델을 활용한다. 그 이유는 시간이 지남에 따라 기상 데이터의 정확도는 계속 떨어지기 때문에 서로 다른 정확도를 가진 기상 데이터를 하나의 모델에 넣게 되면 데이터의 정확도가 오염되기 때문이다. 15분 단위의 최종 예측값은 매시간 예측된 수요에 내삽법을 이용하여 구한다. 둘째, 목표 시간마다 가장 정확한 기상 데이터를 사용한다. 이 대회에서는 매시간 3일 앞의 기상 데이터를 예측하기 때문에, 주어진 목표 시간에 대해서 9시간 전과 72시간 전에 예측된 데이터를 포함해서 64개의 데이터를 주지만, 가장 빠른 3개의 기상 데이터를 사용한다. 셋째, 미래의 기온과 운량은 유체이므로, 정확한 예측은 힘들지만 전체적인 흐름은 예측이 가능하다. 따라서 목표 시간, 목표 한 시간 전, 그리고 목표 한 시간 후에 해당하는 기상 데이터를 활용하여, 유체가 가지는 특성을 반영하여 예측 기상 데이터의 정확도를 높인다.

3.3 추가 활용 데이터

우리는 예측 정확도를 높이기 위해서 관측된 기상 데이터로부터 정확도에 도움이 되는 데이터들을 추출한다. 첫째, 선형적으로 증가하는 값과 그 값의 log값을 활용한다. 일반적으로 전력수요는 천천히 증가하기 때문에 천천히 증가하는 값을 활용하면 예측 추세를 고려할 수 있다. 동시에 비선형적으로 증가하는 전력수요량을 고려하기 위해서 선형적으로 증가하는 값의 log값도 활용한다. 둘째, 한 달 전 요일별 24시간 동안의 전력수요를 예측에 활용한다. 그런 이유는 전력수요는 인간 활동에 기초하고 그렇기에 시간과 요일에 크게 의존하므로 요일별 24시간의 전력수요를 예측하여 활용한다. 셋째, 최근 수요 추세를 반영하기 위해서, 일주일 전과 하루 전에 매시간 측정된 전력수요를 예측모델에 활용한다. 넷째, 목표 날짜와 1월 1일 사이의 날짜 차이도 활용하여 연간 계절 패턴도 분석한다. 그뿐만 아니라 시간과 요일 정보도 사용한다. 마지막으로, 전력수요는 그날 날씨에 따라서 시작 값이 다르므로 가장 최근의 전력수요 시작점을 고려하기 위해 측정된 전력수요의 마지막 몇 시간의 전력수요 평균도 사용한다.

4. 예측 기법 소개

이 장에서는 예측변수 $ x_{d}=[x_{d1},\: x_{d2}\cdots x_{dn}]^{\top}$, 그것의 행렬형 $ X =[ x_{1},\: x_{2}\cdots x_{D}]$, 응답변수 $ y =[y_{1},\: y_{2}…y_{N}]^{\top}$를 이용한 Ridge, SVM, GBM, 그리고 앙상블 모델을 소개한다. 이때 $D$ 차원($j=1,\: 2,\:\cdots ,\: D$)의 변수와 $N$ 개의 관측값($i=1,\: 2,\:\cdots ,\: N$)이 사용된다.

4.1 Ridge regression

능선회귀분석 (Ridge regression)은 벌점 변수 $\lambda$를 이용하여 계수 크기에 제약을 주어, 입력의 변동성에 따른 예측값의 변동성을 줄인다. 능선회귀분석의 예측 모델 $F$는 식(1)과 같이 주어진다.

(1)
$F( x)=\beta_{0}+\sum_{d=1}^{D} x_{d}\beta_{d}$

이때 능선회귀분석의 계수 $\beta$는 식(2)를 이용해서 예측오차와 계수 크기의 합을 최소로 할 때 구해진다.

(2)
$\hat\beta^{rid\ge}=\arg\min_{\beta}\left\{\sum_{n=1}^{N}\left(y_{n}-(\beta_{0}+\sum_{d=1}^{D}x_{nd}\beta_{d})\right)^{2}+\lambda\sum_{d=1}^{D}\beta_{d}^{2}\right\}$

식(2)를 풀면 능선회귀분석의 회귀모델의 계수인 $\hat\beta^{rid\ge}$는 아래의 식(3)을 통해 구해진다.(18)

(3)
$\hat\beta^{rid\ge}=\left( X^{T} X +\lambda I^{-1}\right) X^{T} y$

4.2 Support Vector Machine(SVM)

SVM은 의사결정을 지지하는 지지 벡터 (supporting vector)를 이용해서 예측한다. SVM의 강점은 선형회귀와 다르게 다양한 커널함수들을 이용해 예측변수의 차원을 확장함으로써 데이터가 중첩되어 있어도 구분면을 찾을 수 있다. 또한, SVM은 의사결정을 지지하는 데이터만을 최소한으로 활용하기 때문에 과적합 되는 경향이 적다.

SVM은 예측오차와 구분면과 지지 벡터 사이의 거리의 역수의 합을 최소화하는 방향으로 모델링된다. 예측 모델 $F(x)$가 식(1)을 따를 때, 구분면은 $\beta$로 정의된다. 예측변수가 $ x_{i}$($i=1,\: 2,\: 3,\:\cdots ,\: N$)이라면 각 데이터마다 $y_{i}$($i=1,\: 2,\:\cdots ,\: N$)가 주어질 때, 계수 $\beta$는 식(4)를 최소화할 때 구해진다.

(4)
$\min C\sum_{i=1}^{N}(\xi_{i}+\hat\xi_{i})+\dfrac{1}{2}∥\beta∥^{2}$

(5)
$s.t. t_{i}\le F( x_{i})+\epsilon_{i}+\xi_{i},\:\forall i\in N$

(6)
$t_{i}\ge F( x_{i})+\epsilon_{i}+\hat\xi_{i},\:\forall i\in N$

(7)
$\xi_{i}\ge 0 ,\:\forall i\in N$

(8)
$$ \hat{\xi}_{i} \geq 0, \forall i \in N $$

식(5)(6)의 오른쪽 항 중 $\epsilon_{i}$은 허용범위를 나타낸다. 실제값과 예측값의 차이가 $\epsilon_{i}$보다 작으면 오차값이 0이고 $\epsilon_{i}$보다 크면 오차값이 부과된다. 슬랙변수 $\xi_{i}$와 $\hat\xi_{i}$는 측정값과 오차 허용치 $\epsilon_{i}$의 합보다 예측값이 얼마나 더 벗어나는가를 나타내며 식(8)식(9)에 따라 0보다 큰 값을 가진다. 식(5)의 오른쪽 항은 계수의 크기를 최소화하여 계수 $\beta$과 지지 벡터 사이의 거리를 최대화해준다. 그림 2는 $\epsilon$와 $\xi$의 의미를 잘 표현한다.

그림. 2. Support Vector Machine

Fig. 2. Support Vector Machine

../../Resources/kiee/KIEE.2019.68.7.834/fig2.png

그뿐만 아니라 식(4)는 라그랑주 승수법을 통한 convex optimization을 이용해서 풀 수 있다. SVM에 관한 자세한 설명은 다음 논문에 잘 나와 있다.(19)

4.3 Gradient Boosting Machine(GBM)

부스팅(Boosting)이란 부정확한 모델들을 점차 개선시켜 더 정확한 모델을 만드는 방법을 말한다.(20) 정확도가 낮더라고 일단 모델을 만든 후 오차가 큰 측정값에는 가중치를 크게 적용하고 오차가 작은 측정값에는 작게 적용함으로서 이전 모델의 약점을 다음 모델에서 보완한다. 모델이 개선되는 과정은 그림 3에 잘 나와 있다.

그림. 3. Boosting 모델 개선 과정

Fig. 3. Updating process of the boosting model

../../Resources/kiee/KIEE.2019.68.7.834/fig3.png

이 과정에서 측정값마다 예측오차를 측정하여 적용시킬 가중치를 선정하는 것이 중요한데 부스팅 모델 중에서 GBM은 Gradient Descent 방법을 이용하여 가중치를 결정한다. $F(x)$를 약한 모델의 예측값이라고 가정한다면 각 변수마다의 예측오차를 식(9)의 오차함수 $L$로 나타낼 수 있다.

(9)
$L( y ,\:F( X))=\sum_{i=1}^{N}(y_{i}-F( x_{i}))^{2},\:\forall i\in N$

(10)
$$ \hat{F}(\boldsymbol{X})=\arg \min _{F} L(F(\boldsymbol{X})) $$

식(9)의 값이 식(11)과같이 예측오차의 값이 작아지는 방향으로 $k=1,\:2,\:...M$ 번 개선할 때 우리는 미분한 기울기를 $F(x)$의 개선 방향으로 정의한다. $k$번째 개선에서, 미분한 기울기의 방향 $g_{k}(x)$은 식(12)에, 기울기의 크기 $\rho_{k}$는 식(13)에 정의되어 있다.

(11)
${g}_{k}( x_{i})=[\dfrac{\partial L(y_{i},\:F( x_{i}))}{\partial F( x_{i})}\vert x]_{F( x_{i})=F_{k-1( x_{i})}},\:\forall i\in N,\:\forall k\in M$

(12)
$$ \rho_{k}=\underset{\rho}{\arg \min } L\left(F\left(x_{i}\right)_{k-1}-\rho g_{k}\left(x_{i}\right)\right), \forall i \in N, \forall k \in M $$

${g}_{k}( x)$와 $\rho_{k}$의 곱을 개선량이라 정의한다면 새로운 $F(x)$는 식(14), 식(15), 그리고 식(16)에 따라 개선된다. 이와 같은 알고리즘을 따라 모델은 기울기의 방향으로 $M$번 개선되어 최종 모델을 완성한다.

(13)
$f_{k}( x_{i})=\rho_{k}{g}_{k}( x_{i}),\:\forall i\in N,\:\forall k\in M$

(14)
$F_{M-1}( x_{i})=\sum_{k=0}^{M-1}f_{k}( x_{i}),\:\forall i\in N$

(15)
$F_{M}( x_{i})=F_{M-1}( x_{i})+f_{M}( x_{i}),\:\forall i\in N$

4.4 가중 앙상블 모델

가중 앙상블 모델에서는 여러 알고리즘의 예측결과에 가중치를 적용 후 평균하여 최종 결과를 구한다. Ridge regression, SVM, GBM 알고리즘의 결과값이 각각 $ x_{rid\ge}$, $ x_{SVM}$, $ x_{GBM}$일 때 가중 평균값인 $mean_{weighted}$의 예측오차를 최소로 만드는 가중치가 $w_{rid\ge}$, $w_{SVM}$, $w_{GBM}$이라면 최종 예측결과는 식(17)과 같이 구해진다.

(16)
$ mean_{weighted}=\dfrac{w_{rid\ge} x_{rid\ge}+w_{SVM} x_{SVM}+w_{GBM} x_{GBM}}{w_{rid\ge}+w_{SVM}+w_{GBM}}$

가중 평균값을 사용하였기 때문에 예측값이 극단적으로 쏠리지 않고, 다양한 예측 모델들이 성능이 약한 구간을 보완하여 예측 정확도를 높인다. 또한, 가중치는 개별 알고리즘의 성능에 비례하기 때문에, 관측되지 않은 다양한 데이터에 대해 안정적이고 높은 예측 성능을 보장한다.(21)

5. 최적 데이터 조합 구성

이 장에서는 최적 기상 데이터 조합, 연도 데이터 조합, 그리고 기상관측소 조합을 구성하는 방법에 관해 설명한다. 최적 데이터를 조합해야 하는 이유는 여러 가지가 있다. 첫째, 데이터가 너무 많으면 예측에 도움이 되지 않는 불량 데이터가 유입된다. 예측 정확도를 최고로 만들 수 있는 데이터만 가지고 예측을 해야 한다. 둘째, 데이터의 크기가 크면 연산속도가 느려지고 연산 시간을 줄이려면 목표하는 예측 정확도를 줄여야 한다. 이 예측 대회에서는 6시간 안에 예측을 해야 하므로 예측 정확도를 유지하면서 연산속도를 줄여야 한다. 셋째, 가지고 있는 데이터의 기간이 짧을 때 독립변수들의 개수가 많아지면, 예측모델이 과적합 된다. 사용된 기상 데이터의 수를 줄임으로써 과적합을 막을 수 있다.

최적 데이터 조합은 예측 정확도와 상관계수를 이용하여 찾을 수 있다. 본 논문에서는 이 두 방법의 성능을 예측 정확도로 측정한다. 이때 측정 연도 사이의 상관관계는 물리적 의미가 없기 때문에 예측 정확도만을 이용해서 측정 연도의 최적 조합을 구하고, 기상관측소의 최적 조합은 두 가지 방법을 모두 사용한다. 예측 정확도는 예측오차로 정의하고 식(18)에 따라 평균제곱근오차 (RMSE; root mean square error)로 계산한다.

(17)
${RMSE} =\sqrt{E(( t - y)^{2})}=\sqrt{\dfrac{\sum_{i=1}^{N}(t_{i}-y_{i})^{2}}{N}}$

따라서 최적 데이터 조합 구성에 관한 실험은 다음과 같이 정리된다. 첫째, 예측 정확도를 분석하여 기온과 운량이 예측에 도움이 됨을 보인다. 둘째, 예측 정확도를 이용하여 연도조합별 예측 정확도를 측정 후 최적의 연도조합을 선택한다. 셋째, 상관계수를 이용하여 최적 데이터 조합을 찾아서 대조군으로 삼는다. 넷째, 예측 정확도를 이용하여 예측 정확도 향상에 유리한 관측소를 선택하고 실험군으로 삼는다. 그림 4에는 네 가지 실험들이 잘 나열되어 있다.

그림. 4. 예측변수 선택방법

Fig. 4. Variable selection methods

../../Resources/kiee/KIEE.2019.68.7.834/fig4.png

5.1 기온 및 운량 데이터의 예측 기여도 분석

이 절에서 우리는 관측소에서 제공되는 기온과 운량이 예측 정확도 향상에 기여하는지에 대해 10일치 데이터에 대한 세 가지 실험으로 예측정확도를 확인한다. 첫 번째는 기온과 운량을 모두 사용, 두 번째는 기온만, 세 번째는 운량만을 고려하여 전력수요를 예측한다. 실험 결과는 그림 5에 잘 나와 있다. 첫째, 기온과 운량 모두 고려한 경우는 예측변수가 가장 많았고 대부분의 날에 대해서 예측 정확도가 가장 높다. 하지만 데이터가 두 배로 늘어나기 때문에 연산 시간이 많이 걸리므로 기온과 운량 중 전력수요와 연관성이 떨어지는 데이터를 제외하면 정확도를 더 높일 수 있을 것이다. 기온만 고려했을 때는 10일 중 5일만 정확도가 높고 운량만 고려했을 때는 정확도가 높지 않다. 따라서 우리는 기온과 운량을 모두 사용하되, 예측 정확도를 높이기 위해 데이터를 선별한다.

그림. 5. 기온 및 운량 데이터의 예측 정확도 평가

Fig. 5. Contribution of temperature and cloud index data

../../Resources/kiee/KIEE.2019.68.7.834/fig5.png

5.2 예측 정확도를 활용한 최적 데이터 연도 조합 선택

우선 예측 정확도를 이용해서 최적 데이터 연도 조합을 구한다. 우리는 2012년부터 2018년 2월까지 측정된 데이터 중에서 예측 정확도를 최대화할 수 있는 데이터 연도를 선택한다. 전력수요의 패턴은 매년 경제 구조, 인구, 그리고 기온에 따라 달라지기 때문에 특정 연도의 데이터는 현재의 수요 데이터 추세를 반영하지 못하므로 예측 정확도를 떨어트릴 수 있다. 모든 연도조합에 대해 실험을 해야 하나, 조합의 숫자가 너무 많아 일일이 실험하기는 힘들다. 따라서 우리는 최근 2017년과 2018년 데이터는 현재 예측 정확도 향상에 도움이 된다는 가정하에, 2017년과 2018년 데이터의 조합에 2012년부터 2016년까지의 데이터를 하나씩 더하여 다섯 가지 조합을 만들고 예측 정확도가 가장 높은 조합을 선택한다. 표 1은 다섯 가지 조합들을 나타낸다.

표 1. 연도조합과 구성

Table 1. Year combinations

Year combination

1

2013, 2017, 2018

2

2014, 2017, 2018

3

2015, 2017, 2018

4

2016, 2017, 2018

5

2017, 2018

5.3 전력수요와 기상 데이터 사이의 상관관계 이용

데이터를 선택할 할 때는 데이터 사이의 통계적 상관관계를 활용한다. 대표적으로 단계별 다중회귀 분석방법은 예측변수를 선택할 때 사용 가능한 모든 변수를 예측변수로 가정하고 종속변수와의 통계적 상관관계를 이용하여 최종 예측변수를 구한다.(22) 종속변수와 상관관계가 높은 독립변수는 남겨두고, 상관관계가 낮은 독립변수는 제거하여 종속변수를 잘 예측할 수 있는 회귀모형을 만든다. 그러나 단계별 다중회귀방법의 경우 시간이 오래 걸리고, 다변수 동시 선택이 불가능하다. 따라서 우리는 단계별 다중회귀 분석방법에서 상관관계를 기준으로 예측변수를 선택하는 상관관계법만을 차용하여 연산 시간을 줄인다.

우리는 기상과 수요 데이터 사이의 상관관계를 분석하여 데이터를 선별하는 상관관계법을 대조군으로 삼는다. 이때 예측오차를 기반으로 관측소를 선택하는 예측 정확도 방법은 실험군이 된다. 본 논문에서는 Pearson 상관계수와 p-value 유의도를 이용하여 상관관계를 구한다. Pearson 상관계수의 경우 주어진 두 변수 사이에 한 변수가 증가할 때 다른 변수가 증가하면 이 두 변수는 높은 상관계수를 가지고, 반대로 다른 변수가 감소하면 두 변수는 낮은 상관계수를 가진다. 예를 들면, 전력수요의 경우 기온이 높아지면 전력수요가 증가하므로 전력수요와 기온은 양의 상관계수를 가진다. 따라서 상관관계법에서는 두 변수 사이의 상관관계만 구할 수 있다. 하지만 기상관측소는 기온과 운량의 두 가지 데이터를 가지므로 기상관측소와 수요 사이의 상관관계는 구할 수 없다. 그러므로 이 방법은 기상관측소를 선택하지는 못하지만 210개의 기온과 운량 데이터 중 연관성이 높은 변수 선택에 활용하여 대조군으로 삼는다.

5.4 예측 정확도를 활용한 최적 기상관측소 조합 선택

예측 정확도 향상에 기여하는 기상관측소만 선별하여 정확도를 높일 수 있다(15). 그림 6은 최적 연도와 기상관측소 조합을 선택하는 방법을 잘 보여준다.

그림. 6. 예측변수 선별과정

Fig. 6. Process of prediction variable selection

../../Resources/kiee/KIEE.2019.68.7.834/fig6.png

35개의 기상관측소 각각의 기상 데이터만을 이용하여 예측모델을 만들고 전력수요 예측값을 구한다. 이때 예측오차가 작아질수록 해당 기상관측소가 정확도에 기여하는 바는 커진다. 따라서 오차가 작은 데이터들만 선택하면 정확도에 기여도가 높은 데이터들을 수집하여 오차를 줄일 수 있다. 예측 오차가 낮은 순서대로 35개의 기상관측소를 나열하고, 순서대로 기상관측소들을 조합해 나간다. 그리고 이 35개의 조합 중에서 오차가 가장 낮은 기상관측소 조합을 최적 기상관측소 조합으로 선택한다.

6. 실험 결과

이 장에서는 본 논문에서 소개한 예측 기법들의 정확도와 데이터 선택방법의 정확도를 평가한다. 다양한 알고리즘을 통하여 전력수요를 예측하는 과정은 그림 7에 나와 있고, 이 과정은 그림 8에 도식화되어 있다.

그림. 7. 전력수요 예측 순서도

Fig. 7. Flow chart of the demand forecasting

../../Resources/kiee/KIEE.2019.68.7.834/fig7.png

우선 예측 기법들의 기본 예측 정확도를 비교한다. 다음으로 상관관계를 이용한 방법의 예측 정확도를 측정하여 대조군으로 정한다. 그런 다음에 예측 정확도를 이용하여 최적 연도 조합 선택, 기상관측소 개수 설정, 그리고 기상관측소 조합 선택에 대한 실험 결과를 실험군으로 정한 후 대조군과 비교한다. 예측 정확도는 2018년 1월 17일에서 2018년 1월 31일까지 2주간 측정된 전력수요를 이용해서 평가했다. 본 논문에는 논문 공간을 고려하여 1월 29일과 30일 양일간의 결과만 보여주지만, 나머지 일들에 대한 정확도도 비슷하다.

그림. 8. 전력수요 예측과정

Fig. 8. Process of the demand forecasting

../../Resources/kiee/KIEE.2019.68.7.834/fig8.png

6.1 예측 모델 선택

표 2에 Ridge, SVM, GBM, 그리고 3개 모델의 예측결과를 가중 평균한 앙상블 모델의 예측 정확도를 나타냈다.

표 2. 네 가지 방법의 성능 비교

Table 2. Performance comparison of four algorithms

Ridge

SVM

GBM

Ensemble

1/30

2113

1559

919

891

1/29

2172

1208

939

905

Time

2min

21h

4h

26h

가중 앙상블 모델에는 총 3가지 알고리즘을 이용한 모든 예측결과가 필요하므로 단일 알고리즘을 이용한 방법보다 시간이 오래 걸린다. 결과적으로 가중 앙상블 모델의 예측 정확도가 가장 높지만, 시간 제약을 고려하여 본 논문에서는 두 번째로 예측 정확도가 높았던 방법인 GBM을 기본 예측모델로 선택한다. 그림 9는 GBM을 사용하여 먼저 예측변수를 선별하지 않고 모든 기상 데이터를 이용해 1월 30일의 수요를 예측하고, 예측오차가 919임을 나타낸다.

그림. 9. GBM 모델을 이용한 결과

Fig. 9. Result of the GBM model

../../Resources/kiee/KIEE.2019.68.7.834/fig9.png

6.2 상관계수를 이용한 기상관측소 선택

먼저 전력수요와 기상 데이터 사이의 상관관계를 다음의 두 가지 방법으로 구하여 기상 데이터를 선별한다. 첫 번째로 예측변수와 종속변수 사이의 p-value가 0.05보다 작으면 연관성이 낮다고 판단되어 최종 예측변수에서 제외한다. 두 번째로 Pearson 상관계수는 절댓값이 1에 가까울수록 종속변수와 예측변수의 상관관계가 높다고 판단된다. 210개의 기상 데이터와 전력수요 사이의 Pearson 상관계수를 구하여 그 값의 절댓값이 0.5이상 1이하인 변수들을 선택하여 최종 예측변수를 선택한다. 상관계수를 구하는 방법으로 예측변수를 선별했을 때 그림 10에서 나타나듯이 예측오차가 628과 621로 낮아진다.

그림. 10. 상관관계법을 이용한 결과

Fig. 10. Result of the correlation method

../../Resources/kiee/KIEE.2019.68.7.834/fig10.png

6.3 예측 정확도 기반의 연도 및 기상관측소 선택

실험군으로 예측 정확도를 이용하여 최적 연도조합, 기상관측소 개수, 기상관측소 조합을 구한다.

6.3.1 연도조합 선택

먼저 최적의 연도조합을 구한다. 그림 11표 1의 연도조합별 성능을 보여준다.

그림. 11. 연도조합에 따른 예측 정확도

Fig. 11. Performance with respect to year combinations

../../Resources/kiee/KIEE.2019.68.7.834/fig11.png

그림 11에서 볼 수 있듯이 1월 17일부터 1월 31일까지 총 2주간 예측오차를 모아 평균을 내었을 때 연도조합 5의 정확도가 가장 높다. 연도조합1과 연도조합5의 결과를 그림 12에 도식한다. 이때 연도조합1의 정확도가 훨씬 떨어진다. 왜냐하면 2013년과 2014년의 예전 데이터는 현재 전력수요추세와 동떨어져 있기 때문에 오히려 예측 정확도를 떨어뜨린다. 2017년과 2018년의 데이터(연도조합 5)만을 고려했을 때 가장 예측오차가 낮으며 많은 데이터 개수가 정확도를 항상 높이는 것은 아니라는 것을 확인할 수 있다.

그림. 12. 연도조합 1과 5를 이용한 결과

Fig. 12. Result of the year combination 1 and 5

../../Resources/kiee/KIEE.2019.68.7.834/fig12.png

6.3.2 개별 기상관측소의 예측 정확도

개별 기상관측소의 정확도를 테스트한다. 그림 13은 2018년 1월 17일에서 2018년 1월 31일까지 2주간 예측오차 값을 평균한 그래프이다. 그림 13에서 알 수 있듯이 관측소 5번, 9번, 10번, 11번, 12번이 가장 성능이 좋다.

그림. 13. 개별관측소의 예측 정확도 분석

Fig. 13. Performance of individual weather station

../../Resources/kiee/KIEE.2019.68.7.834/fig13.png

6.3.3 기상관측소 개수 선택

개별 기상관측소의 예측오차를 이용하여 가장 오차가 작은 관측소부터 그 다음 오차를 가지는 관측소를 합해가면서 35가지 조합의 예측 정확도를 측정하여 기상관측소의 개수를 선택한다. 1월 17일부터 1월 31일까지 2주간 데이터를 사용하였고 2017년과 2018년(연도조합 5) 데이터만을 이용하여 진행한다. 그림 14에서 알 수 있듯이 상위 15개부터 21개의 기상관측소를 선택했을 때 정확도가 가장 높다.

그림. 14. 관측소 개수에 따른 예측 정확도 분석

Fig. 14. Performance with respect to the number of weather stations

../../Resources/kiee/KIEE.2019.68.7.834/fig14.png

6.3.4 예측 정확도 기반 데이터 선택법의 예측결과

예측 정확도를 활용하여 구한 최적 기상관측소 조합과 연도조합 하에서의 예측결과가 그림 15에 나와 있다. 이때 1월 30일의 예측오차가 592로 낮다. 그 이유는 수요와 연관성이 높은 기상관측소의 데이터만 사용하였고 적절한 연도조합을 선택했기 때문이다.

그림. 15. 예측 정확도를 이용한 결과

Fig. 15. Result of the RMSE method

../../Resources/kiee/KIEE.2019.68.7.834/fig15.png

6.4 최종 결과

아래 표 3에 RMSE를 이용하는 예측 정확도가 p-value와 Pearson 상관계수를 이용하는 상관관계법보다 예측 정확도가 더 높다. 이때 예측변수의 수가 달라서 발생하는 오차를 줄이기 위해 선택되는 변수의 개수가 100개 전후가 되도록 p-value의 유의도 기준을 0.05로 고정하고, Pearson 상관계수의 절댓값이 0.5와 1 사이에 있도록 조정한다.

상관관계법에서는 기상관측소의 예측 정확도에 대한 직접적인 연관성을 고려하지 못했기 때문에 예측 정확도법보다 상관관계법의 예측오차가 더 크다. 반면에 예측 정확도법의 경우 기상 데이터와 예측 정확도 사이의 직접적인 관계를 분석할 수 있었기 때문에 예측오차가 가장 작은 조합을 찾을 수 있다. 게다가 하나의 기상관측소에는 기온, 운량 두 가지 데이터가 존재하므로 변수와 변수 사이의 상관관계만 구할 수 있는 상관관계법을 통해서는 기상관측소와 수요 사이의 상관관계는 구할 수 없다. 이는 추가적인 기상 관측소를 고려해야 하므로 데이터 확보에 대한 부담을 가중시킨다. 하지만 예측 정확도법의 경우 개별관측소의 정확도 평가와 관측소 개수의 예측 정확도 평가를 위해 총 70번 학습을 해야 하므로 시간이 오래 걸린다.

표 3. 1월 30일 예측오차 비교

Table 3. Performance comparisons on the data measured at 1/30

1/30

Before selection

After selection

RMSE

919

592

p-value

628

Pearson

621

7. 결 론

본 논문은 예측 정확도가 높은 예측 알고리즘을 선택하고 예측 정확도 기반의 데이터 조합 방법을 이용하여 전력수요를 높은 정확도로 예측하는 새로운 방법을 제시한다. 우리는 프랑스에서 개최된 수요예측 대회에 참가함으로서 얻은 데이터를 통해 이 방법을 검증한다. 첫째, 병렬 구조 예측 모델을 활용하여, 시간이 지남에 따라 예측 정확도가 떨어지는 것을 고려해서 예측 정확도를 높이고, 이때 연산속도가 줄어드는 것을 막을 수 있었다. 둘째, 3가지 머신러닝 알고리즘 Ridge, SVM, GBM, 그리고 이들의 가중 앙상블 방법의 예측 정확도를 측정 한 후에 가장 정확도가 높은 알고리즘을 선택한다. 가중 앙상블 방법의 정확도가 가장 높았지만 실제 실험에서는 연산 시간을 고려하여 GBM을 선택하였다. 셋째, 예측 정확도법을 통해 최적 연도조합을 찾아 예측변수의 개수($N$)을 줄였다. 최적의 연도조합이 2017년과 2018년의 데이터만을 고려했을 때 오차가 최소가 된다. 넷째, 예측 정확도법을 통해 예측변수를 선별하여 데이터 차원($D$)를 줄인다. 동시에 상관관계법을 대조군으로서 정하여 예측 정확도를 비교한다. 결과적으로 예측 정확도법이 상관관계법보다 높은 정확도를 가진다.

Acknowledgements

This work was supported by the National Research Foundation of Korea (NRF) grant funded by the Korea government (MSIT). (No.NRF-2017R1D1A1B03035806) This research was supported by Korea Electric Power Corporation. (No.R18xa06-24)

References

1 
KPX , 2015, Development of Real-Time Load Forecasting Techni- que and A Study on On-Line Load Forecasting Scheme.Google Search
2 
Ryu Sung-Ho, 2014, A Study on the Improvement of Power Demand Prediction in Summer 2014, pp. 66-72Google Search
3 
KPX , 2015, A Study on the Strategy of the Load Forecasting System through the Analysis of Weather Characteristics.Google Search
4 
Bae Young-Sang, Kim Rae-Young, 2014, Control Strategy for a Grid Stabilization of a Large Scale PV Generation System based on German Grid Code, , Vol. 19, No. 1, pp. 41-50DOI
5 
Lim Jong-Hun, Kim Si-Yeon, Park Jeong-Do, Song Kyung-Bin, 2013, Representative Temperature Assessment for Improve- ment of Short-Term Load Forecasting Accuracy, Vol. 27, No. 6, pp. 39-43DOI
6 
Oh Seong-Bo, Lee Gae-Myoung-, Hwang Choong-Gu, 2014, The Effects of Penetration of the Electric Vehicles on the Electric Power Grid in the Jeju Island, , Vol. 63, No. 1, pp. 10-17DOI
7 
Kim Si-Yeon, Jung Hyun-Woo, Park Jeong-Do, Baek Seung-Mook, Kim Woo-Seon, Chon Kyung-Hee, Song Kyung-Bin, 2014, Weekly Maximum Electric Load Forecasting for 104 Weeks by Seasonal ARIMA Model, Vol. 28, No. 1, pp. 50-56DOI
8 
Jo Se-Won, Park Rae-Jun, Kim Kyeong-Hwan, Kwon Bo-Sung, Song Kyung-Bin, Park Jeong-Do, Park Hae-Su, 2018, Sensitivity Analysis of Temperature on Special Day Elec- tricity Demand in Jeju Island, Vol. 67, No. 8, pp. 1019-1023DOI
9 
Shin Yukyung., Fauzan Hanif. Jufri , Jung Jaesung., 2017, Development of the Photovoltaic System Abnormal State Forecasting Algorithm Using Support Vector Machine, pp. 1052-1053Google Search
10 
KPX , 2011, A Study on Short-term Load Forecasting Technique and its Application.Google Search
11 
Jeong Hui-Won, Ku Bon-Hui, Cha Jun-Min, 2016, A Study on the Weekend Load Forecasting of Jeju System by using Temperature Changes Sensitivity, Vol. 65, No. 5, pp. 718-723DOI
12 
Dehalwar V., Kalam A., Kolhe M. L., Zayegh A., 2016, Electricity load forecasting for Urban area using weather forecast information, pp. 355-359DOI
13 
Papadopoulos S., Karakatsanis I., 2015, Short-term electricity load forecasting using time series and ensemble learning methods, pp. 1-6DOI
14 
Saber A. Y., Alam A. K. M. R., 2017, Short term load forecasting using multiple linear regression for big data, pp. 1-6DOI
15 
Cheng J., Zhang N., Wang Y., Kang C., Zhu W., Luo M., Que H., 2016, Evaluating the spatial correlations of multi-area load forecasting errors, pp. 1-6DOI
16 
Lee D., Baldick. R., 2017, Load and Wind Power Scenario Gener- ation Through the Generalized Dynamic Factor Model, Vol. 32, No. 1, pp. 400-410DOI
17 
RTE France, May. 2019, www.rte-france.comGoogle Search
18 
Seok Kyung Ha, 2013, A study on semi-supervised kernel ridge regression estimation, Vol. 24, No. 2, pp. 341-353DOI
19 
Zhang Ming-Guang., 2005, Short-term load forecasting based on support vector machines regression, in 2005, Vol. 7, pp. 4310-4314DOI
20 
Vaghela V. B., Ganatra A., Thakkar A., 2009, Boost a Weak Learner to a Strong Learner Using Ensemble System Ap- proach, pp. 1432-1436DOI
21 
Hansson. M., 1999, Optimized weighted averaging of peak matched multiple window spectrum estimators, Vol. 47, No. 4, pp. 1141-1146DOI
22 
Archdeacon. T. J., 1993, Correlation and Regression Analysis.Google Search

저자소개

Sooyeon Kim
../../Resources/kiee/KIEE.2019.68.7.834/au1.png

She is currently pursuing the B.S. degree in electronic and electrical engineering in 2019 at the Konkuk University, Seoul, Korea.

Meongsu Son
../../Resources/kiee/KIEE.2019.68.7.834/au2.png

He received the B.S. degree in electronic and electrical engineering in 2019 at the Konkuk University, Seoul, Korea. He is currently pursuing the M.S. degree in the same university.

Kuduck Kwon
../../Resources/kiee/KIEE.2019.68.7.834/au3.png

He received the B.S. and Ph.D. degrees in electrical engineering and computer science at the Korea Advanced Institute of Science and Technology (KAIST), Daejeon, South Korea in 2004 and 2009, respectively. From 2009 to 2010, he was a post-doctoral researcher at KAIST. He is currently an assistant professor in the department of Electronics Engineering at the Kangwon National University, Chuncheon, Korea.

Duehee Lee
../../Resources/kiee/KIEE.2019.68.7.834/au4.png

He received the B.S. degree in electronic and electrical engineering in 2004 from Pohang University of Science and Technology, Pohang, Korea. He received the M.S. and Ph.D. degrees in the electrical and computer engineering at The University of Texas at Austin, Austin, TX, USA, in 2009 and 2015, respectively. He is currently an assistant professor in the electrical engineering department at the KonKuk University, Seoul, Korea.