1. 서 론
국내 전력 산업은 재생에너지 3020 이행 계획을 기점으로 풍력 및 태양광 발전의 보급을 추진하고 있다 [1]. 이러한 변동성 재생에너지의 급격한 증가는 전력 계통의 운영 불확실성을 가중시키는 요인으로 작용한다 [2]. 이에 대응하여 정부는 발전 사업자의 자발적인 예측 정확도 향상을 유도하고 계통 안정성에 기여하도록 재생에너지 발전량 예측제도를 도입하였다. 이
제도는 발전 사업자가 자체적으로 제출한 예측값(예측 제출값)의 정확도에 따라 차등적인 경제적 보상을 지급하는 것을 골자로 한다 [3]. 이러한 시장 환경의 변화는 기존의 기술적 예측 문제를 경제적 최적화 문제로 확장시킨다. 따라서 발전 사업자들은 단순히 오차율을 최소화하는 단일
예측값을 도출하는 것을 넘어, 예측제도의 정산 구조를 이해하고 기대 수익을 극대화해야 하는 새로운 재무적 의사결정 문제에 직면해 있다.
그럼에도 불구하고 기존의 발전량 예측 연구는 주로 결정론적 예측 방법에 집중해 왔다. 전통적으로는 Auto-Regressive Integrated
Moving Average (ARIMA)와 같은 통계적 기법이나 Support Vector Regression (SVR), Random Forest
등의 기계학습 모델이 널리 사용되어 왔으며 [4], 최근에는 시계열의 장기 의존성을 학습할 수 있는 Long Short-Term Memory (LSTM), Gated Recurrent Unit (GRU)
및 Transformer 기반의 다양한 딥러닝 모델들이 제안되고 있다 [5]. 이들은 복잡한 시계열 패턴을 학습하여 평균제곱오차나 평균절대오차와 같은 통계적 정확도 지표를 최소화하는 데 성과를 보였다. 그러나 이러한 통계적
지표의 개선이 반드시 경제적 수익의 극대화로 직결되는 것은 아니다 [6-
7]. 이러한 불일치는 본 연구가 대상으로 하는 재생에너지 발전량 예측제도의 계단형 정산 단가 구조 하에서 더욱 심화된다. 이 제도는 예측 오차율이 특정
기준 이내일 때만 인센티브를 지급하고, 이를 벗어나면 인센티브가 전액 소멸하는 방식을 따르기 때문이다. 결정론적 모델이 산출하는 단일 예측값은 주로
분포의 평균값을 지향하므로, 실제 발전량 분포가 비대칭적이거나 두꺼운 꼬리를 갖는 경우, 인센티브 수취 구간에 진입할 확률이 낮아질 수 있다. 다시
말해 높은 통계적 정확도를 달성한 모델이라 하더라도, 계단형 정산 단가 기준을 고려하지 않고 단순히 평균적인 예측값을 제출한다면 정산금을 수령하지
못하는 상황이 발생할 수 있다.
이러한 결정론적 예측의 경제적 한계를 보완하기 위하여 예측값뿐 아니라 그 주변의 불확실성을 확률 분포 형태로 제시하는 확률론적 예측 및 예측값 제출
전략이 제안됐다 [8]. 기존의 확률론적 예측 연구들은 예측 분포를 가우시안 분포로 모델링하여 불확실성을 추정하였다 [9]. 그러나 이러한 가정은 급격한 풍속 변화나 기상 이변으로 인해 실제로 관측되는 두꺼운 꼬리 특성이나 비대칭적인 예측 분포를 충분히 반영하지 못한다는
한계를 지닌다. 또한 일부 확률 기반 모델은 예측 분포가 반드시 0에서 설비용량 사이에 존재해야 한다는 물리적 제약을 엄밀하게 반영하지 못해, 0
미만 또는 설비용량을 초과하는 비현실적 발전량이 발생하는 문제가 있다. 이 경우 사후적으로 해당 구간을 절단하거나 분포 전체를 재정규화하는 인위적
보정 절차가 요구된다 [10]. 한편, 이러한 물리적 제약 조건을 만족시키기 위해 일반화된 Logit-Normal 분포를 활용하는 연구가 수행된 바 있으나, 여전히 변환된 공간
내에서 오차 분포가 가우시안을 따른다고 가정한다는 점에서 한계를 지닌다 [11].
본 연구는 결정론적 예측이 지니는 경제적 비효율성과 기존 확률론적 모델의 단순화된 통계 가정을 극복하는 것을 목표로 한다. 이를 위해 딥러닝 기반
예측 모델로부터 비정규·비대칭 특성을 반영한 예측 분포를 구성하고, 이를 계단형 정산 단가 구조 기반의 경제적 최적화를 결합한 통합 확률론적 예측값
제출 프레임워크를 제안한다. 제안 방법은 결정론적 예측, 레짐(Regime) 정의, 오차 시나리오 생성, 경제적 최적화의 네 단계로 구성된다. 먼저
딥러닝 기반의 Sequence-to-Sequence (Seq2Seq) 모델로 기초 예측 궤적을 생성한다. 다음으로 레짐의 개념을 도입하여 전체 구간을
분류한다. 통계학 및 시계열 분석에서 레짐은 데이터의 기초적인 생성 구조나 통계적 분포가 일관되게 유지되는 특정한 상태 공간을 의미한다. 본 연구에서는
이러한 개념을 적용하여, 풍력 발전량의 크기를 나타내는 발전량 수준(Level)을 기준으로 오차의 분포 패턴이 서로 다르게 군집화되는 개별 상태 구간을
레짐으로 정의한다. 이후 각 레짐에 따라 오차가 가지는 비대칭성과 두꺼운 꼬리 특성을 반영하기 위해 레비 프로세스(Lévy process)를 적용하여
확률적 시나리오를 생성한다. 마지막으로 확률적 시나리오와 예측정산 제도의 단가 구조를 결합하여 기대 정산금을 최대화하는 입찰 전략을 도출한다.
본 연구에서 딥러닝 모델은 기초적인 결정론적 궤적을 생성하는 도구로 활용되며, 이 궤적 위에 확률론적 오차 모델링을 결합하여 특정 시장 제도의 정산
규칙에 최적화된 경제적 의사결정으로 연결하는 통합 프레임워크를 제안한다. 본 연구가 기존 연구와 차별화되는 기여점은 다음과 같다.
1. 물리적 경계 부근과 중간 영역에서 상이하게 나타나는 오차의 변동성을 반영하기 위해 발전량 수준에 따른 레짐 분류 체계를 도입하여 오차 모델을
구성한다.
2. 발전 구간별 오차 변동의 비대칭성과 두꺼운 꼬리 분포 특성, 그리고 오차의 극단적 변동을 나타내는 점프 현상을 레비 프로세스를 통해 동시에 모델링하여
실제 풍력 발전의 불확실성을 반영한다.
3. 이렇게 도출된 확률론적 시나리오를 시장 제도의 계단형 정산 구조와 결합하여 실제 시장 참여자의 경제적 수익을 극대화하는 예측값 제출 전략 수립
방법론을 제시한다.
본 논문의 구성은 다음과 같다. 2장에서는 본 연구의 이론적 및 제도적 배경을 고찰한다. 먼저 본 연구의 최적화 문제의 배경이 되는 재생에너지 발전량
예측제도의 운영 규칙과 계단형 정산 단가 산정 구조를 설명한다. 이어 연속 시간 확률과정인 레비 프로세스의 개념을 설명하고, 레비 프로세스의 차분
분포로서 데이터의 비대칭성 및 두꺼운 꼬리 특성을 설명하는 α-안정 분포의 정의와 성질을 살펴본다. 또한, 결정론적 예측 궤적 생성의 기반이 되는
Seq2Seq 모델의 구조를 검토한다. 3장에서는 제안하는 통합 확률론적 예측값 제출 프레임워크를 기술하며, 여기에는 Logit 변환, 발전량 레짐별
오차 차분 분포 모델링, 그리고 기대 정산금 최대화 예측값 제출 전략의 수립 과정이 포함된다. 4장에서는 실제 풍력발전소 데이터를 활용한 실험 데이터
구성, 벤치마크 모델 설정을 통해 구체적인 실험 설계를 기술한다. 이후, 시뮬레이션 및 백테스트 결과를 제시하고, 이를 다각도로 분석하여 제안하는
방법론의 경제적 실효성을 입증한다. 마지막으로 5장에서는 본 연구의 결론을 요약하고 시사점 및 향후 연구 방향을 제시한다.
2. 예측제도의 비선형 정산 구조를 고려한 딥러닝 궤적 예측과 확률과정 기반 오차 모델링 이론
본 장은 3장에서 제안할 통합 확률론적 예측값 제출 프레임워크의 이론적 기반을 소개한다. 이를 위해, 먼저 본 연구의 경제적 최적화 문제의 배경이
되는 ‘재생에너지 발전량 예측제도’의 비선형적 정산 구조를 수학적으로 정의한다. 이어서 3장의 확률론적 오차 차분 모델링에 적용될 수학적 도구로서
레비 프로세스의 개념을 다룬다. 구체적으로, 기존 모델에서 널리 사용되는 브라운 운동의 가우시안 분포 가정이 갖는 한계를 극복하는 일반화된 확률과정으로서
‘레비 프로세스’의 이론을 기술한다.
2.1 재생에너지 발전량 예측제도의 비선형 정산 구조
본 연구의 수익 최적화 문제는 국내 재생에너지 발전량 예측제도의 정산 규칙에 근거하여 수립되었다. 이 제도는 발전 사업자가 제출하는 예측값과 실제
발전량의 오차율에 따라 정산 단가를 차등적으로 지급하는 계단형의 비선형적 정산 구조를 가진다 [12]. 특정 시간의 실제 발전량을 $y_{true}$라 하고, 사업자가 제출한 예측값을 $y_{bid}$라 할 때 해당 시간에 획득하는 예측제도의 정산
단가 $\Pi(y_{true}, y_{bid})$는 오차율과 발전량 수준에 따라 수식 (1)과 같이 조건부 함수로 정의된다.
위 수식에서 사용된 변수는 다음과 같다.
-
$\Pi(y_{true}, y_{bid})$: 해당 시간에 획득하는 정산 단가이다.
-
$y_{true}$: 설비용량 대비 실제 발전량이다.
-
$y_{bid}$: 설비용량 대비 사업자가 제출한 예측 제출값이다.
-
$\tau_1, \tau_2$: 정산 단가 결정의 기준이 되는 1차 및 2차 오차율 경계를 나타내는 상수이다.
-
$\pi_1, \pi_2$: 1차 및 2차 경계 이내일 때 지급되는 정산 단가이다.
본 연구에서 사용하는 모든 발전량 데이터는 설비용량으로 나누어 정규화한 값이므로, 항상 0과 1 사이의 값으로 정의된다. 수식 (1)의 조건문에 포함된 $y_{true} \ge 0.1$ 은 실제 발전량이 설비용량의 10% 이상일 때만 정산금이 지급된다는 제약 조건을 수식화한 것이다.
본 연구에서 적용하는 오차율 경계와 정산 단가는 2026년 6월부터 적용될 강화된 오차 기준을 따른다 [13]. 새로운 1차 오차율 경계 $\tau_1$은 4%, 2차 오차율 경계 $\tau_2$는 6%이며, 정산 단가 $\pi_1$과 $\pi_2$는 각각
4원/kWh, 3원/kWh이다.
2.2 풍력 발전의 불확실성 모델링
풍력 발전량 시계열 $Y(t)$는 그 본질상 예측 가능한 부분과 예측 불가능한 무작위적 요소가 결합된 확률과정으로 간주할 수 있다. 다수의 시계열
분석 연구에서는 이러한 복합적인 신호를 수식 (2)와 같이 결정론적 부분과 확률론적 부분의 합으로 분해하여 접근한다 [14].
위 수식에서 사용된 변수는 다음과 같다.
-
$Y(t)$: 시간 t에서의 총 풍력 발전량이다.
-
$\mu(t)$: 기상 조건 및 시계열 패턴에 의해 결정되는 결정론적 추세 함수이다. 이는 입력 변수가 주어졌을 때의 조건부 기댓값으로, 모델이 예측
가능한 발전 패턴을 의미한다.
-
$X(t)$: 결정론적 함수 $\mu(t)$로 설명되지 않는 확률론적 오차 프로세스이다. 이는 모델의 한계, 국지적 기상 변화로 인해 발생하는 불확실성을
내포한다.
본 연구에서는 위 수식의 $\mu(t)$를 도출하기 위해, 과거 기상 관측 데이터와 과거 발전량 그리고 기상 예보 데이터를 입력으로 하는 Seq2Seq
모델을 사용한다. 본 연구의 과제는 결정론적 모델 $\mu(t)$로 설명되지 않는 오차 프로세스 $X(t)$의 확률적 거동을 규명하는 데 있다. 이를
위해 본 절에서는 오차 시계열을 확률변수의 연속으로 보는 확률과정으로 정의한다. 특히, 결정론적 모델이 놓친 연속적 미세 변동과 급격한 점프라는 두
가지 불확실성을 동시에 포착할 수 있는 레비 프로세스를 소개한다.
2.3 레비 프로세스
레비 프로세스는 브라운 운동을 일반화한 확률과정으로, 연속적인 움직임과 불연속적인 점프를 모두 포함할 수 있어 복잡한 시계열 현상을 모델링하는 데
적합하다. 특히 금융 시장에서 자산 가격의 급등락을 모델링하기 위한 점프-확산 모델의 이론적 기반으로 널리 연구되어 왔다 [15]. 그림 1은 점프가 포함된 레비 프로세스의 경로를 보여주는 예시이다.
Fig. 1 Sample path of a Lévy process
레비-킨친 공식(Lévy-Khintchine formula)에 따르면, 레비 프로세스 $X(t)$의 특성 함수는 주파수 변수인 $u$를 이용하여 수식
(3)과 같이 표현된다 [16].
위 수식에서 사용된 변수는 다음과 같다.
-
$u$: 주파수 변수이다.
-
$\Psi(u)$: 특성 지수이다.
-
$t$: 시간 길이(누적 스케일)이다.
-
$j$: 허수이다.
이때 특성 지수 $\Psi$는 수식 (4)와 같이 세 가지 구성 요소의 합으로 유일하게 분해된다.
-
$\gamma$: 드리프트 계수로, 과정의 선형적이고 결정론적인 추세를 제어한다.
-
$\sigma^2$: 확산 계수의 분산으로, 과정의 연속적인 변동성, 즉 브라운 운동 부분의 크기를 결정한다.
-
$\nu(dx)$: 레비 측도로, 단위 시간당 발생하는 점프의 강도와 크기 분포를 결정한다. 이 측도는 과정의 불연속적인 부분을 결정하며, 램프 이벤트를
모델링한다.
특히 점프를 나타내는 적분 항에서 변수 $x$는 한 번에 발생하는 점프의 크기를 의미하며, 적분은 발생 가능한 모든 크기의 점프 효과를 종합하는 과정이다.
적분 내의 $-jux1_{|x|1}$은 작은 점프의 무한한 합이 발산하는 것을 막기 위한 보정항이다. 본 연구에서는 레비 프로세스의 점프 구성 요소를
활용하여, 서론에서 지적한 풍력 발전량의 급격한 변동이 야기하는 오차의 불연속적 거동을 모델링한다. 이는 브라운 운동만으로는 포착할 수 없는 현상을
수학적으로 모사할 수 있게 하여 예측 모델의 현실성과 정확성을 높인다.
2.4 α-안정 분포를 이용한 점프 모델링
레비 프로세스의 점프 구성 요소를 통해 풍력 발전량 오차의 불연속적인 점프를 모델링하기 위해서는 점프의 크기와 빈도를 결정하는 레비 측도 $\nu(dx)$를
꼬리가 두꺼운 멱함수 형태로 정의해야 한다. 풍력 발전량 오차에서 관찰되는 램프 이벤트와 같은 극단적 변동은 정규분포와 같은 전통적인 확률분포로는
설명하기 어렵다. 이러한 분포들은 데이터의 꼬리 부분, 즉 극단값이 발생할 확률을 과소평가하는 경향이 있기 때문이다.
이 문제를 해결하기 위해 본 연구에서는 레비 측도 $\nu(dx)$를 모델링하는 데 α-안정 분포를 사용한다. α-안정 분포는 중심극한정리를 일반화한
것으로, 두꺼운 꼬리와 비대칭성을 모델링할 수 있는 유연성을 제공한다. 이 특성은 간헐적으로 발생하지만 그 강도가 높은 풍력 발전량 오차의 점프 현상을
통계적으로 포착하는 데 적합하다 [17].
α-안정 분포는 일부 특수한 경우(정규분포, 코시 분포, 레비 분포)를 제외하고는 확률 밀도 함수가 닫힌 형태로 존재하지 않는다. 따라서 일반적으로
다음과 같은 특성 함수 $\phi$를 통해 수식 (5)와 같이 정의된다.
α-안정 분포는 다음 네 가지 파라미터에 의해 그 형태가 결정된다.
-
$\alpha$: 안정성 지수로, 분포 꼬리의 두께를 결정한다 (0<α≤2). $\alpha$가 2에 가까울수록 가우시안 분포와 유사해지며, 작아질수록
꼬리가 두꺼워져 극단값이 발생할 확률이 높아진다.
-
$\beta$: 비대칭 지수로, 분포의 비대칭성을 제어한다 (−1≤$\beta$≤1). $\beta=0$이면 대칭 분포이고, β>0이면 오른쪽으로
긴 꼬리를, β<0이면 왼쪽으로 긴 꼬리를 가진다.
-
$\gamma$: 척도 파라미터로, 분포의 폭을 결정한다 (γ>0). 가우시안 분포의 표준편차와 유사한 역할을 한다.
-
$\delta$: 위치 파라미터로, 분포의 중심 위치를 결정한다 ($\delta \in \mathbb{R}$). 가우시안 분포의 평균과 유사한 개념이다.
이 네 가지 파라미터를 통해 분포의 형태를 다양하게 조절할 수 있으며, 풍력 발전량 오차에 내재된 복잡한 통계적 특성을 효과적으로 모델링할 수 있다.
다만 α-안정 분포는 확률 밀도 함수가 닫힌 형태로 존재하지 않아 표준적인 최우도 추정법 적용이 어렵다. 따라서 본 연구에서는 이러한 문제를 해결하기
위해 경험적 특성함수 (ECF: Empirical Characteristic Function)와 좌우 꼬리 분위수(1, 5, 10, 90, 95,
99 분위수)를 동시에 맞추는 최소거리 추정법을 사용하여 4가지 파라미터($\alpha, \beta, \gamma, \delta$)를 추정한다 [18-
19]. 이후 이 α-안정 분포를 활용하여 풍력 발전량의 급격한 변동이 야기하는 예측 불확실성을 포착하고자 한다.
2.5 시계열 예측을 위한 Seq2Seq 프레임워크
앞선 절에서 시계열의 불확실성을 모델링하기 위한 수학적 도구를 소개했다. 본 절에서는 이후의 확률론적 오차 모델 및 시나리오 생성 절차의 기반이 되는
예측 모델로서, 다중 시점의 시계열 출력이 가능한 Sequence-to-Sequence (Seq2Seq) 프레임워크를 설명한다. Seq2Seq 모델은
본래 기계 번역을 목적으로 제안되었으나, 시계열 데이터의 시간적 의존성을 학습할 수 있어 최근 시계열 예측 분야에서도 활용되고 있다 [20].
Seq2Seq 모델은 크게 두 부분으로 구성된다. 입력 시퀀스를 고정된 크기의 벡터로 압축하는 인코더와 이 벡터를 받아 출력 시퀀스를 생성하는 디코더이다.
인코더는 과거 시계열 데이터를 차례로 읽어 그 의미를 하나의 벡터로 요약하고, 디코더는 이 요약된 벡터를 이용해 미래의 시계열을 예측한다. 이런 구조
덕분에 입력과 출력의 길이가 서로 달라도 같은 모델을 사용할 수 있다. 또한, 하루전 예측과 같은 시계열 문제에서 관측이 종료되는 시점과 예측 대상이
시작되는 시점 사이에 물리적인 시간 간극을 건너뛰어 미래의 출력 시퀀스를 생성할 수 있다. Seq2Seq 모델의 전체적인 구조는 그림 2와 같다.
Fig. 2 Schematic diagram of the Seq2Seq model
모델은 관측이 완료된 최근 시점 $t-k$까지의 과거 데이터를 입력받아 $t$시점부터의 미래를 예측한다. 다음 수식 (6)은 인코더의 입력 시퀀스와 디코더의 출력 시퀀스를 나타낸다.
위 수식에서 사용된 변수는 다음과 같다.
-
$m$: 인코더 입력 시퀀스의 길이를 나타낸다.
-
$k$: 인코더 입력 시퀀스와 디코더 출력 시퀀스의 시간 간극을 의미한다.
-
$H$: 디코더 출력 시퀀스의 길이를 나타낸다.
-
$x$: 인코더 입력 벡터 집합이다.
-
$x_{t-k}$: 시간 $t-k$에서의 입력 벡터이다.
인코더와 디코더는 일반적으로 LSTM과 같은 순환 신경망 (RNN: Recurrent Neural Network)으로 구성된다. RNN의 기본적인
연산 과정은 수식 (7)과 수식 (8)로 표현된다 [21].
위 수식에서 사용된 변수는 다음과 같다.
-
$i$: 입력 시간 구간 $[t-k-m+1, t-k]$ 내의 인덱스이다.
-
$h_i$: 시간 $i$에서의 은닉 상태이다.
-
$W_{hx}, W_{hh}, W_{oh}$: 각각 입력-은닉, 은닉-은닉, 은닉-출력 층의 가중치 행렬이다.
-
$b_h, b_o$: 은닉 층과 출력 층의 편향 벡터이다.
-
$o_i$: 시간 $i$에서의 출력 벡터이다.
Seq2Seq 모델의 전체적인 데이터 흐름에서, 먼저 인코더는 입력 시계열 ($x_{t-m-k+1}, x_{t-m-k+2}, \dots, x_{t-k}$)을
처리하여 최종적으로 문맥 벡터 $c$를 수식 (9)와 같이 생성한다.
위 수식에서 사용된 변수는 다음을 나타낸다.
-
$c$: 인코더의 모든 데이터를 압축한 문맥 벡터이다.
-
$\phi$: 인코더의 은닉 상태 시계열을 하나의 벡터로 변환하는 함수이다.
-
$h_{t-k-m+1}, h_{t-k-m+2}, \dots, h_{t-k}$: 인코더와 각 시간에서의 은닉 상태 시계열이다.
이후 디코더는 문맥 벡터 $c$와 이전 스텝의 예측값을 활용하여 수식 (10)과 같이 다음 스텝의 예측값을 순차적으로 생성한다.
위 수식에서 사용된 변수는 다음을 나타낸다.
-
$Y_{t+q}$: 디코더의 시간 $t+q$에서의 예측값이다.
-
$h_{t+q+1}^{dec}$: 디코더의 시간 $t+q+1$에서의 은닉 상태이다.
-
$g$: 디코더의 출력을 계산하는 함수이다.
-
$q$: 출력 시간 구간 $[0, H-1]$ 내의 인덱스이다.
-
Start Token: 디코더의 예측 과정 시작을 알리는 더미 입력값이다.
이와 같이 디코더는 문맥 벡터에 요약된 과거 데이터와 기상 예보 데이터를 결합하여, 시간 간극 $k$를 넘어선 미래 구간의 풍력 발전량을 연속적으로
예측한다. 본 연구에서는 여기에 더해 각 디코더 셀이 해당 시간대의 기상 예보 데이터와 이전 시간대의 예측 풍력 발전량을 동시에 입력받아 현재 시점의
풍력 발전량 예측값을 출력하도록 구성된다. Seq2Seq 모델의 학습은 직전 시점의 예측값을 다음 시점의 입력으로 재사용하는 순환적 구조를 기반으로
한다. 본 연구에서는 디코더의 출력 경로 전체를 하나의 학습 단위로 간주하여, 시퀀스 레벨의 누적 오차를 최소화하도록 모델을 훈련한다. 구체적으로는
전체 기간의 예측 시퀀스와 실제 발전량 시퀀스 간의 차이를 손실함수로 정의하고, 해당 손실에 대한 역전파를 수행하여 인코더와 디코더의 파라미터를 동시에
갱신한다.
3. 딥러닝 궤적 예측과 레비 프로세스 오차 시나리오 기반의 기대 정산 단가 최대화 프레임워크
본 장에서는 딥러닝 기반 예측, 확률론적 오차 모델링, 경제적 최적화를 결합한 통합 확률론적 예측값 제출 프레임워크를 제시한다. 그림 3은 통합 확률론적 예측값 제출 프레임워크의 전체 흐름을 나타낸다. 그림 3의 절차는 크게 (1) 결정론적 예측, (2) Logit 변환 및 레짐 매핑, (3) 확률론적 시나리오 생성, (4) 경제적 최적화의 네 단계로 나눌
수 있다.
Fig. 3 Integrated probabilistic wind power forecast submission framework flowchart
첫째, 결정론적 예측 단계에서는 Seq2Seq 구조를 활용하여 1일 24개 거래시간에 대한 기준 예측 궤적을 산출한다. 모델의 입력 구조는 크게 인코더와
디코더로 구분된다. 먼저 인코더는 예측값 제출 마감 직전까지의 과거 발전량과 기상 관측 데이터를 입력받아, 과거의 발전 패턴과 기상 조건을 하나의
문맥 벡터로 압축한다. 이렇게 요약된 문맥 벡터는 디코더의 초기 은닉 상태로 전이되어 과거의 시계열 데이터를 디코더에 전달한다. 이어지는 디코더에서는
거래일 24시간의 기상 예보 데이터와 직전 시점의 예측 발전량을 순차적으로 입력받아, 기상 변화를 반영한 미래 발전량 궤적을 생성한다. 모델은 학습
데이터의 입력-출력 쌍을 기반으로 가중치를 최적화하며, 학습 완료 후 동일한 구조를 통해 전체 테스트 기간에 대한 시간별 기준 예측 발전량을 산출한다.
둘째, Logit 변환 및 레짐 매핑 단계에서는 기준 예측 발전량과 실제 발전량을 Logit 공간에서 비교하여 오차 구조를 분석하고, 발전량 수준에
따라 구간별 레짐을 정의한다. 먼저 발전량이 0과 1 사이의 값을 가진다는 점을 반영하여 예측 발전량과 실제 발전량을 각각 Logit 변환하고, Logit
공간에서의 두 시계열의 차이를 오차로 정의한다. 이어서 오차의 시차 1차분을 계산하고, 실제 발전량 수준별로 오차 차분의 평균과 분산 구조를 살펴본다.
이 분석을 통해 발전량이 낮은 구간, 중간 구간, 높은 구간에서 오차 차분의 평균과 분산이 서로 다른 분포형을 확인하고 이에 따라 발전량 수준에 따른
세 가지 유형으로 구분한다 [22]. 이를 바탕으로 각 유형에 대응하는 발전량 구간을 레짐으로 정의하며, 각 레짐에 포함되는 표본 수가 균형을 이루도록 구간 경계를 조정한다. 이렇게
도출된 레짐 분류 결과는 이후 오차 차분의 확률분포를 레짐별로 추정하는 데 사용된다.
셋째, 확률론적 시나리오 생성 단계에서는 앞 단계에서 정의한 레짐과 오차 차분 데이터를 이용하여 발전량 경로 시나리오 집합을 생성한다. 이를 위해
레짐별 오차 차분 시계열에 α-안정 분포를 적합시켜, 급격한 변화와 비대칭성, 두꺼운 꼬리를 포함하는 점프 특성을 레비 프로세스로 모델링한다. 기준
예측 발전량 궤적의 각 시점은 그 시점의 예측 발전량 수준에 따라 특정 레짐으로 분류되며, 이에 대응하는 α-안정 분포로부터 오차 차분을 샘플링한다.
이렇게 생성된 레짐별 오차 차분 시계열을 시간 방향으로 누적하여 Logit 공간에서 오차 경로를 구성하고, 이를 Logit 변환된 기준 예측 발전량
궤적과 결합한다. 최종적으로 역 Logit 변환을 적용하여, 원래의 물리적 스케일로 복원함으로써 거래일에 대한 확률론적 발전량 시나리오 집합을 산출한다.
넷째, 경제적 최적화 단계에서는 생성된 시나리오 집합을 각 시간대 발전량의 경험적 확률분포로 간주하고, 국내 예측제도의 계단형 정산 단가 구조를 적용하여
최적 예측 제출값을 산출한다. 먼저 각 거래 시간대별로 발전 가능한 전체 구간을 일정 간격으로 이산화하여 예측 제출값 후보군을 설정한다. 이후, 각
후보 예측 제출값에 대해 시나리오별 오차 크기에 따른 정산 단가를 계산한 뒤, 시나리오 평균을 취해 기대 정산 단가를 구한다. 이 기대 정산 단가가
최대가 되는 예측 제출값을 선택하여 최적 예측값 제출 전략을 도출한다. 이 전략은 단순한 예측 오차 최소화를 넘어, 제도적 정산 구조를 직접적으로
고려하여 경제적 성과를 극대화하는 데 초점을 맞춘다.
본 연구의 기여점은 예측 모델의 학습 기법이 아닌, 예측 오차의 확률적 모델링과 이를 활용한 예측값 제출 전략에 있다. 따라서 이어지는 절에서는 일반적인
신경망의 가중치 최적화 과정에 대한 기술은 지양하고, 학습된 모델을 활용한 오차 생성과 모델링 그리고 활용 과정을 중심으로 방법론을 구체화한다.
3.1 Seq2Seq 모델을 이용한 결정론적 예측
본 절에서는 Seq2Seq 기반의 결정론적 예측 모델을 정의한다. 이 모델은 거래일 하루전 오전 11시까지 과거 발전량 및 기상 관측 데이터를 인코더에
입력하여 문맥 벡터를 추출하고, 이를 디코더의 초기 은닉 상태로 전이시킨다. 이어지는 디코더 단계에서는 매 시간 직전 시점의 예측 발전량과 현재 시점의
기상 예보 데이터가 입력되고, 당일 24개 시간의 발전량 궤적을 순차적으로 산출한다. 인코더 입력에 사용되는 날짜·시간 인덱스 집합은 다음 수식 (11)과 같이 정의한다.
각 시점에서의 입력과 출력은 다음 수식 (12), 수식 (13), 수식 (14)와 같이 정의한다.
여기서 사용된 변수는 다음과 같다.
-
$D$: 학습 기간 거래일의 날짜 인덱스이다.
-
$L_{day}$: 입력에 사용하는 과거 일수를 나타낸다.
-
$d$: 날짜 인덱스이다.
-
$h$: 시간 인덱스이다.
-
$T_{in}$: 인코더 입력에 포함되는 날짜·시간 쌍의 집합이다.
-
$x_{d,h}$: 날짜 $d$, 시간 $h$에서의 기상 변수 벡터로 인코더의 입력값이다.
-
$y_{d,h}$: 날짜 $d$, 시간 $h$에서의 실제 발전량으로 인코더의 입력값이다.
-
$y_D^{true}$: 거래일 $D$의 24개 시간에 대한 실제 발전량 벡터이다.
-
$\hat{y}_D^{base}$: Seq2Seq 모델이 생성하는 기준 예측 발전량 벡터이다. 이 벡터의 각 요소 $\hat{y}_{D,h}$는 디코더의
다음 시점 입력으로 활용되는 값이다.
본 연구에서 사용하는 결정론적 예측 모델은 과거 입력 시계열과 다음날 기상 예보 데이터를 입력으로 받아 다음날 발전량 시계열을 출력하는 Seq2Seq
구조를 따른다. 이를 함수 형태로 나타내면 다음 수식 (15)와 같다.
위 식에서 사용된 변수는 다음과 같다.
-
$f_\theta(\cdot)$: Seq2Seq 예측 모델을 나타내는 비선형 함수이다.
-
$\theta$: Seq2Seq 모델의 가중치와 편향 파라미터 집합이다.
-
$\{(x_{d,h}, y_{d,h})\}_{(d,h) \in T_{in}}$: 거래일 하루전 오전 11시까지 관측된 과거 기상 관측 데이터와 발전량
시계열이다.
-
$\{\omega_{D,h}\}_{h=0}^{23}$: 거래일 $D$의 24시간에 대한 $D-1$일, 오전 11시 이전에 생성된 기상 예보 데이터
벡터 시계열이다.
Seq2Seq 모델의 내부에서는 인코더가 $T_{in}$에 속한 과거 시계열을 요약하여 은닉 상태로 표현하고, 디코더가 이 은닉 상태와 기상 예보
데이터를 이용하여 시간 순서대로 $\hat{y}_{D,0}$부터 $\hat{y}_{D,23}$까지의 값을 생성한다.
Fig. 4 Workflow for 24-hour wind power trajectory forecasting
그림 4는 거래일 $D$에 대해 24시간 발전량 경로를 예측하는 단일 예측 프로세스를 나타낸 것으로, 동일한 절차가 전체 기간에 걸쳐 일별로 반복 수행된다.
좌측의 파란색 영역은 과거 발전량과 기상 관측 데이터 시계열로 구성된 인코더 입력을 나타내며, 인코더는 다차원 시계열을 하나의 문맥 벡터로 압축하여
디코더에 전달한다. 우측의 주황색 영역은 거래일 $D$의 시각마다 디코더가 입력으로 받는 데이터로, 초기 시점에는 Start Token과 해당 시각의
기상 예보 데이터가 입력되며, 이후 시점에서는 직전 시각의 예측 발전량과 당해 시각의 기상 예보 데이터가 입력되는 구조를 갖는다. 붉은색 영역은 매
시각 디코더가 생성하는 예측 발전량을 의미하며, 인코더와 달리 각 시점의 입력과 출력이 순차적으로 대응되어 최종적으로 24시간 예측 경로를 형성한다.
3.2 Logit 변환 및 레짐 매핑
본 절에서는 앞서 구한 기준 예측 발전량과 실제 발전량을 Logit 변환하고, 이 변환된 값의 차이를 오차로 정의한다. 이후, 오차의 시차 1차분에
대한 발전량 수준별 변동성을 기반으로 세 가지 레짐으로 분류하는 절차를 정리한다.
본 실험에서 실제 발전량과 예측 발전량은 설비용량으로 나뉘어 있어 이론적으로 0과 1 사이에 위치하지만, 수치적 오차나 모델의 외삽 효과로 인해 경계를
벗어나는 값이 발생할 수 있으며, Logit 변환은 0과 1에서 특이점을 가진다. 이를 방지하기 위해 작은 양의 상수를 도입하고, Logit 변환의
대상이 되는 발전량이 0과 1 사이에 존재하도록 클리핑한다. 이러한 클리핑 절차는 각 거래시간에 대해 다음 수식 (16)과 수식 (17)로 나타낼 수 있다.
위 수식에서 사용된 변수는 다음과 같다.
-
$\tilde{y}_{D,h}^{true}$: Logit 변환이 정의되도록 $[\epsilon, 1-\epsilon]$구간으로 클리핑한 실제 발전량이다.
-
$\tilde{y}_{D,h}^{base}$: Logit 변환이 정의되도록 $[\epsilon, 1-\epsilon]$ 구간으로 클리핑한 기준 예측
발전량이다.
-
$\epsilon$: 0과 1 부근에서의 수치 발산을 방지하기 위한 작은 양의 상수이다.
클리핑된 발전량을 Logit 공간으로 사상하면, 각 거래시간 $h$에 대하여 다음 수식 (18)과 같은 Logit 시계열을 얻을 수 있다.
위 식에서 사용된 변수는 다음과 같다.
-
$z_{D,h}^{true}$: 거래일 $D$, 시간 $h$에서의 발전량에 대한 Logit 변환된 실제 발전량이다.
-
$z_{D,h}^{base}$: 거래일 $D$, 시간 $h$에서의 발전량에 대한 Logit 변환된 기준 예측 발전량이다.
위와 같이 변환하면 원래 $[0,1]$ 구간에 제한되던 발전량은 실수 전체를 정의역으로 하는 Logit 공간으로 확장된다. 위 두 값의 차이인 거래일
$D$, 시간 $h$에 대한 오차는 다음 수식 (19)와 같다.
위 식에서 사용된 변수는 다음과 같다.
시계열 예측에서 오차 $e_{D,h}$는 매 시점 독립적으로 발생하는 것이 아니라 시차 자기상관을 가질 수 있다. 이에 본 연구에서는 오차 시계열을
확률 보행 관점에서 해석하여 매 시점 새롭게 발생하는 변동분인 오차의 차분을 점프로 해석하여 모델링 대상으로 삼는다. 이후 시작 시점의 초기값을 기준으로
이를 누적하여 전체 오차의 경로를 재구성하는 방식을 취한다. 이를 위한 오차 시계열의 시차 1차분을 다음 수식 (20)과 같이 정의한다.
위 식에서 사용된 변수는 다음과 같다.
이후 풍력 발전량이 0과 1이라는 물리적 한계값을 가짐에 따라, 이러한 특성이 오차 차분의 분포에 어떠한 영향을 미치는지 그림 5를 통해 확인한다. 그림 5는 오차 시계열의 시차 1차분 $\Delta e_{D,h}$에 대하여 실제 발전량 수준별 평균과 표준편차를 나타낸다. 그림 5에서 $\Delta e_{D,h}$의 평균 곡선은 전체적으로 수평 방향의 S자형 비선형 패턴을 보이며, 특히 실제 발전량이 0과 1의 경계 부근에서
음(-)과 양(+)의 방향으로 스파이크가 관찰된다. 또한 표준편차 곡선은 실제 발전량이 0인 경계에서 크게 나타난 후 급격히 감소하며, 중발전 구간에서
가장 안정적인 값을 보이다가 고발전 구간으로 진입하면서 완만히 증가하여 1 부근에서 다시 변동성이 확대되는 비대칭 U자형 구조를 띤다.
Fig. 5 Statistics of error increments conditioned on actual wind power
Fig. 6 Statistics of error increments conditioned on forecasted wind power
그림 6은 $\Delta e_{D,h}$에 대해, 예측 발전량 수준별 평균과 표준편차를 나타낸다. 일반적으로 예측 모델은 전체적인 평균 오차를 최소화하도록
학습되므로, 0과 1의 경계값 부근에서의 급격한 변동을 보수적으로 추정하여 예측 발전량의 분포가 양 끝단보다는 중심 구간으로 편중되는 경향을 보인다.
즉, 실제 발전량 대비 예측 발전량의 분포는 중심부로 좁게 형성되는 반면, 이로 인해 역으로 예측 발전량 대비 실제 발전량의 분포는 상대적으로 넓게
형성된다. 결과적으로 예측 발전량을 기준으로 오차의 차분을 집계하면 특정 예측 발전량 구간 내에 하한 경계 부근의 실제 발전량에서 기인한 음(-)의
오차 차분과, 해당 예측 발전량 보다 높은 실제 발전량에서 기인한 양(+)의 오차 차분이 혼재하게 된다. 이로 인해 서로 반대 부호를 가진 오차 차분들이
상쇄되면서 그림 5에서 관찰되었던 발전량 수준별 고유한 오차 차분의 통계적 특성이 그림 6에서는 희석되어 불규칙하게 나타난다. 따라서 본 연구에서는 실제 발전량에 따라 오차 차분의 패턴을 분석하여 레짐을 정의하며, 각 레짐에 표본 수가
균형을 이루도록 구간 경계를 설정한다. 실제 발전량 기준의 오차 차분의 통계적 특성에 따라 정의한 레짐은 다음 수식 (21)과 같다.
위 수식에서 사용된 변수는 다음과 같다.
-
$l_1, l_2$: 발전량을 세 구간으로 나누기 위해 설정한 두 개의 경계값이다.
-
$R_{low}$: 실제 발전량이 $l_1$ 이하인 시간대 쌍 $(D, h)$의 집합이다.
-
$R_{mid}$: 실제 발전량이 $l_1$ 초과 $l_2$ 이하인 시간대 쌍 $(D, h)$의 집합이다.
-
$R_{high}$: 실제 발전량이 $l_2$ 초과인 시간대 쌍 $(D, h)$의 집합이다.
이상의 Logit 변환, 오차 계산, 오차 차분 계산, 발전량 수준별 레짐 구분 절차는 학습 기간에 속하는 거래일에 대해 수행된다. 학습 기간에서
얻은 오차 차분 표본과 레짐별 경계값은 이어지는 α-안정 분포를 추정하는 데 활용된다. 확정된 경계값과 추정된 분포 파라미터는 테스트 기간에 속하는
거래일에 대해서는 재학습 없이 고정된 기준으로 적용된다.
3.3 레짐별 α-안정 분포 기반 레비 프로세스 시나리오 생성
본 절에서는 앞서 정의한 오차 차분을 레짐별 α-안정 분포로 모델링하고, 이를 레비 프로세스의 차분 분포로 해석하여 확률적 시나리오를 생성하는 과정을
설명한다.
먼저 학습 단계에서 실제 발전량을 기준으로 저발전, 중발전 고발전의 세 가지 레짐으로 분류하고, 각 레짐에 속한 오차 차분 표본을 사용하여 α-안정
분포의 파라미터를 추정한다. 테스트 단계에서는 미래의 실제 발전량을 알 수 없으므로, Seq2Seq 모델이 생성한 기준 예측 발전량을 레짐 결정의
대리 변수로 사용한다. 이때 예측 오차로 인해 다른 레짐이 선택될 가능성이 존재할 수 있다. 그러나 기준 예측 발전량에 따라 오차 차분을 분류할 경우,
과소·과대 예측 오차의 혼재로 인해 고유한 통계적 패턴이 희석됨에 따라, 유의미한 레짐 자체를 정의할 수 없는 문제가 발생한다. 따라서 본 연구는
레짐 오분류의 위험을 일부 감수하더라도, 경계값 부근에서 발생할 수 있는 오차의 극단적인 변동 상황을 시나리오 생성 시 반영하기 위해 학습 단계의
레짐을 적용한다. 매 시간 예측된 발전량을 학습 단계에서 결정된 고정 경계값 $l_1, l_2$와 비교하여, 사전에 학습된 세 가지 분포 중 하나를
선택한다. 즉 시간에 따라 달라지는 것은 선택되는 레짐이며, 경계값은 실험 구간 전체에서 고정된다. 이러한 레짐 결정 규칙은 수식 (22)와 같이 정의된다.
위 수식에서 사용된 변수는 다음과 같다.
-
$D^*$: 테스트 기간 거래일이다.
-
$r$: 발전량 수준에 따른 레짐 지표로 출력 구간에 따라 $R_{low}, R_{mid}, R_{high}$ 값을 가진다.
-
$Regime(\cdot)$: 입력된 발전량의 크기를 사전에 정의된 경계값($l_1, l_2$)와 비교하여 $R_{low}, R_{mid}, R_{high}$
중 하나의 상태로 매핑하는 함수이다.
결정된 레짐에 대응하는 α-안정 분포의 파라미터를 사용하여, 시나리오에 대한 오차 차분을 다음 수식 (23)과 같이 샘플링한다.
여기서 사용한 변수는 다음과 같다.
-
$S_\alpha(\cdot)$: α-안정 분포를 나타낸다.
-
$n$: 생성할 시나리오의 인덱스로, $n = 1, \dots, N$의 값을 가진다. 여기서 $N$은 총 시나리오 개수이다.
-
$\Delta e_{D^*,h}^{(r,n)}$: α-안정 분포로부터 독립적으로 생성된 난수이다.
생성된 오차 차분들을 누적하여 다음 수식 (24)와 같이 시간 흐름에 따른 오차 경로를 형성한다.
위 수식에서 사용된 변수는 다음과 같다.
시나리오 $n$에 대한 Logit 공간의 발전량 시계열은 다음 수식 (25)와 같이 정의한다.
Logit 공간의 시계열에 대해 역 Logit 변환을 적용하여 수식 (26)과 같이 기존 스케일의 발전량 시계열을 얻는다.
각 시각 $h$에 대해 $\{y_{D^*,h}^{(n)}\}_{n=1}^N$ 집합은 해당 시각에서 출력 분포를 근사하는 시나리오 집합이 된다.
3.4 기대 정산 단가 기반 예측값 제출 전략
본 절에서는 앞서 생성한 시나리오 집합을 활용하여, 계단형 정산 구조 하에서 재생에너지 발전량 예측제도의 정산금을 극대화하는 최적 예측값 제출 전략을
제안한다. 재생에너지 발전량 예측제도는 오차 경계 $\tau_1$과 2차 오차 경계 $\tau_2$ 안에 포함되는지 여부에 따라 단가 $\pi_1,
\pi_2, 0$ 중 하나를 반환하는 계단형 구조를 가진다. 이러한 시장 환경에서 경제적 우위를 확보하기 위해서는 단순한 점 예측보다는, 확률 밀도
함수의 면적이 정산 인정 구간 내에 집중되도록 예측 제출값 위치를 선정해야 한다. 즉, 시나리오 분포를 통해 추정된 수취 확률과 정산 단가의 곱인
기대 정산 단가가 최대가 되는 예측 제출값을 도출하는 것을 목표로 한다.
이를 구현하기 위해, 테스트 기간 시간 $h$에서 임의의 후보 예측 제출값에 대하여 실제 발전량이 1차 및 2차 정산 지급 구간에 포함될 확률을 다음
수식 (27)과 수식 (28)과 같이 시나리오 빈도로 근사한다.
여기서 사용된 변수는 다음과 같다.
-
$y^*$: 거래일 $D^*$, 시간 $h$에서의 후보 예측 제출값을 나타낸다.
-
$1(\cdot)$: 괄호 안의 조건이 만족될 경우 1을, 만족되지 않을 경우 0을 반환하는 지시함수를 나타낸다.
-
$\hat{p}_{1,D^*,h}(y^*)$: 후보 예측 제출값 $y^*$에 대해 오차가 1차 오차 경계 $\tau_1$ 이내에 포함될 확률을 나타낸다.
-
$\hat{p}_{2,D^*,h}(y^*)$: 후보 예측 제출값 $y^*$에 대해 오차가 1차 오차 경계를 초과하면서 2차 오차 경계 $\tau_2$
이내에 포함될 확률을 나타낸다.
위 확률 근사값을 사용하면, 시간 $h$에서 후보 예측 제출값 $y^*$를 제출했을 때의 기대 정산 단가 함수는 다음 수식 (29)와 같다.
여기서 사용된 변수는 다음과 같다.
최종적으로, 다음 수식 (30)과 같이 기대 정산 단가 함수를 최대화하는 해를 탐색하여 해당 시점의 최적 예측 제출값으로 결정한다.
여기서 사용된 변수는 다음과 같다.
-
$y_{D^*,h}^{EV}$: 거래일 $D^*$, 시간 $h$에서 기대 정산 단가를 최대화 하는 예측 제출값이다.
-
$Y^*$: $[0, 1]$구간에서 정의한 유한 개의 예측 제출값 후보값들의 집합이다.
최적화 문제를 풀면, 그림 7과 같이 평균이나 최빈값과 다른 값을 산출하는 것을 확인할 수 있다. 통계적 관점에서 최빈값은 오차가 0이 될 확률 밀도가 가장 높은 지점을 선택하여
적중 확률을 최대화하는 전략이며, 평균값은 예측 오차의 절대 크기 합을 최소화하는 전략인 반면, 본 연구의 기대 정산 단가 최대화는 정산금이 지급되는
유효 임계값 내에 진입할 확률을 최대화 하는 전략으로 볼 수 있다. 즉, $y_{D^*,h}^{EV}$ 는 통계적으로 오차를 줄이는 것보다 수익 구간을
놓치는 경제적 기회비용을 방어하는 것이 더 중요하다는 관점을 반영하며, 이는 예측의 물리적 정밀도를 넘어 시장 구조에 최적화된 실질적 경제 효용을
추구하는 합리적 접근 방식이다. 본 연구는 이와 같은 최적화 절차를 거래일 $D^*$의 모든 시간대에 적용함으로써 최적의 예측 제출값 시계열 $\{y_{D^*,h}^{EV}\}_{h=0}^{23}$
을 구할 수 있다.
Fig. 7 Expected settlement price as a function of the wind power distribution
4. 통합 확률론적 예측값 제출 프레임워크의 시장 정산 실적 비교 및 수익성 종합 분석
본 장에서는 제안된 통합 확률론적 예측값 제출 프레임워크의 실효성을 검증하기 위한 실험 설계 및 평가 체계를 기술한다. 먼저 데이터셋의 학습 및 테스트
구간 분할, 예측 단위, 그리고 입출력 변수 설정을 구체화하여 실험의 기초 환경을 정의한다. 이어 기준 예측을 위한 Seq2Seq 모델의 사양을 설명하고,
비대칭 및 두꺼운 꼬리 분포를 반영하는 제안 모델인 레비 프로세스와, 이에 대한 비교군으로서 전통적 가우시안 가정을 따르는 브라운 운동 기반 오차
모델의 구축 절차를 각각 제시한다. 최종적으로 각 모델로부터 도출된 최빈값, 평균값, 기대 정산 단가 최대화 전략의 성과를 비교 분석함으로써, 제안
방법론의 예측 정확도 및 경제적 우수성을 종합적으로 평가한다.
4.1 데이터 설정
본 연구의 예측 단위는 1시간 간격의 1일 24개 구간이다. 분석 데이터는 풍력 발전소의 시간별 실제 발전량과 Kaggle의 ‘Wind Power
Generation Data Forecasting’ 데이터셋의 기상 데이터로 구성되며, 이를 학습 기간과 테스트 기간으로 나누어 사용한다 [23]. 본 실험에서는 과거 기간의 기상 예보 데이터를 확보하기 어려운 제약으로 인해, 데이터셋 내의 기상 관측 데이터를 예보 입력으로 대체하여 모델 입력
변수로 사용한다. 따라서 디코더 입력에는 예보 오차가 포함되지 않으며, 수치예보모델 기반 예보에서의 시간 오차와 편향 보정 절차는 본 연구 범위에서
제외한다. 이러한 설정은 기상 예보 오차가 내재된 실제 시장 환경과 다소 차이가 있을 수 있다는 한계를 가진다. 향후 실시간 기상 예보 데이터를 확보할
수 있는 환경이 마련되면, 이를 모델에 직접 적용하여 실제 시장과의 괴리를 최소화하는 후속 연구를 진행할 계획이다.
모든 발전량 데이터는 설비용량으로 나누어 정규화하였으며, 이에 따라 모든 실험 절차에서 발전량은 0과 1 사이의 값을 갖는다. 학습 데이터는 2017년
1월 2일부터 2020년 12월 31일까지의 기간을 대상으로 구축한다. 입력 시계열은 실제 전력 시장 환경을 모사하기 위해, 거래일 기준 하루전 00시부터
제출 마감 시각인 11시까지 관측 시계열과 직전 14일간의 일별 전체 시계열을 시간 순으로 연결하여 하나의 입력 시퀀스를 구성한다. 이에 대응하는
출력 시계열은 거래일 24시간의 실제 발전량으로 설정하여 지도 학습을 위한 입출력 쌍을 형성한다. 이 데이터셋은 3장에서 제안한 Seq2Seq 예측
모델의 파라미터 최적화뿐만 아니라, 예측 오차 시계열을 생성하는 데 사용된다.
테스트 데이터는 2021년 1월 1일부터 2021년 12월 31일까지의 기간을 대상으로 한다. 테스트 단계에서도 학습 단계와 동일한 입력 구조를 적용하여,
하루전 제출 시점 기준의 과거 데이터와 거래일의 기상 데이터를 입력 시계열로 구성한다. 구성된 입력 시계열을 학습된 모델에 인가하여 예측 발전량을
산출하며, 이 예측 발전량과 실제 발전량 시계열을 비교하여 학습된 모델의 일반화 성능을 평가하고, 예측 오차의 분포 특성 분석 및 제안 전략의 경제적
성과를 검증하는 데 활용된다.
4.2 비교 모델 및 예측값 제출 전략 구성
본 연구에서 비교하는 예측 모델은 세 가지이다. 첫째, 기준 예측 모델은 Seq2Seq 입력·출력 구조를 그대로 사용하여 일별 24시간 발전량 경로를
직접 예측하고, 별도의 오차 분포 추정이나 시나리오 생성 없이 이 예측 경로만을 활용한다. 둘째, 브라운 운동 기반 모델은 동일한 예측 결과를 Logit
변환한 후, 학습 기간의 오차 차분 데이터를 실제 발전량 수준에 따라 세 가지 레짐으로 분류한다. 이어 각 레짐별 오차 차분을 가우시안 분포로 가정하고,
이를 누적하여 브라운 운동 형태의 일별 발전량 시나리오 집합을 생성한다. 셋째, 레비 프로세스 기반 모델은 브라운 운동 기반 모델과 같은 Logit
변환, 레짐 구분, 시나리오 생성 절차를 따르되, 레짐별 오차 차분 분포를 가우시안 분포 대신 α-안정 분포로 추정하여 비대칭성과 두꺼운 꼬리를 반영한
시나리오를 생성한다.
브라운 운동과 레비 프로세스 기반 모델에서 생성된 일별 시나리오 집합은 테스트 기간 내 각 거래 시간의 발전량에 대한 경험적 확률 분포를 제공하며,
이 분포를 바탕으로 세 가지 예측값 제출 전략을 구성한다. 첫 번째 전략은 시나리오 분포의 최빈값을 시간별 예측 제출값으로 선택하는 전략이다. 두
번째 전략은 시나리오 분포의 평균값을 예측 제출값으로 사용하는 전략이다. 세 번째 전략은 계단형 정산 단가 구조를 적용했을 때 각 후보 예측 제출값에서의
기대 정산 단가를 계산하고, 이 기대 정산 단가가 최대가 되는 발전량을 예측 제출값으로 선택하는 전략이다.
이와 같이 본 연구는 세 가지 예측 모델과, 시나리오 기반 모델에 대해 세 가지 예측값 제출 전략을 결합하여, 오차 차분 분포에 대한 가정의 적합성과
예측 제출값 산정 기준의 차이가 계단형 정산 단가 체계에서의 실제 정산 실적에 미치는 영향을 비교·평가한다.
4.3 실험 환경
모든 모델의 학습 및 평가는 NVIDIA GeForce RTX 3080 GPU 환경에서 TensorFlow 프레임워크를 사용하여 수행하였다. 모델
학습에는 Adam 옵티마이저를 사용했으며, 학습률은 0.001, 배치 크기는 32, 총 에포크는 200으로 설정하였다. 레짐 경계값은 $l_1 =
0.2, l_2 = 0.6$ 으로 설정하였으며, 이에 따른 레짐별 발전량 데이터 개수는 $R_{low}$는 11235개, $R_{mid}$는 13415개,
$R_{high}$는 10053개임을 확인하였다. 오차 경로 시뮬레이션 횟수($S$)는 3000으로 지정하였다.
4.4 실험 결과 및 분석
본 장에서는 제안된 전략의 유효성을 검증하기 위해 단계적인 분석을 수행한다. 레짐 경계값 0.2, 0.6 기준 하에서 예측값을 대리 변수로 사용했을
때의 분류 정확도와 오분류 영향을 정량적으로 분석하여 방법론의 타당성을 입증한다. 이후 검증된 레짐 분류 체계를 바탕으로, 2021년 1월 1일부터
12월 31일까지의 테스트 기간을 대상으로, 기준 예측 전략과 확률론적 시나리오 기반 전략들의 성능을 비교 분석한다. 모든 전략은 동일한 Seq2Seq
모델의 예측값을 공유하며, 오차 모델링 방식(브라운 운동과 레비 프로세스)와 제출값 선정 기준(평균, 최빈값, 기대 정산 단가 최대화)에 따라 구분된다.
비교 대상은 총 7가지로, 기준 예측을 그대로 제출하는 BASE, 브라운 운동 기반 시나리오에서 각각 평균·최빈값·기대 정산 단가 최대값을 선택하는
Mean_Brown, Mode_Brown, EVmax_Brown, 그리고 레비 프로세스 기반 시나리오에서 동일한 규칙을 적용한 Mean_Levy,
Mode_Levy, EVmax_Levy이다. 평가는 예측 정확도 지표인 NMAE와 RMSE, 그리고 경제적 성과 지표인 연간 누적 정산금, 정산 획득률,
일평균 정산 단가와 그 변동성, 발전량 레짐별 시간당 평균 정산 단가를 기준으로 수행한다.
Fig. 8 Confusion matrix of regime classification based on power forecasts
그림 8은 테스트 단계에서 실제 발전량과 결정론적 모델의 예측 발전량을 기반으로 레짐을 각각 분류했을 때의 정합성을 분석한 혼동 행렬이다. 혼동 행렬은 데이터가
실제로 속한 집단과 모델이 예측한 집단이 얼마나 일치하는지, 그리고 어느 집단으로 오분류되었는지를 교차하여 보여주는 표이다. 전체 분류 정확도는 69.87%이다.
이 정확도는 저발전 11,235개, 중발전 13,415개, 고발전 10,053개의 표본 수를 가중치로 사용해, 저발전 정분류율 64.64%, 중발전
정분류율 75.62%, 고발전 정분류율 68.04%를 가중평균하여 산출한다. 저발전과 고발전이 중발전으로 예측되는 오분류가 상대적으로 많이 나타나며,
경계 부근에서 중간 레짐으로 수렴하는 경향이 관찰된다. 오분류의 대부분은 인접 레짐 사이에서 발생한다. 비인접 레짐 오분류는 저발전을 고발전으로 예측하거나
고발전을 저발전으로 예측하는 경우이며, 그 비율은 약 0.4%로 매우 낮다. 인접 레짐 오분류가 주를 이루고 비인접 레짐 오분류가 매우 낮으므로,
논문의 경계값 설정은 레짐을 안정적으로 구분하는 합리적인 기준으로 해석된다.
그림 9는 브라운 운동 기반 시나리오를 사용한 경우, 예측 결과를 2021년 9월 8일부터 9월 15일까지 8일간 시간별로 나타낸다. 그림 10은 레비 프로세스 기반 시나리오를 사용한 경우, 예측 결과를 2021년 9월 8일부터 9월 15일까지 8일간 시간별로 나타낸다. 두 그림 모두에서
발전량이 0.1인 지점에서 관찰되는 수평선 형태의 하한 경계는 실제 발전량이 설비용량의 10% 미만인 경우 정산에서 제외되는 예측제도 규칙을 반영하여
시뮬레이션 상에서 0.1로 절단했기 때문이다. 보라색 연한 음영은 각 시간대별 분포에서 2.5%와 97.5% 분위 사이의 예측 구간을 나타내며, 진한
보라색 음영은 분포에서 25%와 75% 분위 사이의 예측 구간을 나타낸다.
Fig. 9 Scenarios and submission trajectories generated from Brownian motion
Fig. 10 Scenarios and submission trajectories generated from Lévy process
표 1은 7가지 전략에 따른 연간 예측 오차와 누적 정산금을 나타낸다. 예측 오차 측면에서는 BASE가 가장 작은 NMAE와 RMSE를 보이지만, 연간
누적 정산금은 EVmax_Levy와 Mode_Levy가 BASE보다 높게 나타난다. 동일한 통계량을 사용할 때에는 레비 프로세스 계열 전략의 누적
정산금이 모두 브라운 운동 계열보다 일관되게 높은 정산금을 기록하였다. 이는 예측 오차가 가장 작은 전략이 반드시 정산 성과에서도 최상위를 차지하는
것은 아니며, 오차 분포 가정과 예측 제출값의 통계 선택이 연간 누적 정산금에 차이를 만들 수 있음을 보여준다.
Table 1 Comparison of annual forecasting errors and cumulative settlements across
submission strategies
|
전략
|
NMAE
|
RMSE
|
누적 정산금(원)
|
|
EVmax_Levy
|
0.1263
|
0.1692
|
3,474.4557
|
|
Mode_Levy
|
0.1285
|
0.1725
|
3,410.8864
|
|
Mean_Levy
|
0.1387
|
0.1685
|
2,795.7693
|
|
EVmax_Brown
|
0.1298
|
0.1754
|
3,265.2071
|
|
Mode_Brown
|
0.1310
|
0.1776
|
3,307.9025
|
|
Mean_Brown
|
0.1419
|
0.1710
|
2,780.1850
|
|
BASE
|
0.1250
|
0.1598
|
3,210.4429
|
Fig. 11 Risk–return evaluation across submission strategies
그림 11은 각 전략에 대해 일별 획득 단가의 평균과 표준편차를 동시에 나타낸 위험-수익 산점도이다. BASE 전략은 일평균 획득 단가가 가장 높지만, 일별
단가 변동성도 가장 큰 고수익·고위험 군에 위치한다. EVmax_Levy와 Mode_Levy는 BASE보다 낮은 평균 단가를 기록하면서 위험 수준은
더 낮은 쪽으로 이동해 있어 상대적으로 수익의 안정성이 높은 것으로 분석된다. 그림 12는 2021년 연간 누적 정산금의 시계열 추이를 나타낸다. 그림 12의 범례는 최종 누적 정산금 순위대로 전략을 나열한다. 누적 정산금 궤적을 보면, 그림 11의 위험-수익 분석에서 고수익·저위험 영역에 위치했던 EVmax_Levy와 Mode_Levy 전략이 연중 내내 상위권 궤적을 유지하며 최종적으로 가장
높은 수익을 기록함을 확인할 수 있다.
Fig. 12 Cumulative settlements by strategy
Fig. 13 Analysis of the cumulative settlement trends between the proposed and the
second-best strategy
그림 13은 최상위 성과를 보인 EVmax_Levy와 차상위 전략 간의 격차를 나타낸다. 그림 13을 살펴보면 특히 두 전략 중 평균 획득 단가가 더 높았던 EVmax_Levy가 지속적으로 우위를 점하고 있음을 확인할 수 있다. 그림 14는 3장에서 정의된 세 가지, 저발전·중발전·고발전 레짐별 시나리오 생성 방식이 정산 단가에 어떻게 반영되는지를 보여준다. 각 레짐은 앞서 모델 구성
단계에서 설정된 기준을 동일하게 적용하였으며, 발전량 수준에 따라 저발전(0.2 이하), 중발전(0.2 초과 0.6 이하), 고발전(0.6 초과)
구간으로 구분된다. 저발전 레짐과 고발전 레짐에서는 EVmax_Levy, Mode_Levy, EVmax_Brown, Mode_Brown처럼 분포의
비대칭성을 활용하여 예측 제출값을 정하는 전략들이 BASE와 분포의 평균 기반 전략에 비해 더 높은 평균 획득 단가를 기록한다. 반대로 중발전 레짐에서는
BASE와 Mean_Levy, Mean_Brown처럼 평균 수준을 추종하는 전략의 평균 획득 단가가 높게 나타난다.
Fig. 14 Hourly average settlement prices across actual generation regimes
Fig. 15 Proportion of settlement price intervals obtained by strategy
그림 15는 각 전략이 2021년 동안 4원·3원 구간에 진입한 시간 비율을 보여준다. BASE는 모든 전략 중 가장 높은 정산 획득률을 기록하였다. 하지만
앞서 그림 12의 결과에서 확인했듯, BASE의 연간 누적 정산금은 EVmax_Levy, Mode_Levy, EVmax_Brown, Mode_Brown 보다 낮다.
반면 확률 분포 기반 전략들 사이에서는 정산 획득률 순위와 누적 정산금의 순위가 일치하는 경향을 보인다. 즉, BASE 전략은 정산 인정 구간 내에
진입하는 비율 자체는 높지만, 그 적중이 주로 발전량이 적은 저발전 구간에만 집중되어 있어, 높은 획득률 대비 누적 수익은 중간 수준에 머무르는 한계를
보인다. 이는 바람이 불지 않는 날에만 높은 수익을 달성한다는 의미로 해석되며, 그림 11의 위험-수익 분석에서 BASE가 고수익·고위험 전략으로 분류된 결과와 논리적으로 일관된다.
그림 16은 레짐 개수에 따른 결과 변동 가능성을 확인하기 위해 레짐 개수를 1개, 3개, 5개, 7개로 변화시켰을 때 연간 누적 정산금을 비교한 민감도 분석
결과를 나타낸다. 레짐 1개에서는 3,311원, 3개에서는 3,474원, 5개에서는 3,510원, 7개에서는 3,367원으로 나타난다. 즉 레짐 개수에
따라 누적 정산금 수준이 달라지는 경향이 보이며, 레짐 개수는 성능에 영향을 주는 설정 변수로 해석된다.
Fig. 16 Sensitivity of cumulative settlements to the number of regimes
Fig. 17 Sensitivity of cumulative settlements to regime boundary values
그림 17은 레짐 경계값 0.2와 0.6을 0.01 단위로 가감한 4가지 민감도 케이스에 대하여 EVmax_Levy 전략의 2021년 연간 누적 정산금을 비교한
결과를 나타낸다. 동일한 학습, 시나리오 생성, 최적화 절차와 하이퍼파라미터를 유지한 채 경계값만 변화시켰을 때, 연간 누적 정산금은 3,459원
경계값 0.21-0.6에서 3,480원 경계값 0.19-0.6 범위로 산출되었다. 기존 케이스 경계값 0.2-0.6, 3,474원 대비 경계값 0.01
변화당 최대 변동폭은 15원 약 0.43%에 불과하다. 단위 변화에 대한 민감도가 0.5% 미만으로, 설정된 레짐 경계값의 강건성이 수치적으로 확인된다.
5. 레비 프로세스와 경제적 최적화를 결합한 입찰 전략의 성과 요약 및 후속 연구 과제
본 연구에서는 국내 재생에너지 발전량 예측제도의 계단형 정산 단가 구조 하에서 풍력 발전 사업자의 기대 수익을 극대화하기 위한 통합 확률론적 예측값
제출 프레임워크를 제안하였다. 기존의 결정론적 예측 모델이 주로 예측 오차의 최소화에 집중하여 실제 시장의 비선형적 정산 규칙과 풍력 발전량의 확률적
불확실성을 충분히 반영하지 못하는 한계를 극복하고자 하였다. 이를 위해 본 연구는 딥러닝 기반의 Seq2Seq 모델을 통해 기준 예측 궤적을 생성하고,
발전량의 물리적 제약을 반영하기 위해 Logit 변환을 적용하였다. 또한, 물리적 경계값 부근과 중간 영역에서 상이하게 나타나는 오차의 변동성 특성을
포착하기 위해, 발전량 수준에 따라 세 가지 레짐을 정의하여 모델의 정교함을 높였다. 이러한 레짐별 특성을 기반으로 풍력 발전 특유의 비대칭적이고
두꺼운 꼬리를 가진 오차 분포를 정교하게 모델링하기 위해 기존의 브라운 운동 가정 대신 α-안정 분포를 따르는 레비 프로세스를 도입하여 시나리오를
생성하였다. 최종적으로 생성된 시나리오 집합에 대해 기대 정산 단가를 최대화하는 예측값 제출 전략을 수립하였다.
실제 풍력 발전소 데이터를 활용한 실험 결과, 제안하는 방법론의 유효성은 다음과 같이 입증되었다. 첫째, 통계적 정확도 지표인 NMAE와 RMSE
측면에서는 결정론적 모델이 가장 우수한 성능을 보였으나, 실제 사업자의 수익인 연간 누적 정산금 측면에서는 레비 프로세스 기반의 기대 정산 단가 최대화
전략이 가장 높은 성과를 달성하였다. 이는 단순히 예측 오차를 줄이는 것이 경제적 수익 극대화로 직결되지 않음을 시사한다. 둘째, 위험-수익 분석
결과, 레비 프로세스 기반 기대 정산 단가 최대화 전략은 높은 평균 획득 단가를 유지하면서도 변동성을 낮추어 고수익-저위험의 안정적인 포트폴리오를
구성함을 확인하였다. 셋째, 레비 프로세스 기반 오차 모델은 발전량이 낮거나 높은 극단적 레짐에서 나타나는 비대칭성과 두꺼운 꼬리를 보다 정교하게
반영하였다. 이를 바탕으로 수립된 기대 정산 단가 최대화 예측값 제출 전략은 단순 평균값 또는 최빈값을 사용하는 결정론적 전략보다 우수한 경제적 성과를
보임으로써 극단적 상황에서의 확률론적 모델링의 효용성을 확인하였다.
결론적으로 본 연구는 딥러닝 예측 기술과 확률론적 오차 모델링, 그리고 경제적 의사결정 이론을 결합하여 실제 전력 시장 참여자에게 실질적인 이익을
제공할 수 있는 구체적인 예측값 제출 전략을 제시하였다는 점에서 의의가 있다. 또한 본 연구의 최적화 틀은 향후 전력시장 제도 변화에도 적용 가능하도록
구성된다. 재생에너지 입찰제도가 도입되는 경우에도 동일한 오차 시나리오 생성 절차를 그대로 활용할 수 있다. 학습과 예보 추정은 사전에 수행하고,
운영 단계에서는 시나리오 생성과 이산 최적화만 수행하므로 계산 부담이 크지 않다. 따라서 실시간 의사결정이 요구되는 시장 환경에서도 적용 가능성이
있다. 향후 연구로는 본 프레임워크를 태양광 발전 등 다른 재생에너지원이나 실시간 시장으로 확장하여 범용성을 검증하는 과정이 필요하다. 아울러, 본
연구에서 적용한 고정된 경계값 기반의 레짐 분류 방식이 갖는 오분류 위험을 구조적으로 개선하기 위해, 데이터의 잠재적 패턴을 스스로 학습하는 클러스터링
기법이나 레짐 전환의 불확실성을 확률적으로 내재화하는 동적 모델링에 대한 후속 연구가 요구된다.