• 대한전기학회
Mobile QR Code QR CODE : The Transactions of the Korean Institute of Electrical Engineers
  • COPE
  • kcse
  • 한국과학기술단체총연합회
  • 한국학술지인용색인
  • Scopus
  • crossref
  • orcid

  1. (Dept. of Statistics and Data Science, University of Seoul, Republic of Korea.Dept. of New Growth Planning, HD Hyundai Electric, Republic of Korea)



Active Learning, Debiasing Matrix, Photovoltaic Power Prediction, Sky Image, Solar Forecasting

1. 서 론

전 세계적으로 탄소중립(Net-zero) 목표 달성을 위한 재생에너지 확대가 가속화되고 있으며, 이 중 태양광 발전(Photovoltaic, PV)은 핵심적인 역할을 차지하고 있다 [1]. 그러나 태양광 발전은 구름의 이동과 같은 기상 조건에 따라 출력 변동성이 큰 간헐성과 불확실성을 내재하고 있다. 이러한 예측 불가능성은 전력계통의 실시간 수급 균형 유지에 직접적인 부담으로 작용하며, 계통 운영의 안정성과 경제성에도 부정적인 영향을 미친다. 따라서, 분(Minute) 단위 수준의 단기 발전량 예측은 안정적인 계통 운영과 전력시장 효율성을 위한 핵심 선결 과제이다 [2] [3].

기존 연구는 AutoRegressive Integrated Moving Average(ARIMA), Seasonal ARIMA(SARIMA) 등 통계 기반 모델을 사용하여 발전량을 예측하였으나, 이러한 접근은 기상 변수 간의 비선형적 연관성을 충분히 반영하지 못한다는 한계가 있다 [5] [6]. 이후 Long Short-Term Memory(LSTM), Convolutional Neural Network (CNN) 등 딥러닝 기반 모델이 도입되면서 예측 정확도가 개선되었으며 [8- 10], 특히 하늘 이미지를 입력 데이터로 활용하는 영상 기반 예측 방법이 주목받고 있다 [4] [7].

그러나 딥러닝 기반 예측 모델을 현장에 적용하는 데에는 두 가지 주요한 제약이 존재한다. 첫째, 고비용의 데이터셋 구축 문제이다. 대규모의 하늘 이미지와 발전량 데이터를 시계열적으로 정합(Time-alignment)하고 품질관리를 수행하는 정제 과정은 막대한 시간과 비용을 수반한다. 둘째, 데이터 불균형(Imbalance) 문제이다. 실제 기상 환경에서는 ‘맑음’ 상태의 데이터가 지배적이며, 이에 비해 예측 성능에 치명적인 영향을 미치는 ‘급격한 출력 변동’ 구간(구름의 유입 및 천이 상태)의 데이터는 상대적으로 희소하다. 이는 모델 학습 시 다수 클래스의 패턴에 편향되는 문제를 야기한다 [4] [11].

본 연구는 위 두가지 제약, 즉 높은 라벨링 비용과 데이터 불균형 문제를 동시에 완화하기 위한 실용적인 방안으로 능동 학습(Active Learning, AL)에 주목한다. 능동 학습은 제한된 라벨링 예산 하에서 모델 성능 향상에 가장 유용한 데이터를 선별적으로 획득하여 학습함으로써 비용의 효율성과 모델의 예측 정확도를 극대화하는 전략이다. 그러나 전통적인 불확실성 기반의 능동 학습 방법론은 데이터 분포가 불균형할 때 선택 편향(Selection bias)을 야기할 수 있다. 이는 불균형 데이터로 학습된 모델이 다수 클래스에 과도하게 편향되어, 정작 중요한 소수 클래스 데이터의 불확실성을 과소평가하고 잘못된 데이터를 반복적으로 선택하는 악순환을 초래한다.

이러한 한계를 극복하기 위해, 본 연구는 편향 제거 능동 학습(Debiased Active Learning, DAL) 방법론을 새롭게 제안하고, 이를 하늘 이미지 기반 태양광 예측 문제에 적용하여 데이터 불균형 상태에서 능동 학습의 성능을 확보하고자 한다. 제안하는 방식은 소규모의 신뢰할 수 있는 검증 데이터셋(Trusted validation set)을 활용하여 편향된 모델의 예측 확률분포를 보정하는 편향 보정 행렬(Debiasing matrix) D를 추정한다. 이후, 보정된 확률분포를 바탕으로 불확실성 샘플링을 수행함으로써, 불균형 상황에서도 소수 클래스의 중요 데이터를 효과적으로 선별하여 라벨링 효율과 예측 정확도를 향상시킨다.

2. 관련 연구

2.1 태양광 발전량 예측

단기 태양광 발전량 예측은 전통적인 통계 기반의 시계열 분석 기법에서 머신러닝 및 딥러닝 기반으로 발전해왔다. 초기 연구는 ARIMA, SARIMA와 같은 통계 모델을 활용하였으나, 이는 복잡한 기상 변수의 비선형적 특성을 반영하는 데 명확한 한계가 존재했다 [5] [6]. 이후 LSTM와 같은 Recurrent Neural Network(RNN) 계열 모델이 과거 발전량 데이터의 시계열적 특성을 학습하는 데 활용되었다 [8- 10].

최근 연구 동향은 하늘에 포착된 구름의 이동과 형태, 태양의 위치 등 시각적 정보를 직접 활용하는 CNN 기반의 영상 분석으로 이동하고 있다 [4] [7]. 전천 카메라(All-sky imager)로 촬영한 하늘 이미지를 입력으로 사용하며 미래의 구름 분포나 발전량을 직접 예측하는 방식은, 전통적인 시계열 모델 대비 높은 예측 정확도를 보이며 해당 분야의 주류 연구로 자리 잡았다 [11] [12].

2.2 능동 학습

능동 학습(AL)의 핵심은 어떤 데이터를 선택하여 라벨링을 요청할지를 결정하는 쿼리 전략(Query strategy)에 있다. 가장 대표적인 전략은 불확실성 샘플링(Uncertainty sampling)이다. 이는 모델이 현재 예측을 가장 자신 없어 하는 데이터를 선택하는 방식으로, 엔트로피(Entropy), 변동비(Variation ratio), 마진(Margin) 샘플링 등이 여기에 속한다. 구체적으로, 라벨이 없는 데이터풀($X_u$)의 특정 데이터 $x$에 대해, $K$개 클래스에 대한 모델의 예측 확률 분포를 $p(y|x)$라 하자. 가장 높은 클래스에 대한 예측 확률을 $p_1(x) = \max_c p(y=c|x)$, 두 번째로 높은 클래스에 대한 예측 확률을 $p_2(x)$라 할 때, 각 불확실성 쿼리 전략 $a$는 다음과 같이 정의된다.

엔트로피(Entropy) 모델의 예측 분포가 갖는 정보량의 기댓값이다. 식 (1)과 같이 정의되며, 이 값이 클수록 불확실성이 높음을 의미한다.

(1)
$a_{Entropy}(x) = H(y|x) = - \sum_{c=1}^{K} p(y=c|x) \log p(y=c|x)$

변동비(Variation ratio) 가장 유력한 클래스의 확률에 기반한 불확실성 지표이다. 식 (2)와 같이 정의되며, 이 값이 클수록 $p_1(x)$가 낮으므로 그 결과 불확실성이 높다.

(2)
$a_{VR}(x) = 1 - p_1(x)$

마진(Margin) 가장 유력한 두 클래스의 예측 확률 간의 차이에 기반한 지표이다. 식 (3)과 같이 정의되며, 이 값이 클수록 모델이 두 클래스를 명확히 구분하지 못해 두 클래스 간 확률 차이가 작음을 의미하며, 이는 곧 불확실성이 높음을 의미한다.

(3)
$a_{Margin}(x) = 1 - (p_1(x) - p_2(x))$

불확실성 샘플링은 아래 식 (4)와 같이, 이 지표 $a(x)$가 최대가 되는 데이터 $x^*$를 쿼리 대상으로 선택한다.

(4)
$x^* = \arg \max_{x \in X_U} a(x)$

능동 학습의 각 루프마다 이러한 쿼리 전략을 통해 선택된 데이터는, 전문가(Oracle)에 의해 라벨이 부여되어 학습 데이터 구축에 활용되며, 이를 통해 학습된 모델은 제한된 라벨링 비용을 활용하여 모델의 성능을 최대한 향상시켜 라벨링 및 학습의 효율성을 증대화하게 된다. 그러나 이러한 불확실성 기반 접근은 불균형 데이터 환경에서 선택 편향을 유발할 수 있다. 모델이 다수 클래스의 분포에 치우쳐 확률을 산출하기 때문에, 해당 확률은 소수 클래스에 대한 정확한 정보를 담지 않을 위험이 있으며, 소수 클래스 데이터가 지속적으로 누락될 가능성이 높다.

2.3 신뢰 데이터를 활용한 보정 행렬

대규모 데이터셋에 내재된 불균형이나 노이즈 문제를 해결하기 위해, 작지만 신뢰할 수 있는 검증 데이터셋을 활용하는 연구들이 제안되었다.

Golden Loss Correction(GLC) 방법론은 학습에 활용하는 데이터 중 일부가 잘못된 라벨이 부여된 라벨 노이즈(Label noise) 상황에서, 이를 해결하기 위해 신뢰 데이터를 이용해 라벨 노이즈의 확률을 추정하는 대표적인 방법론이다 [13]. 라벨 노이즈에 의해 오염된 학습 데이터를 활용해 보조 모델을 학습한 뒤, 신뢰 데이터셋 레이블 정보를 활용하여 라벨 전이 확률 행렬(Label transition probability matrix)을 추정한다. 이때, 해당 행렬은 실제 라벨이 노이즈에 의해 오염된 라벨로 바뀔 확률을 나타낸다. 이후 추정된 행렬을 이용하여 학습 손실을 보정함으로써, 노이즈의 영향을 완화하고 실제 라벨 분포에 보다 근접한 모델을 학습할 수 있다.

본 연구에서 새롭게 제안하는 DAL은 이러한 개념을 능동 학습의 쿼리 단계에 적용한 방법론이다. 그러나 두 방법론은 적용 목적과 확률적 관점, 그리고 모델 운용 방식에서 명확한 차별점을 지닌다. 첫째, GLC는 라벨 노이즈 상황을 해결하고자 제안된 방법론인데 비해, DAL은 이와 독립적으로 데이터 불균형을 해소하는 것이 목적이다. 즉, GLC가 노이즈에 의한 신뢰성 저하를 교정하는데 초점을 맞추는 반면, DAL은 데이터 간 대표성의 불균형을 개선하여 학습 효율을 극대화한다. 둘째, GLC는 실제 라벨이 주어졌을 때 이것이 잘못된 라벨로 변질될 확률을 계산하는데 비해, DAL은 그 역방향으로써 잘못된 편향 라벨이 주어졌을 때, 이것의 실제 라벨을 구하는 확률을 계산한다. 따라서, GLC는 라벨 오염의 진단을 목적으로 한다면, DAL은 라벨 편향의 보정을 목표로 하는 점에서 개념적 차이를 가진다. 셋째, GLC는 전이 행렬의 계산을 위한 별도의 보조 모델을 추가로 학습해야 하지만, DAL은 별도의 모델 학습 없이 현재 루프에서 학습된 기존 분류 모델의 확률적 예측 결과를 직접 활용하여 행렬을 계산한다. 이는 능동 학습의 특성 상, 각 루프마다 모델이 순차적으로 갱신되므로, 별도의 추정 모델 없이도 신뢰 가능한 전이 확률을 도출할 수 있음을 의미한다.

3. 제안 방법

3.1 데이터셋 및 문제 정의

본 연구는 공개 데이터셋 SKIPP’D(Sky Images and Photovoltaic Power Dataset)에서 300,000개의 하늘 이미지-발전량(PV) 쌍을 추출하여 사용하였다. 이 데이터셋은 Stanford University의 전천 카메라와 태양광 발전량 측정 장비를 통해 1분 간격으로 수집된 영상으로 구성되어 있다. 그림 1은 맑은 날에 촬영된 하늘 이미지의 예시를, 그림 2는 흐린 날에 촬영된 하늘 이미지의 예시를 나타낸다.

이러한 데이터는 일사 조건에 따라 영상의 명암과 구름 분포가 크게 달라지며, 그 결과 그림 3에서와 같이 맑은 날은 안정적인 발전 패턴을 보이는 반면, 흐린 날은 시간대별로 높은 변동성을 보인다. 따라서, 맑은 날과 흐린 날의 영상 및 출력 패턴을 비교함으로써, 모델이 학습해야 할 시각적·물리적 특징을 직관적으로 확인할 수 있다.

본 연구에서는 전체 데이터셋을 실험의 재현성과 공정한 비교를 위해 학습(Train), 검증(Validation), 테스트(Test) 총 3개의 독립적인 데이터셋으로 분할하였다. 학습 데이터셋은 능동 학습을 통한 모델 훈련 과정에 사용되며, 검증 데이터셋은 제안하는 DAL 기법의 편향 행렬 $D$를 추정하는 데 사용된다. 테스트 데이터셋은 모델의 최종 성능을 평가하기 위해 별도로 유지된다.

그림 1. 맑은 날에 촬영된 하늘 이미지

Fig. 1. Sky images captured on a Sunny day

../../Resources/kiee/KIEE.2026.75.3.569/fig1.png

그림 2. 흐린 날에 촬영된 하늘 이미지

Fig. 2. Sky images captured on a Cloudy day

../../Resources/kiee/KIEE.2026.75.3.569/fig2.png

그림 3. 맑은 날과 흐린 날 각각 5일간의 발전량(PV) 프로파일 비교

Fig. 3. Comparison of PV profiles for sunny and cloudy days (5 days each)

../../Resources/kiee/KIEE.2026.75.3.569/fig3.png

그림 4. SKIPP'D 데이터셋 구성 및 능동 학습 실험 환경

Fig. 4. Dataset configuration and experimental setup for active learning on SKIPP'D

../../Resources/kiee/KIEE.2026.75.3.569/fig4.png

그림 4는 본 연구의 데이터셋 구성 및 능동 학습 실험 환경을 나타낸다. 전체 300,000개 중 테스트 데이터셋 30,000개를 제외한 270,000개를 학습 및 검증 데이터로 사용하였으며, 이 중 $|V|$개를 검증 데이터셋 $X_V$(Validation set)으로 할당하였다. 나머지 학습 데이터셋($270,000 - |V|$)은 능동 학습의 가정에 따라 내부적으로 라벨이 있는 집합 $X_L$(Labeled set)과 라벨이 없는 집합 $X_U$(Unlabeled set)으로 나뉜다. 능동 학습의 시작을 위해, 먼저 임의로 5,000개의 데이터를 선택해 $X_L$을 구성하고, 이를 활용해 초기 모델을 학습한다. 이후 각 능동 학습 루프(Iteration)마다 DAL의 쿼리 전략에 의해 $X_U$로부터 일정 개수의 유용한 데이터가 선택된다. 이렇게 선택된 데이터는 Oracle에 의해 라벨링되어 $X_L$에 포함되고, 이러한 쿼리 과정은 제한된 라벨링 비용이 모두 소진될 때까지 반복되어 $X_L$은 최대 100,000개까지 확장된다. 각 루프마다 선택되지 않은 나머지 데이터는 계속해서 $X_U$에 남아 다음 루프의 후보군으로 사용된다.

본 연구에서는 검증 데이터셋의 크기($|V|$)를 실험 변수로 설정하여, $|V| = \{1,000, 2,000, 5,000, 10,000, 50,000\}$의 다섯 가지 경우에 대해 비교 실험을 수행하였다. 검증 데이터의 크기에 따라 편향 행렬 $D$의 추정 신뢰도가 달라지므로, DAL의 보정 효과와 불확실성 기반 쿼리 전략의 성능 차이를 함께 분석하였다. 각 조건에서 학습 데이터셋의 크기는 검증 데이터셋의 크기와 연관되어 조정되며, 모든 경우에서 테스트 데이터셋의 크기는 30,000개로 고정하여 사용하였다.

한편, 데이터셋으로부터 예측해야 하는 라벨인 태양광 발전량은 연속형 실측값으로 제공되며, [5, 10, 15, 20] kW를 기준으로 다섯 개의 구간으로 이산화(Discretization)한 뒤, 순서대로 $y \in \{0, 1, 2, 3, 4\}$의 클래스를 부여하였다. 이를 통해 PV에 대한 예측 문제를 분류 문제로 정의하였다. 전체 데이터셋의 분포는 그림 5와 같다. 그림 5(a)는 학습 단계에서 사용되는 능동 학습 후보 데이터와 DAL의 편향 행렬 추정을 위한 검증 데이터의 PV 발전량 분포를 비교하여 나타낸 것이다. 적색 막대는 능동 학습 후보 데이터(n=265,000)를, 주황색 막대는 검증 데이터(|V|=5,000)를 의미한다. 그림 5(b)는 모델 성능 평가에 사용된 테스트 데이터셋의 PV 발전량 분포를 나타낸다(n=30,000). 이를 바탕으로 본 연구에서 활용한 데이터는 클래스 간 불균형이 존재함을 확인할 수 있다.

그림 5. 태양광 발전량(PV) 분포: (a)학습 및 검증 데이터셋, (b)테스트 데이터셋

Fig. 5. Distributions of PV power generation: (a)Train and validation datasets, (b)Test dataset

../../Resources/kiee/KIEE.2026.75.3.569/fig5.png

3.2 분류 모델

하늘 이미지로부터 발전량 클래스를 분류하기 위해, 분류 모델로 CNN 기반의 SUNSET 모델 아키텍처를 변형하여 사용하였다 [4] [7]. 해당 모델의 입력 데이터는(64 × 64 × 3) 크기의 하늘 이미지이며, 두 개의 컨볼루션(Convolution)-풀링(Pooling) 블록을 통해 공간적 특징을 추출한다. 이후 Flatten 계층을 통해 특징을 벡터화한 뒤, 두 개의 완전연결(Fully-connected) 계층을 통과하며, 마지막 출력층에서는 Softmax 함수를 사용하여 5개 클래스에 대한 확률 분포 $p(y|x; \theta)$를 계산한다. 여기서 $x$는 입력 이미지, $y$는 클래스(0-4), $\theta$는 모델 파라미터를 의미한다.

3.3 편향 제거 능동 학습(Debiased Active Learning) 제안

본 연구에서는 클래스 간 불균형이 존재하는 데이터셋을 활용한 능동 학습의 성능을 향상시키기 위해, DAL 방법론을 제안한다. DAL 방법론의 핵심은 불균형 데이터 환경에서 특정 클래스에 편향된 예측 확률을 보정하는 것이다. 이를 위해 검증 데이터셋 $V = \{(x_v, y_v)\}$을 사용하여 모델의 예측 편향을 정량적으로 진단한다. 사전 연구인 GLC를 참고하여, $\hat{y}$을 현재 능동 학습 루프에서 모델이 예측하는 클래스라고 표현할 때, $K=5$개의 클래스에 대해 $K \times K$ 크기의 편향 예측 행렬 $\tilde{D} \in R^{K \times K}$을 다음과 같이 정의할 수 있다.

(5)
$\tilde{D}_{ij} = p(\hat{y}=i|y=j)$

이는 모델이 실제 클래스 $j$인 데이터의 클래스를 $i$로 잘못 예측할 조건부 확률을 의미한다. 하지만 본 연구에서 제안하는 DAL 방법론에서 필요한 편향 보정 행렬 $D$는 해당 확률에서 실제 클래스와 예측 클래스의 사후 관계가 반전되어야 한다. 즉, 모델이 클래스 $j$로 예측하는 데이터에 대해, 해당 예측에 내재되어 있는 편향을 제거하여 실제 클래스가 $i$일 확률을 역으로 보정하여 계산해야 한다. 이 확률은 베이즈 룰(Bayes’ Rule)을 활용하여 아래와 같이 표현할 수 있다.

(6)
$D_{ij} = p(y=i|\hat{y}=j) = \frac{p(\hat{y}=j|y=i)p(y=i)}{p(\hat{y}=j)} = \frac{\tilde{D}_{ji}p(y=i)}{p(\hat{y}=j)}$

이때, 검증 데이터셋의 모든 클래스의 데이터 개수를 균등하게 분포하면 $p(y=i)$ 항은 모든 클래스에 동일한 상수항이기 때문에 계산 과정에서 사라지며, $p(\hat{y}=j)$항은 검증 데이터셋을 현재 모델에 입력시켰을 때 나오는 예측 클래스의 분포를 통해 계산 가능하다.

최종적으로 식 (6)을 통해 계산된 편향 보정 행렬 $D$는 모델의 예측 편향을 수치적으로 반영하며, 식 (7)과 같이 원래의 예측 확률 $p(y|x)$을 보정 확률 $\tilde{p}(y|x)$으로 변환하는 데 사용된다.

(7)
$\tilde{p}(y|x) = D^T p(y|x)$

보정된 확률 $\tilde{p}(y|x)$은 다수 클래스 중심의 예측 확률 분포에 내재하는 편향을 완화하고, 소수 클래스(Minority class)의 중요 샘플을 보다 균형 있게 반영한다. 따라서, DAL 기반 쿼리 전략에서는 기존의 불확실성 기반 샘플링을 확장하여 $p(y|x)$ 대신 $\tilde{p}(y|x)$을 사용한다. 즉, DAL 기법은 모델의 예측 확률 분포를 활용하는 임의의 방법론에 대해, 해당 방법론의 편향을 보정해주는 역할을 하여 적용 및 일반화 가능한 방법론이라는 점에서 의미를 지닌다.

본 연구에서는 아래와 같이 대표적인 세 가지 불확실성 기반 쿼리 전략에 DAL을 적용하였다.

(8)
$a_{Entropy}^{DAL}(x) = - \sum_{c=1}^{K} \tilde{p}(y=c|x) \log \tilde{p}(y=c|x)$
(9)
$a_{VR}^{DAL}(x) = 1 - \tilde{p}_{(1)}(y|x)$
(10)
$a_{Margin}^{DAL}(x) = 1 - (\tilde{p}_{(1)}(y|x) - \tilde{p}_{(2)}(y|x))$

여기서 $\tilde{p}_{(1)}$ 과 $\tilde{p}_{(2)}$ 는 보정된 예측 확률 $\tilde{p}(y|x)$ 중 각각 첫 번째와 두 번째로 큰 클래스에 대한 확률값을 의미한다. 각 라운드에서 불확실성 점수가 높은 샘플을 선택하여 라벨링하고, 선택된 샘플은 학습 데이터셋에 추가되어 다음 라운드 학습에 활용된다. 이 과정을 반복함으로써 DAL은 제한된 라벨링 예산 하에서도 불균형 데이터로부터 야기된 예측 편향을 제거하며 효율적으로 모델의 성능을 향상시킨다.

그림 6. 제안하는 DAL 프레임워크의 개요

Fig. 6. Overview of the proposed DAL framework

../../Resources/kiee/KIEE.2026.75.3.569/fig6.png

그림 6은 제안하는 DAL 프레임워크의 전체 구조를 나타낸다. 검증 데이터셋 $X_V$을 활용하여 편향 보정 행렬 D를 추정하고, 이를 통해 분류 모델($f_\theta$)의 예측 확률 $p(y|x)$를 보정된 확률 $\tilde{p}(y|x)$로 변환한 뒤, 불확실성 샘플링을 수행하여 라벨링이 없는 데이터풀 $X_U$에서 유용한 샘플을 선택한다.

4. 실험결과 및 분석

본 장에서는 제안한 DAL 기법의 성능을 정량적으로 검증한다. 실험의 목적은 두 가지이다. 첫째, 클래스 불균형이 존재하는 하늘 이미지 기반 태양광 발전량 예측 문제에서 DAL이 기존 불확실성 기반 능동 학습 베이스라인 대비 예측 성능 및 라벨링 효율을 개선하는지 평가한다. 둘째, DAL의 핵심 요소인 신뢰 검증 데이터셋의 크기($|V|$)가 성능에 미치는 영향을 분석함으로써 기법의 안정성과 견고성을 확인한다.

4.1 실험 환경

실험은 3장에서 정의한 데이터셋 구성, 문제 설정, 모델 구조를 기반으로 실험을 수행하였다. 능동 학습 환경에서 초기 라벨링된 집합 $X_L$은 5,000개로 설정하였으며, 매 Iteration마다 5,000개의 샘플을 쿼리하여 $X_L$의 크기가 최대 100,000개가 될 때까지 총 20회의 반복을 진행하였다. 비교 베이스라인은 Random sampling, Entropy, Variation ratio 및 Margin 기반 불확실성 쿼리 전략으로 설정하였으며, 베이스라인과 DAL 변형 방법 등을 포함한 모든 실험은 동일한 학습 조건을 적용하여 공정성을 확보하였다.

4.2 베이스라인 대비 DAL 성능 비교 결과

그림 7는 검증 데이터셋 크기 $|V| = 10,000$ 조건에서 베이스라인과 DAL의 Iteration별 테스트 정확도 변화를 비교한 결과이다. DAL Entropy, DAL Variation ratio, DAL Margin은 베이스라인 대비 높은 성능을 보였으며, 특히 DAL Margin은 Iteration 5–15 구간에서 가장 빠른 성능 향상을 나타냈다. 능동 학습의 핵심 목표는 제한된 라벨링 비용 하에서 초기 단계부터 빠르게 모델 성능을 확보하는 것이다. 이러한 관점에서 DAL Margin이 초기 Iteration에서 베이스라인 대비 높은 정확도를 달성한 것은, 적은 라벨링 비용으로도 효율적인 데이터 선택이 가능함을 보여준다.

그림 7. |V|=10,000 조건에서 베이스라인과 DAL 정확도 비교

Fig. 7. Accuracy comparison between Baseline and DAL under |V|=10,000

../../Resources/kiee/KIEE.2026.75.3.569/fig7.png

그림 8. 흐린 날의 3분 간격 분류 예측 결과 비교

Fig. 8. Classification prediction results on cloudy days at 3-min intervals

../../Resources/kiee/KIEE.2026.75.3.569/fig8.png

이러한 성능 향상은 DAL이 편향 보정 행렬 $D$를 통해 추정 확률을 재조정함으로써, 쿼리 단계에서 발생하는 편향을 효과적으로 완화한 결과로 해석된다.

그림 8은 출력 변동이 심한 흐린 날 조건에서 Margin과 DAL Margin 전략의 3분 간격 분류 예측 결과를 비교한 것이다. 전반적으로 DAL Margin이 Margin 대비 높은 정확도를 보이며, 이는 구름 이동에 의한 급격한 출력 변동 구간에서 DAL의 편향 보정 효과가 두드러짐을 보여준다.

4.3 신뢰 데이터셋 크기에 대한 견고성 분석

DAL의 보정행렬 $D$ 추정 안정성을 평가하기 위해, 검증 데이터셋 의 크기를 다양하게 변화시켜 가며 DAL의 강건성을 확인하였다. 표 1-5는 검증 데이터셋의 다양한 크기에 대해 Iteration별 정확도를 나타낸 결과로, 이때 최종적으로 선택한 $X_L$의 크기는 100,000개이다. 실험에서 활용한 검증 데이터셋의 크기는 $|V| = \{1,000, 2,000, 5,000, 10,000, 50,000\}$이다. 각 표에서 굵은 글씨는 각 검증 데이터셋 크기 조건에서 가장 우수한 성능을, 밑줄은 두 번째로 우수한 성능을 나타낸다.

표 3, 4에 따르면, 제안하는 DAL은 $|V| = 5,000$ 및 $|V| = 10,000$ 조건에서 가장 높은 최종 정확도인 93.65%를 기록하였으며, 특히 DAL Margin 전략이 베이스라인 대비 가장 뚜렷한 개선 효과를 보였다.

초기 성능 확보의 관점에서 표 3의 $|V| = 5,000$ 조건을 살펴보면, DAL Margin은 Iteration 5 시점(최종 라벨링 예산의 30% 사용)에서 89.90%의 정확도를 달성하여 베이스라인 Margin(89.59%) 대비 우수한 성능을 보였다. 이는 초기 단계에서 DAL이 더 효율적인 데이터 선택을 수행함을 보여준다.

$|V| = 10,000$의 경우(그림 7, 표 4), $|V|$가 일정 수준 이상 확보될 때 보정행렬 $D$의 추정 신뢰도가 높아져 DAL의 성능이 일관적으로 발현됨을 확인할 수 있다.

반면, $|V| = 1,000$ 및 $|V| = 2,000$(표 1, 2)은 최종 정확도가 최고 성능 대비 다소 낮게 나타났는데, 이는 신뢰 데이터셋의 크기가 충분하지 않을 때 보정행렬 $D$의 분산이 커져 선택 편향(Selection bias)을 적절히 상쇄하지 못한 결과로 해석된다.

표 1. |V|=1,000 조건에서 Iteration별 테스트 정확도(%)

Table 1. Test accuracy(%) by iteration under |V|=1,000

Method
(|V|=1,000)
Iteration
1 5 10 15 19
Random 81.38 86.85 90.11 90.75 91.39
Entropy 80.89 86.75 91.49 93.18 93.51
Variation ratio 81.37 88.84 91.79 93.39 93.40
Margin 82.60 89.84 92.27 93.31 93.36
DAL Entropy 80.98 87.74 91.63 93.14 93.63
DAL Variation ratio 81.04 88.56 91.61 93.41 93.49
DAL Margin 81.89 89.74 92.34 93.42 93.40

표 2. |V|=2,000 조건에서 Iteration별 테스트 정확도(%)

Table 2. Test accuracy(%) by iteration under |V|=2,000

Method
(|V|=2,000)
Iteration
1 5 10 15 19
Random 81.62 87.47 89.74 90.96 91.41
Entropy 79.89 87.45 92.23 92.92 93.40
Variation ratio 81.65 89.09 92.22 93.19 93.51
Margin 81.61 89.56 92.39 93.46 93.48
DAL Entropy 81.61 87.79 90.47 93.09 93.54
DAL Variation ratio 81.27 87.97 92.43 93.25 93.42
DAL Margin 81.14 90.00 92.21 93.42 93.53

표 3. |V|=5,000 조건에서 Iteration별 테스트 정확도(%)

Table 3. Test accuracy(%) by iteration under |V|=5,000

Method
(|V|=5,000)
Iteration
1 5 10 15 19
Random 81.75 87.87 89.82 90.71 91.30
Entropy 81.26 87.72 91.60 93.10 93.48
Variation ratio 80.71 87.84 92.09 93.12 93.03
Margin 81.32 89.59 91.63 93.45 93.60
DAL Entropy 81.18 87.18 90.07 93.01 93.50
DAL Variation ratio 79.25 88.29 91.93 93.40 93.60
DAL Margin 82.73 89.90 92.23 93.00 93.65

표 4. |V|=10,000 조건에서 Iteration별 테스트 정확도(%)

Table 4. Test accuracy(%) by iteration under |V|=10,000

Method
(|V|=10,000)
Iteration
1 5 10 15 19
Random 81.08 87.85 90.14 91.06 91.25
Entropy 80.98 87.07 92.03 93.03 93.19
Variation ratio 80.84 88.86 91.61 93.18 93.17
Margin 82.49 89.71 91.94 93.15 93.14
DAL Entropy 80.68 87.10 90.20 93.26 93.35
DAL Variation ratio 80.67 88.41 91.61 93.02 93.33
DAL Margin 82.46 88.78 92.38 93.21 93.65

표 5. |V|=50,000 조건에서 Iteration별 테스트 정확도(%)

Table 5. Test accuracy(%) by iteration under |V|=50,000

Method
(|V|=50,000)
Iteration
1 5 10 15 19
Random 80.90 87.74 89.58 90.49 91.25
Entropy 80.53 87.90 91.93 92.88 92.82
Variation ratio 80.86 88.68 92.35 93.21 93.14
Margin 81.23 89.24 92.23 93.04 93.21
DAL Entropy 80.03 87.29 90.94 92.81 92.87
DAL Variation ratio 79.40 88.43 91.96 92.68 92.94
DAL Margin 81.68 88.98 92.30 92.94 92.83

또한, $|V| = 50,000$(표 5)과 같이 검증 데이터셋 비중이 지나치게 커질 경우, 3.1절에서 설명한 것처럼 학습·선택 과정에 활용 가능한 전체 데이터풀($X_L$, $X_U$)의 규모가 축소되며 DAL의 이점이 약화된다. 실험 결과에서도 이 조건에서는 모든 DAL 전략이 상대적으로 낮은 정확도(93% 미만)에 머무르는 경향을 보였다.

5. 결 론

본 연구에서는 하늘 영상 기반 태양광 발전량 예측 문제에서 발생하는 데이터의 불균형성 및 라벨링 비용의 문제를 완화하기 위해, 편향 제거 능동 학습(DAL)을 제안하였다. DAL은 소규모의 신뢰 검증 데이터셋을 기반으로 모델 예측 확률의 편향을 추정하고, 보정 행렬을 이용하여 모델의 편향된 예측 분포를 보정한다. 이를 통해 기존 불확실성 기반 능동 학습 기법이 가지는 샘플 선택 과정의 비균형성을 구조적으로 개선하였다. DAL은 모델의 예측을 활용하는 기존의 능동 학습 방법론에 적용 가능한 확장성을 가지고 있으며, SKIPP'D 데이터셋을 활용한 비교 실험 결과, Random sampling 및 기존 불확실성 기반 능동 학습 방법론 대비 향상된 성능을 달성하였다. 특히, DAL Margin 전략이 라벨링 비용 대비 예측 정확도 측면에서 가장 우수한 성능을 보였으며, 신뢰 검증 데이터셋 크기 분석을 통해, 전체 데이터의 약 2~5%($|V| = 5,000 \sim 10,000$)수준을 신뢰 검증 데이터셋으로 설정하는 것이 DAL 성능을 최대화하는 조건임을 확인하였다.

향후에는 본 연구에서 제안한 DAL 프레임워크를 분류 문제뿐 아니라 연속값을 직접 예측하는 회귀 기반 태양광 예측 문제에 적용 가능하도록 개선시킬 예정이며, 나아가 풍력 발전, 분산 자원 제어 등 다양한 에너지 분야로의 확장이 가능할 것으로 기대된다.

Acknowledgements

This work was supported by the National Research Foundation of Korea(NRF) grant funded by the korea government(MSIT) (RS-2025-00558109).

References

1 
2022, Climate Change 2022: Mitigation of Climate Change. Working Group III Contribution to the Sixth Assessment Report of the Intergovernmental Panel on Climate Change – Summary for PolicymakersGoogle Search
2 
E. Ela, V. Diakov, E. Ibanez, M. Heaney, 2013, Impacts of Variability and Uncertainty in Solar Photovoltaic Generation at Multiple TimescalesDOI
3 
B. Li, J. Zhang, 2020, A review on the integration of probabilistic solar forecasting in power systems, Solar Energy, Vol. 207, pp. 777-795DOI
4 
Y. Nie, Q. Paletta, A. Scott, L. M. Pomares, G. Arbod, S. Sgouridis, J. Lasenby, A. Brandt, 2024, Open-source sky image datasets for solar forecasting with deep learning: A comprehensive survey, Renewable and Sustainable Energy Reviews, Vol. 189DOI
5 
E. Chodakowska, J. Nazarko, Ł. Nazarko, H. S. Rabayah, R. M. Abendeh, R. Alawneh, 2023, ARIMA models in solar radiation forecasting in different geographic locations, Energies, Vol. 16DOI
6 
P. Bacher, H. Madsen, H. A. Nielsen, 2009, Online short-term solar power forecasting, Solar Energy, Vol. 83, No. 10, pp. 1772-1783DOI
7 
Q. Paletta, G. Terrén-Serrano, Y. Nie, B. Li, J. Bieker, W. Zhang, L. Dubus, S. Dev, C. Feng, 2023, Advances in solar forecasting: Computer vision with deep learning, Advances in Applied Energy, Vol. 11DOI
8 
W.-G. Park, J.-S. Kim, S.-M. Lim, C.-H. Kim, 2021, A Study on Photovoltaic Output Prediction Uncertainty and Intermittency Compensation Method, The Transactions of the Korean Institute of Electrical Engineers, Vol. 70, No. 7, pp. 961-968DOI
9 
O. Kwon, H. Hong, H. Jo, H. Cha, 2023, Prediction of a Floating Photovoltaic Generation Utilizing KMA Weather Forecast, The Transactions of the Korean Institute of Electrical Engineers, Vol. 72, No. 8, pp. 904-911DOI
10 
D. So, J. Moon, 2024, Multi-Fusion Deep Learning Based Multistep-Ahead Photovoltaic Power Forecasting Considering Multivariate Time Series Characteristics, The Transactions of the Korean Institute of Electrical Engineers, Vol. 73, No. 10, pp. 1617-1623DOI
11 
Y. Nie, X. Li, A. Scott, Y. Sun, V. Venugopal, A. Brandt, 2023, SKIPP’D: A Sky Images and Photovoltaic Power Generation Dataset for short-term solar forecasting, Solar Energy, Vol. 255, pp. 171-179DOI
12 
B. J. Martins, A. Cerentini, S. L. Mantelli, T. Z. L. Chaves, N. M. Branco, A. von Wangenheim, R. Rüther, J. M. Arrais, 2022, Systematic review of nowcasting approaches for solar energy production based upon ground-based cloud imaging, Solar Energy Advances, Vol. 2DOI
13 
D. Hendrycks, M. Mazeika, D. Wilson, K. Gimpel, 2018, Using trusted data to train deep networks on labels corrupted by severe noiseGoogle Search

저자소개

신승협 (Seung-Hyeop Shin)
../../Resources/kiee/KIEE.2026.75.3.569/au1.png

received the B.S. degree in Mechatronics Engineering with a double major in Software Convergence from Kangwon National University, Korea, in 2021. Since 2022, he has been with the New Growth Planning Department at HD Hyundai Electric, Seongnam, Korea. He is currently pursuing the M.S. degree in the Department of Statistics and Data Science at the University of Seoul, Korea. His research interests include active learning, distributed energy resources.

김윤영 (Yoon-Yeong Kim)
../../Resources/kiee/KIEE.2026.75.3.569/au2.png

received the B.S. degree in mathematical sciences and the M.S. and Ph.D.degrees in industrial and systems engineeringfrom Korea Advanced Institute of Science and Technology (KAIST), in 2016, 2018, and 2023, respectively. Since 2022, she has been a Senior Researcher with the AI Autonomy Technology Center, Agency for Defense Development,South Korea. Since 2023, she has been an Assistant Professor with the Department of Statistics, University of Seoul, South Korea. Her research interest includes improving the generalization ability of deep learning and its applications.