3.1 Overall Architecture for Physics-Informed Model
PPINN은 자동 미분을 통해 편미분 방정식(PDE)으로 기술되는 물리 법칙을 신경망 학습 과정에 직접 통합한다. 일반적인 PINN 접근 방식은 공간
도메인 $\Omega$와 시간 구간 $[0, T]$로 구성된 시공간 영역 $(t,x)$에서 정의된 편미분 방정식의 해 $u(t,x)$를 근사하기 위해
고안되었다. 이때 물리적 법칙을 따르는 잔차 함수 $f$는 식 (3)과 같이 정의되며, 네트워크는 이를 최소화하는 방향으로 학습된다.
여기서 $\mathcal{N}[\cdot]$은 물리 시스템을 지배하는 미분 연산자를 나타내며, $x$와 $t$는 각각 정의된 영역 내의 공간 및 시간
좌표를 의미한다. 식 (3)의 잔차를 최소화함으로써 신경망은 데이터 없이도 물리 법칙을 준수하게 된다. 파라미터화된 시스템의 경우, PINN 접근 방식은 파라미터를 단지 추가적인
지표로 취급하기 때문에, 다양한 파라미터 조건에 대한 효과적인 학습에 한계가 있다.
PPINN 프레임워크는 파라미터 종속성을 잠재적 표현으로 명시적으로 인코딩하여 이러한 한계를 해결하며, 여러 배터리 작동 조건에 걸쳐 효율적인 학습을
가능하게 한다. PPINN 접근 방식은 잠재적 매니폴드(latent manifold)라고 알려진 배터리 파라미터와 그 동적 거동 사이의 일반화된 관계를
나타내는 연속적인 기저구조를 학습한다. 여기서 하이퍼네트워크가 파라미터 인코더 역할을 수행하여, 초기 $SOC_0$와 같은 간단한 입력을 이 매니폴드
상의 고유한 좌표로 변환한다. 이 좌표는 물리적으로 일관된 근사치, 즉 $\widehat{V}_1(t; SOC_0)$를 생성하도록 메인 솔루션 네트워크를
동적으로 구성한다. 이 근사치는 파라미터화된 미분 연산자가 최소화되도록, $\mathcal{N}[t, \widehat{V}_1(t; SOC_0)]
\approx 0$를 만족하도록 설계된다. 본질적으로, $SOC_0$는 매니폴드 상의 물리적 맥락을 식별하는 역할을 하며, LSTM을 통해 예측된
궤적은 진화하는 데이터 동향을 제공한다. 이를 통해 프레임워크는 일반화된 물리 법칙과 특정 시간적 패턴을 반영할 수 있다.
본 연구에서는 배터리 동특성을 그림 2와 같은 1차 RC 등가 회로 모델로 정의하였다. 통상적으로 1차 RC 모델은 구조적 단순함으로 인해 저온이나 노화 조건 등에서 발생하는 복잡한 비선형
분극 현상을 정밀하게 모사하는데 한계가 존재한다 [19]. 그러나 제안된 PPINN 프레임워크는 하이퍼네트워크를 통해 현재의 작동 조건에 맞춰 파라미터 가중치를 동적으로 조정함으로써, 이러한 저차 모델의
구조적 한계를 극복할 수 있다. 여기서 개방 회로 전압 $U_{OCV}(SOC)$, 옴 저항 $R_0(SOC)$, 분극 저항 $R_1(SOC)$,
그리고 분극 커패시턴스 $C_1(SOC)$를 포함하는 배터리 파라미터들은 그림 3과 같은 HPPC(hybrid pulse power characterization) 테스트를 통해 얻어진다 [20].
그림 3. 배터리 파라미터 추정을 위한 HPPC 테스트
Fig. 3. HPPC test for battery parameter estimation
그림 3의 HPPC 테스트 결과에서, 방전 초기 점 A-B의 급격한 전압 강하와 회복 초기 점 C-D의 전압 상승은 옴 저항 ($R_0$)에 기인한다. 이에
따라 식 (4)는 해당 구간의 전압 변화량과 인가 전류를 이용하여 $R_0$를 산출한다.
식 (4)에서 $V_A, V_B$ 및 $V_E, V_F$는 각각 방전과 충전 시 전압 변화가 발생하는 지점의 전압이며, $I_d$와 $I_c$는 인가된 방전
및 충전 전류를 의미한다. 이를 통해 도출된 방전 옴 저항 $R_0^d$와 충전 옴 저항 $R_0^c$의 산술 평균을 통해 최종 옴 저항 $R_0$를
결정한다.
분극 파라미터($R_1, C_1$)는 전류 차단 후 전압이 평형 상태로 서서히 회복되는 구간 D-E-F의 데이터를 통해 추출된다. 식 (5)와 (6)은 이 구간의 측정 전압 $V_t(t)$를 지수 함수로 피팅하는 과정을 나타낸다. 여기서 $U_{ocv}$는 배터리의 개방 회로 전압을, $V_1(0)$은
전류 차단 직후의 초기 분극 전압 강하량을 의미하며, 이는 인가 전류 $I$와 분극 저항 $R_1$, 그리고 시정수 $\tau$의 관계를 통해 기술된다.
이 과정에서 전압 회복 속도를 결정하는 시정수 $\tau$가 도출되며, 이는 $\tau = R_1C_1$의 관계를 갖는다. 따라서 피팅된 곡선으로부터
결정된 저항 $R_1$과 시정수 $\tau$를 이용하여 커패시턴스 $C_1$이 최종적으로 산출된다.
OCV-SOC 관계($U_{OCV}$)는 펄스 인가 전후의 안정화된 휴지기 전압을 여러 SOC 레벨에서 측정하고 이를 피팅하여 설정한다. 이러한 실험
절차를 통해, SOC 0에서 1까지 0.05 간격으로 20개의 고유한 파라미터 세트를 획득한다. 이 파라미터들은 전체 SOC 범위에 걸쳐 배터리 동특성을
나타내는 20개의 해당 미분 방정식을 공식화하는 기반이 되며, 이는 PPINN을 위한 물리적 토대를 제공한다 [21].
전체 프레임워크는 그림 4에 요약되어 있다. PPINN 아키텍처는 물리적으로 일관된 예측을 생성하기 위해 여러 구성 요소를 통합하며, 이는 식 (7)에서 확인할 수 있다. 식 (7)에서 $u_\Theta$는 PPINN이 근사하고자 하는 배터리 시스템의 해, 즉 추정된 전압을 나타낸다. 여기서 $\Theta = \{\theta_c,
\theta_p, \theta_g\}$는 좌표 인코더($g_{\theta_c}$), 파라미터 인코더($g_{\theta_p}$), 그리고 매니폴드
네트워크($g_{\theta_g}$)의 학습 가능 가중치 및 편향 파라미터들의 집합을 나타낸다.
식 (7) 내부의 파라미터 인코더의 입력 중 하나인 $\widehat{SOC}[:,0,:]$는 LSTM이 예측한 시퀀스 데이터의 첫 번째 시점을 인덱싱한 것이다.
그림 4에서 나타낸 바와 같이, 이들은 전체 프레임워크를 구성하는 핵심 요소로서 좌표 인코더($g_{\theta_c}$)는 시공간적 입력을 처리하고, 파라미터
인코더($g_{\theta_p}$)는 초기 조건에 기초하여 동적 가중치를 생성하며, 매니폴드 네트워크($g_{\theta_g}$)는 이를 통합하여
최종 전압을 출력한다.
그림 4. 배터리 SOC추정을 위한 전체 PPINN 프레임워크
Fig. 4. Overall PPINN framework for battery SOC estimation
3.2 Dynamic Parameter Encoding via Hypernetwork
그림 4에 나타난 바와 같이, 제안된 PPINN 프레임워크에서 좌표 인코더($g_{\theta_c}$)는 먼저 시공간(spatio-temporal) 정보를
처리하여 시간적 진화를 포착하는 은닉 표현 $h_{coord}$를 생성한다. 이를 위해 식 (8)과 같이 시간 $t$와 LSTM이 예측한 SOC 궤적 $\widehat{SOC}$를 결합하여 2차원 입력을 형성한다.
식 (8)에서 $x_{coord}$는 시공간적 특징을 포함하는 입력 벡터를 나타낸다. 이 입력은 좌표 인코더를 통해 식 (9)와 같이 처리되어 최종 은닉 표현을 도출한다.
식 (9)에서 $W_{coord}$와 $b_{coord}$는 각각 좌표 인코더의 학습 가능한 가중치 행렬과 편향 벡터를 나타낸다.
이러한 일반적인 개념을 배터리 SOC 추정 문제에 적용하기 위해, 하이퍼네트워크는 배터리의 초기 상태를 파라미터를 정의하는 고유한 입력으로 해석하도록
설계되었다. 이 접근 방식은 단일 모델이 광범위한 작동 조건에 걸쳐 일반화된 해를 효과적으로 학습할 수 있게 하여, 각기 다른 시나리오들에 대한 반복적인
훈련의 필요성을 제거한다 [18]. 그림 4에 나타낸 파라미터 인코더($g_{\theta_p}$)의 입력 $\mu_{combined}$는 식 (10)과 같이 두 가지 정보의 결합으로 정의된다. 여기서 $SOC_0$는 앞선 커브 피팅을 통해 도출된 20개의 파라미터 세트에 대응하는 기준 SOC 값을
의미하며, $\widehat{SOC}[:,0,:]$는 LSTM이 예측한 시퀀스의 초기 시점 값을 나타낸다.
이 입력 $\mu_{combined}$는 동적 가중치를 생성하기 위해 하이퍼네트워크의 완전 연결 계층을 통과한다. 이 순전파 과정은 식 (11)과 같은 초기 임베딩 계층에서 시작되어 초기 특징 벡터 $e^0$를 생성한다. 그 후, 이전 단계의 특징 $e^m$을 입력받아 다음 단계의 특징 $e^{m+1}$로
변환하는 식 (12)와 같은 중간 계층들을 걸쳐, 최종적으로 식 (13)에서 SVD(특이값 분해)에 사용될 특이값을 생성한다. 이렇게 생성된 특이값은 식 (15)와 같이 매니폴드 네트워크($g_{\theta_g}$)의 각 계층을 저순위(low-rank) 행렬로 분해하는 데 사용되며, 식 (16)을 통해 고효율의 행렬 곱셈을 가능하게 한다. 이 전체 과정은 아래의 식 (11)부터 (16)까지의 수식에 나타내었다.
식 (11)에서 $W_{emb}^0$와 $b_{emb}^0$는 하이퍼네트워크 초기 임베딩 계층의 학습 가능한 가중치 행렬과 편향 벡터를 나타내며, $\sigma_{hy}$는
은닉 계층에서 사용되는 비선형 활성화 함수를 의미한다. 식 (12)에서 ($m \in \{0, 1, ..., M-1\}$)은 은닉 계층의 인덱스이며, ($M = n_{layers} - 2$)는 전체 은닉 계층의 수를
나타낸다. 각 계층의 가중치 $W_{emb}^{m+1}$와 편향 $b_{emb}^{m+1}$을 통해 특징 벡터가 단계적으로 변환된다. 식 (13)의 최종 출력 $s(\mu_{combined})$은 $h_{param}$으로 명칭할 수 있고, 시스템의 파라미터 의존적 특성을 나타내는 평탄화된 특이값들을
포함한다. 이는 매니폴드 네트워크가 특정 초기 조건에 적응된 해를 생성하도록 동적으로 조절되게 한다 [22]. 이때, $\sigma_{param}$은 특이값 벡터의 물리적 범위를 조절하는 활성화 함수이다. $h_{param}$ 벡터는 식 (14)에 따라 매니폴드 네트워크의 각 $l$번째 계층에 대한 특이값 세트 $\alpha_l$로 재구성된다. 여기서 $\sigma_{dim}$은 각 계층의
가중치 행렬을 근사하기 위해 선택된 특이값의 개수를 의미한다. 식 (15)에서 보듯이 SVD 접근 방식 [23]은 그림 4의 매니폴드 네트워크 내부에 표기된 고정된 기저 행렬 $U^l$ 및 $V^l$과 생성된 대각 행렬 $\Sigma_l(\alpha_l)$을 결합하여
가중치 $FC_l$을 구성한다. 최종적으로 식 (16)은 이러한 저순위 구조를 활용한 효율적인 행렬 연산인 $\mathcal{M}_{LR}$을 정의한다. 여기서 $x$는 매니폴드 네트워크 해당 계층의
입력 벡터를 나타낸다. 이 저순위 행렬 곱셈은 $\mathcal{O}(2 \cdot h_{dim} \cdot \sigma_{dim})$ 연산만을 필요로
하며, 이는 표준 행렬 곱셈에 필요한 $\mathcal{O}(2 \cdot h_{dim}^2)$과 비교할 때, 특히 $\sigma_{dim} \ll
h_{dim}$일 경우 상당한 계산량 절감 효과를 제공한다.
본 연구에서 SVD를 채택한 이유는 행렬의 정보가 소수의 특이값에 집중된다는 특성을 활용하기 위함이다. 상위 개의 특이값만을 취함으로써, 하이퍼네트워크는
배터리 파라미터 변화에 따른 가중치 공간의 변동성은 유지하면서 불필요한 노이즈는 제거하는 효과를 얻을 수 있다. 그러나 저순위 행렬 근사 과정에서
생략된 하위 특이값들에 해당하는 미세 정보의 손실은 불가피하다. 만약 배터리의 동적 거동이 선택된 순위보다 훨씬 더 복잡한 비선형성을 가질 경우,
모델의 표현력이 제한될 수 있는 한계가 존재한다. 따라서 정확도와 효율성 사이의 상관관계를 고려하여 적절한 수위의 설정이 요구된다.
3.3 Manifold Network and Forward Propagation
매니폴드 네트워크 $g_{\theta_g}$는 그림 4의 전체 프레임워크에서 나타내듯이, 좌표 인코더로부터의 인코딩된 표현 식 (9)의 $h_{coord}$와 식 (13)의 하이퍼네트워크로부터의 파라미터 의존적 표현 $h_{param}$을 통합하여 최종 예측을 생성한다. 네트워크를 통한 순전파 과정은 아래의 식 (17)부터 (21)까지의 수식에 나타냈다.
식 (17)의 $\mathcal{M}_{LR}$은 그림 4의 매니폴더 네트워크 내부에 나타낸 SVD 기반 저순위 행렬 곱셀 블록을 의미한다. 여기서 $U^l$, $V^l$은 각 계층의 기저 행렬을, $\alpha_l$은
하이퍼네트워크로부터 전달받은 특이값 대각 행렬을 나타내며, $b_l$은 $l$번째 계층의 학습 가능한 편향 벡터이다. 식 (17)과 (18)의 연산 과정은 그림 4에 나타낸 $l$번째 은닉층, $h^l$의 내부 동작을 기술한다. 구체적으로 $z^l$은 계층의 선형 변환 결과를, $x^l$은 활성화 함수 $\sigma$를
거쳐 다음 계층으로 전달되는 상태 값을 나타낸다. 식 (18)의 $w_0$은 계층 간 신호 전달을 조절하는 가중치 파라미터를 나타낸다. 식 (19)와 (20)은 네트워크의 입력 및 계층적 구성을 정의한다. 식 (19)의 $FC_j$는 $j$번째 저순위 블록 연산을, $D_g$는 매니폴드 네트워크의 마지막 계층의 인덱스를 의미한다. 식 (20)에서는 $h_{coord}$과 $h_{param}$을 연결하여 $h_{concat}$을 형성한다. 최종적으로 식 (21)에서 최종 은닉 표현 $x^{D_g}$를 출력층의 가중치 $W_{out}$ 및 편향 $b_{out}$을 통해 배터리 RC 전압 $V_1(t; SOC_0)$으로
맵핑하여 출력한다. 이 통합된 프레임워크는 네트워크가 초기 조건 $SOC_0$에 의해 인코딩된 물리적 제약과 시간적 SOC 궤적에 의해 포착된 진화하는
데이터 동향을 효과적으로 활용할 수 있도록 하여, 다양한 배터리 작동 조건에 걸쳐 강인하고 정확한 예측 결과를 도출한다.
3.4 Loss Function for Synergistic Learning
제안된 PPINN은 데이터 충실도와 물리적 일관성을 모두 강제하는 다중 목적 손실 함수를 최소화함으로써 훈련된다. 이는 식 (3)에서 언급한 물리적 잔차 $f := \mathcal{N}[u(t,x)]$를 최소화하는 것을 목표로 하는 PINN의 핵심 원칙을 따른다. 이 원칙을
배터리 시스템에 적용하기 위해, 그림 2에서 보인 1차 RC 등가 회로 모델에서 파생된 지배 방정식을 사용하여 일반 미분 연산자 $\mathcal{N}[\cdot]$를 구체화한다. 이 모델의
전기화학적 거동은 RC 전압 $V_1(t)$에 대한 미분 방정식으로 기술된다. 따라서 특정 미분 연산자 $\mathcal{N}[t, V_1(t)]$는
다음과 같이 정의하였다.
기본 물리 법칙은 이 연산자가 0이 될 것을 요구하며, 이는 네트워크가 학습을 통해 최소화해야 할 물리 기반 잔차를 형성한다. 추가적으로, 모델은
RC 전압이 작동 시작 시점($t=0$)에 0이어야 한다는 초기 조건에 의해 제약된다. 이러한 제약 조건들은 다음과 같이 표현된다.
식 (22)~(24)의 물리 잔차 항은 물리적 정규화로 기능하여, 데이터의 노이즈나 우연한 상관관계에 대한 모델의 과적합을 방지한다. 이는 옴의 법칙과 같은 전기화학적
제약을 강제함으로써, 미지의 작동 조건에서도 해가 물리적 일관성을 유지하도록 유도하여 SOC 추정의 정확도와 강건성을 보장한다.
전체 손실 함수($\mathcal{L}_{total}$)는 SALB(self-adaptive loss balancing)로 알려진 불확실성 기반의
적응형 가중치 기법을 사용하여 여러 목적 함수들을 시너지 있게 결합하며, 이는 수동 하이퍼파라미터 튜닝의 필요성을 제거한다 [24]. 전체 손실은 다음과 같이 공식화할 수 있다.
식 (25)의 학습 가능한 로그-분산(log-variance) 파라미터 $\lambda_i$는 훈련 과정 동안 각 손실 구성 요소의 상대적 크기와 불확실성에
기초하여 자동으로 조정된다. 이는 최적화 과정이 더 신뢰할 수 있는 손실 요소에 집중하도록 하면서 정규화를 유지할 수 있게 한다. 전체 손실은 시너지
효과를 내는 네 가지 개별 구성 요소 $\mathcal{L}_i$로 이루어진다.
식 (26)의 LSTM 손실($\mathcal{L}_{LSTM}$)은 LSTM의 시간적 SOC 예측, $\widehat{SOC}_j$과 실제 값, $SOC_{target,j}$
간의 일관성을 강제하여 모델을 관측된 데이터 동향에 고정시킨다. 식 (27)의 물리 손실($\mathcal{L}_{physics}$)는 식 (22)의 PDE 잔차를 최소화하여, 솔루션이 배터리 모델의 기본 전기화학적 법칙을 준수하도록 강제한다. 물리 손실에 포함된 편미분 항($\frac{\partial
V_1}{\partial t}$)은 네트워크의 최종 출력을 시간에 대해 미분한 그래디언트를 나타내며, 자동 미분을 통해 식 (30)과 같이 계산된다. 식 (28)의 초기 손실($\mathcal{L}_{fir}$)은 식 (24)의 경계 제약 조건을 강제하여 솔루션이 $t=0$에서 물리적으로 유효한 상태에서 시작하도록 보장한다. 마지막으로, 식 (29)의 전압 회귀 손실($\mathcal{L}_{reg}$)은 모델의 전체적인 출력, $V_{pred}$이 실제 측정된 단자 전압, $V_{measured}$과
일치하도록 보장하는 직접적인 경험적 데이터 피팅 항이다.