2.1 데이터 통합 및 지표 정의
본 연구에서는 리튬이온 배터리의 정밀한 열 위험 평가를 수행하기 위해, NREL의 Battery Failure Databank[8]를 비롯한 다수의 공개 실험 데이터 세트를 통합하여 대규모 분석 구조를 구축하였다[8]
[9]
[11].
구체적으로, 300여 건에 달하는 배터리 열폭주 및 가혹 시험(ARC, Nail Penetration 등) 결과로부터 총 발열량과 질량 손실 데이터를
확보하였으며, 이를 기반으로 극한 상황에서의 비선형적 발열 곡선과 질량 감소율 거동을 정밀하게 모형화하였다 [8]. 아울러, 배터리 노화에 따른 위험성을 반영하기 위해 NASA Prognostics Center of Excellence(PCoE)의 24개 셀에
대한 장기 열화 사이클 데이터를 심층 분석하였다. 본 데이터 세트는 단순한 수명 데이터가 아니라, 각 셀마다 수천 회의 충·방전 사이클에 걸쳐 전압,
전류, 온도 및 임피던스 변화를 초 단위의 고해상도(high-resolution)로 기록한 방대한 시계열 데이터를 포함한다. 이러한 고밀도 데이터(high-density
Data) 분석을 통해, 정상 운용 조건에서 축적되는 성능 열화 특성과 내부저항 증가가 열적 안정성에 미치는 미세한 영향까지 모델에 정밀하게 반영하였다[9]
[10]
[11]. 이렇게 다양한 출처의 데이터를 전처리하여 단위와 형식을 통일한 뒤 지표 간 일관된 비교를 위해 모든 지표값을 최소-최대 정규화(min-max scaling)하여
0~1 범위의 무차원 값으로 변환하였다[12]. 이러한 단순 정규화 방식은 이종 데이터 세트 간의 실험 조건(ARC, Nail Penetration 등) 및 배터리 용량 차이에 따른 절대적 에너지
크기의 변동성을 완전히 반영하지 못한다는 한계가 존재한다. 그럼에도 불구하고, 본 연구는 다양한 양극 소재(LCO, LFP, NCA) 및 운용 조건에
범용적으로 적용할 수 있는 '위험 판단 구조'를 구축하는 데 목적이 있으므로 개별 물리량의 보정보다는 위험 발달의 '상대적 경향성' 표준화에 집중하였다.
특히, 이러한 데이터 통합 과정에서 발생하는 불확실성을 상쇄하기 위해 본 연구에서는 몬테카를로 시뮬레이션을 통한 확률론적 위험 분석을 수행하였으며,
분석 시 최악의 시나리오를 가정한 보수적 임계값을 적용하였다.
표 1. 본 연구에 적용된 데이터 세트 메타데이터 및 전처리·정규화 범위 요약
Table 1. Summary of dataset meta-data and p reprocessing/ normalization scope applied
in this study
|
구분
|
메타데이터 항목
|
본 논문 적용 내용
|
|
데이터 세트
|
데이터 세트 명칭 및 출처
|
NREL Battery Failure Databank(BFD) Sandia 상용 18650 셀 성능 데이터 NASA Ames PCoE Li-ion
Battery Aging Dataset
|
|
참고문헌
|
[8], [9], [10], [11]
|
|
셀 사양
|
셀 형식
|
원통형 셀(18650, 21700)
|
|
정격 용량
|
약 1.1–4.8 Ah
|
|
화학 조성
|
LCO, LFP, NCA
|
|
시험 조건
|
시험 유형
|
열폭주(thermal runaway) 시험(예: ARC 등) nail penetration 시험 정상 운용 및 장기 열화(aging) 사이클 시험
|
|
시험 모드
|
열적·기계적 가혹(abuse) 시험 및 정상 운용 조건
|
|
시험 환경
|
실험실 대기 환경 및 환경 챔버 제어 조건
|
|
계측 정보
|
측정 항목
|
온도, 질량 변화, 전압, 전류(필수) 임피던스(EIS, 해당 데이터 세트 제공 시)
|
|
센서/장비 구성
|
셀 표면 열전대, 질량 측정 장치(데이터 세트 제공 범위 내) 전압/전류 계측 및(해당 시) EIS 계측
|
|
시간 해상도
|
샘플링 주기
|
데이터 세트별 약 0.1–10 Hz
|
|
시간 기준
|
시험 개시 시점을 기준으로 시간 축 정렬(리샘플링/보간)
|
|
전처리
|
단위 통일
|
물리량을 SI 단위 기준으로 변환(단위 일치)
|
|
시간 축 정렬
|
공통 시간 축으로 리샘플링(필요시 선형 보간 적용)
|
|
결측치 처리
|
결측 구간 제거 또는 보간 처리(데이터 품질 기준 적용)
|
|
이상치 처리
|
사분위 범위(IQR) 기준으로 제거 또는 클리핑
|
|
정규화·보정
|
데이터 세트 내부 정규화
|
각 데이터 세트 내 min–max 정규화 적용(0–1 무차원화)
|
|
데이터 세트 간 보정
|
데이터 세트 내부 정규화 후 기준 조건으로 보정하는 2-step scaling 적용
|
|
활용 목적
|
메타데이터 활용
|
SHR 및 MLR 지표 산정, 데이터 세트 간 비교 가능성 및 재현성 확보
|
본 연구에서 제안하는 위험 판단 구조는 배터리의 이상 거동을 정량화하기 위해 다음 두 가지 핵심 지표를 도입하였다. 우선, 내부 발열의 가속도를 대변하는
SHR은 배터리 충전율(SoC)과 작동 전류 등 운용 조건에 따른 잠재적 열에너지의 크기를 나타낸다. 이는 현재 상태에서 방출할 수 있는 열에너지가
과거 열폭주 시험의 최악 조건(worst-case) 대비 어느 정도인지를 비율로 환산한 값이다. SHR이 0에 수렴할수록 전기화학적으로 안전한 상태를,
1에 근접할수록 임계 수준의 에너지가 축적된 위험 상태를 의미한다. 여기에는 배터리 노화(Aging)로 인한 내부저항 증가와 이에 따른 자체 발열
상승분도 반영하여, 열화된 배터리의 잠재적 위험도까지 포괄하도록 설계하였다.
다음으로, 본 연구에서 도입한 MLR은 열폭주 시 발생하는 급격한 가스 벤팅 및 물질 분출 현상의 물리적 강도를 모사하기 위해 정의된 현상학적 모형화
지표(Phenomenological Modeling Index)이다[13]. 실제 시스템에서 실시간 가스 분출량을 직접 계측하는 것은 현실적으로 어렵기 때문에, 본 모델은 Sandia National Laboratories의
실험적 상관관계에 기초하여 계측할 수 있는 온도 변수로부터 열폭주 심각도를 역추산하도록 설계되었다[14]. MLR 값이 0에서 1로 전이되는 과정은 내부 온도가 임계점에 도달함에 따라 시스템이 열적 안정 상태에서 폭발적 분출 단계로 진입함을 나타내며,
이를 통해 측정 불가능한 벤팅 현상을 정량적 수치로 변환하여 해석에 활용하였다.
본 연구에서 사용한 두 지표의 계산 및 정규화 절차를 식 (1)~(4)에 나타내었다. 우선, 전기화학적 발열 잠재력(SHR)은 표준 발열식에 기반하여 다음과 같이 산출된다.
이때 $SHR_{raw}$는 관측된 최악(가혹/열폭주) 조건에서의 최대 발열률 $Q_{\ge n,max}$ 대비 비율로 정의한다.
열적 지표인 $MLR_{raw}$는 열폭주 시험에서 측정된 질량 곡선 $m(t)$로부터 질량 손실률을 계산하고 초기 질량 $m_0$로 무차원 화한다.
두 지표는 화학/형상별 데이터 세트에서의 최소-최대 범위를 사용하여 0~1 범위로 정규화(min-max scaling)한다.
여기서 $(\cdot)_{min}$, $(\cdot)_{max}$는 정상 운전(열화 사이클) 및 가혹 시험(ARC, nail penetration
등) 공개 데이터에서 추출한 범위이며, 화학 조성/형상별로 재보정(calibration) 이 가능하도록 설계되었다.
표 1의 본 연구에 활용된 데이터 세트(NREL, Sandia, NASA)의 셀 사양, 실험 조건 및 전처리 기준을 구체적으로 정리하였다 [8]
[9]
[10]
[11]. 분석에 사용된 모든 데이터는 단위 통일 및 공통 시간 축 리샘플링(resampling) 과정을 거쳤으며, 이상치(Outlier)는 IQR(Interquartile
Range) 기준을 적용하여 제거하였다. 물론, 이러한 통계적 정규화 방식은 이종 실험 조건(ARC, Nail Penetration 등) 과 용량
차이에서 기인하는 절대적 에너지 방출량의 변동성을 완벽히 반영하기에는 한계가 있다.
그러나 본 연구는 다양한 양극 소재(LCO, LFP, NCA)를 아우르는 ‘범용 위험 판단 구조(Universal Risk Assessment Framework)’
구축을 핵심 목표로 한다. 배터리의 화학적 조성이나 용량이 다르더라도, 열폭주 전조 단계에서 나타나는 비선형적 온도 상승 기울기와 전압 강하의 시계열적
패턴(Time-series Pattern)은 유사한 파괴 메커니즘(Failure Mechanism)을 공유한다[15]. 따라서 본 연구에서는 개별 물리량의 절대적 정밀 보정보다는, 배터리 종류와 무관하게 관측되는 위험 발달의 ‘형상학적 특징’과 ‘상대적 경향성(Relative
Tendency)’을 표준화하여 이상 징후를 조기에 포착하는 데 주안점을 두었다[16].
아울러 본 연구는 1.1~4.8 Ah급 원통형 셀(18650, 21700) 데이터를 기반으로 수행되었으므로, 향후 파우치(Pouch)형이나 각형(Prismatic)
셀, 또는 팩 모듈 단위로 확장 적용하면 열-전기적 응답 특성(Thermal-electrical Response)의 차이를 고려하여 지표 범위 및
임계값을 재설정하는 보정 절차가 요구된다[17]. 이에 대한 후속 연구로서, 배터리의 용량($C$)과 에너지 밀도($E_d$) 및 화학적 조성을 고려한 물리 기반 가중치 인자(Physics-based
Weighting Factor)를 도입하여 지표의 정밀도를 고도화할 예정이다.
2.2 위험지수 산출 및 시나리오 기반 시뮬레이션
본 연구에서는 정규화된 두 지표를 가중합으로 결합하여 종합 위험지수(Risk Index)를 정의하였다[18].
기본 설정은 $\omega_{SHR} = \omega_{MLR} = 0.5$로 두 지표를 동등 가중하였다. $RI$값이 0에 가까울수록 전기·열 관점의
위험 수준이 낮으며, 1에 가까울수록 두 측면의 위험이 동시에 큰 상태를 의미한다. 다만 $RI$는 두 지표의 결합값이므로, 경보 판단 시에는 $RI$와
함께 $SHR/MLR$ 개별값도 병행하여 보수적으로 해석하였다. 특히, 다양한 운용 조건과 불확실성을 고려하기 위해 시나리오 기반 몬테카를로(Monte
Carlo) 시뮬레이션을 수행하였다. 각 시나리오는 운용 조건(예: $SoC, T_{amb}, C-rate$, 화학 계통) 을 기반으로 정의하고,
제조 편차 및 내부 단락 발생 여부와 같은 불확실 요인은 확률 변수로 모형화하였다. 각 시나리오에 대해 확률 변수들을 난수 표본을 뽑아 TRI-S
계산을 $N$회 반복 수행함으로써, 단일 예측값이 아닌 $RI$의 예측 분포를 도출하였다. 또한 몬테카를로 결과를 히스토그램 수준에서 끝내지 않고,
임계값 기반 조기경보 관점의 정량 지표를 제공하기 위해, 다음과 같이 임계값 초과확률을 정의하였다.
여기서 $RI_{caution}, RI_{danger}$는 조기경보(주의) 및 위험(위험 단계) 판정을 위한 기준 임계값이다. 마지막으로, 반복 횟수
증가에 따라 표본 평균과 분산, 그리고 $\hat{P}(RI \ge RI_{\tau})$가 안정화되는지(통계적 수렴)를 확인하기 위해 $N$을 단계적으로
증가시키며 수렴성을 점검하였다. 이에 따라 본 연구에서는 위험지수가 0이면 전기적·열적으로 완전히 안전한 상태, 1이면 두 측면에서 모두 극한의 위험
상태에 도달했음을 의미하도록 설정하였다. 다만 Risk Index 하나만으로 판단하면 한 지표가 높고 다른 지표가 낮은 상황에서 위험도가 중간값으로
나타날 수 있으므로 실제 경보 판단 시에는 SHR과 MLR 개별값도 함께 고려하여 잠재 위험을 보수적으로 해석하였다. 이러한 위험 평가 모델의 효용을
다양한 조건에서 검증하기 위해 시나리오 기반 몬테카를로 시뮬레이션을 수행하였다[7]
[19].
표 2. 몬테카를로 시뮬레이션 설정(불확실 변수/분포/반복 수/시드/수렴 기준)
Table 2. Monte Carlo setup: uncertain variables, distributions, iterations, seed,
and convergence criteria
|
구분
|
변수(기호)
|
분포/샘플링
|
본 연구 적용 값(기입)
|
|
불확실 변수
|
초기 충전 상태 ($SoC$)
|
균등분포 ($U[a,b]$)
|
($SoC \sim U[0,1]$) (즉, 0–100%)
|
|
주변 온도 ($T_{amb}$)
|
정규분포 ($N(\mu,\sigma)$) (필요시 절단)
|
($T_{amb} \sim N(25,10)$℃, 물리적 범위를 고려해 $[5,45]$℃로 절단(truncation)
|
|
충·방전율 ($C-rate$)
|
이산분포 ($Discrete\{\cdots\}$)
|
$C-rate \sim Discrete\{0.5, 1.0, 2.0\}$ (동일 확률)
|
|
제조 편차 (스케일 팩터) ($k_{mfg}$)
|
정규분포 (양수 제약)
|
$k_{mfg} \sim N(1, 0.03)$, $k_{mfg} > 0$
|
|
노화/열화 (내부저항 증가 팩터) ($k_{age}$)
|
이산 또는 연속분포
|
$k_{age} \sim Discrete\{1.0, 1.1, 1.2\}$ (노화에 따른 SHR 증가 반영 목적)
|
|
결함/내부 단락 발생 여부 ($Defect$)
|
베르누이 (Bernoulli(p))
|
$Defect \sim Bernoulli(p_{def})$, $p_{def} = 0.01$
|
|
시뮬레이션 설정
|
반복 횟수 ($N$)
|
시나리오당 반복 실행
|
시나리오당 $N=5000$회 (원고의 수천 회 반복을 정량화하여 명시)
|
|
난수 시드 ($seed$)
|
고정 시드 또는 기록
|
재현성을 위해 $seed = 2024$로 고정 (또는 사용 $seed$를 기록)
|
|
수렴성 ($convergence$)
|
배치(batch) 기반 안정화 확인
|
$N$을 1000단위로 증가시키며, (i) 평균 RI의 상대 변화율 < 1%, (ii) 95% 신뢰구간 폭 변화율 < 5%가 연속 2회 만족 시 수렴으로
판정
|
표 2는 시나리오 기반 몬테카를로 시뮬레이션에서 사용한 시나리오 입력(고정 변수)과 불확실 변수(확률 변수), 반복 횟수 및 수렴성 확인 항목을 구체적으로
정리한 것이다. 각 시나리오는 배터리의 초기 상태와 주변 환경조건을 조합하여 정의하며(예: SoC 수준, 주변 온도, 충·방전율, 배터리 화학 계통
등) 제조 편차나 내부 단락 발생 여부 같은 불확실 요인들은 확률 변수로 모형화하여 반영하였다. 설정된 시나리오에 대해 무작위 난수 샘플링(Random
Sampling)을 적용하여 불확실한 파라미터들을 변동시키며 TRI-S 시뮬레이션을 수천 회 반복 수행하였고, 이를 통해 해당 시나리오에서 발생할
수 있는 위험지수(Risk Index)의 확률 분포를 도출하였다. 이러한 확률론적 접근은 미래 위험도의 통계적 분포(평균, 분산, 95% 신뢰구간
등)를 추정함으로써, 단일 예측값(Point Estimation)만을 제시하는 결정론적 방식에 비해 극단적인 위험(Tail Risk) 발생 가능성까지
포괄하는 조기 경보를 가능하게 한다[19].
최종적으로 산출된 위험지수 및 개별 지표값에는 사전 정의된 임계값을 적용하여 배터리 상태를 단계별로 분류하였다. 본 연구에서는 열 위험도를 정상(Normal)–주의(Caution)–위험(Danger)의
3단계로 구분하였다. 구체적으로, 두 지표(SHR, MLR)가 모두 주의 임계값 미만일 경우를 '정상'으로 간주하며, 둘 중하나라도 기준을 초과할
경우 '주의' 단계의 경보를 발령하도록 설계하였다. 반면, SHR과 MLR 값이 모두 위험 임계값 이상으로 상승하면 즉각적인 제어가 요구되는 '위험'
상태로 판정한다. 이와 같은 다중 임계값 기반의 경보 체계는 단일 연속 값에 의존하는 방식보다 정밀한 위험 수준 평가가 가능할 뿐만 아니라, 전기적
이상과 열적 이상 중 주된 위험 요인을 식별(Identification)하는 데에도 효과적이다[18].
본 연구에서는 이러한 경보 체계의 객관성을 확보하기 위해, 주의/위험 임계값($\theta$)은 공개 데이터 기반의 분포-기준으로 다음과 같이 설정하였다.
우선, 주의 임계값($\theta^C$)은 정상 운전(열화 사이클) 데이터에서 각 지표의 상위 백분위수(예: 95th percentile)에 해당하는
값으로 정의하여 정상 상태에서 드물게 관측되는 이상 징후를 조기에 포착하도록 하였다. 반면, 위험 임계값($\theta^D$)은 열폭주/가혹 시험
데이터에서 열폭주 onset 직전 구간의 지표 분포를 기준으로 정의하여 즉각 제어가 필요한 수준을 나타내도록 하였다.
2.3 민감도 및 강건성 분석
본 절에서는 위험지수($RI$) 산출 과정에서 사용되는 가중치 및 임계값 설정이 결과 해석에 미치는 영향을 정량적으로 확인하기 위해 민감도 및 강건성
분석을 수행하였다.
우선, 가중치 민감도 분석에서는 가중치 $\omega_S$와 $\omega_M$ (단, $\omega_S + \omega_M = 1$)를 일정 범위(예:
0.3~0.7)에서 변화시키며 정상/주의/위험의 등급 분류 결과가 변화하는지 평가하였다. 이어서 임계값 민감도 분석에서는 주의 임계값 $\theta^C$와
위험 임계값 $\theta^D$를 기준값 대비 ±10% 범위에서 변화시켰을 때 나타나는 오경보율(false alarm rate) 및 미경보율(missed
alarm rate)의 변동 추이를 비교·분석하였다. 아울러, 입력 변수 민감도 분석을 통해 몬테카를로 샘플에 대해 $RI$와 입력 변수(SoC,
$T_{amb}$ C-rate, 노화 계수, 결함 확률) 간의 편상관 순위 계수(PRCC, Partial Rank Correlation Coefficient)를
산출하여 변수별 영향도 순위(impact ranking)를 도출하였다. 이를 통해 임계값 및 가중치 선정이 결론에 미치는 영향을 파악하고, 위험지수
분산(Variance)을 주도하는 운용 변수를 정량적으로 규명하였다.
한편, 몬테카를로 기반 확률 추정의 신뢰성을 담보하기 위해 시뮬레이션 반복 횟수를 증가시키며 위험지수의 평균과 분산이 안정화되는지를 확인함으로써 수치적
수렴성(Numerical Convergence)을 검증하였다. 해당 수렴 결과는 부록(Appendix 표 A1, 그림 A1)에 상세히 제시하였다.