• 대한전기학회
Mobile QR Code QR CODE : The Transactions of the Korean Institute of Electrical Engineers
  • COPE
  • kcse
  • 한국과학기술단체총연합회
  • 한국학술지인용색인
  • Scopus
  • crossref
  • orcid

  1. (Dept. of Computer Science, Sangmyung University, Korea.)



Spectrogram, Machines, Abnormal, LSTM, Predictive Maintenance, CNN

1. 서 론

최근 과학기술의 발달로 4차 산업혁명에 연구가 가속화되면서 전 세계적으로 자동화, 인공지능, 빅데이터의 관심과 연구가 이루어지고 있다 (1). 이러한 기술들은 인간이 활동하고 있는 모든 분야에 스며들고 있으며 산업 현장에서도 빠르게 적용되고 있는 추세이다. 산업 현장에서의 자동화, 스마트 팩토리 기술은 스스로 작동하는 공정/제어/관리에 관한 것이며 IoT, AI, ML, 빅데이터, 5G 등의 첨단 기술로 구성되어있다 (2). 현재 공정과 스마트 팩토리와의 가장 큰 차이점은 단위 공정마다 자동화 및 최적화가 되어있어 공정 간의 유기적인 연계가 되어있지 않으며 센서로 받아온 데이터 처리 및 활용도가 크지 않아 전/후 공정에서 오류가 발생한다면 무슨 일이 발생했는지, 어느 기계에서 발생하였는지, 어떤 이유인지 알 수 없으며 이에 따른 유지보수 문제가 발생하게 된다 (3).

스마트 팩토리란 생산의 자동화도 중요하지만, 가장 중요한 것은 공정 스스로의 관리이다. 따라서 가장 중요한 것은 유지보수 개념이며 유지보수가 얼마나 빠르고 정확하게 이루어지는지가 핵심이 된다. 유지보수의 단계는 Reactive maintenance, Planned maintenance, Proactive maintenance, Predictive maintenance의 총 4단계로 구성되어 있다 (4). 이 중에서 Predictive maintenance의 비용 곡선의 값이 최적의 값을 나타내므로 예지 보전의 중요성이 더욱 대두되고 있다. 그리고 예지 보전 시스템을 구축하기 위해선 데이터 특성의 다양성을 만족하여 어떤 공정에서도 데이터만 있으면 예지 보전 시스템을 사용하는 것이 가능해야 하고, 정확도를 위해 질적 데이터를 수집하는 것이 중요하다 (5).

본 논문에서 사용하는 데이터는 소리 신호이다. 기존의 선행 연구에서 소리 신호를 스펙트로그램으로 바꾸어 CNN 모델로 구현한 사례가 있다. 그러나 현재 산업 현장에 있는 기계들은 가동 중 진동과 소리를 동반하며 기계가 비정상적으로 정지되거나 가동될 때의 진동과 소리가 차이가 발생하고 산업 현장에서 취득되는 데이터는 시계열 데이터이므로 현재 시점의 기준에서, 과거의 신호에 의한 시계열 간섭이 발생한다 (6). 따라서 이 부분을 개선하기 위해 소리 신호에서 추출할 수 있는 Feature 중 하나인 스펙트로그램 이미지를 사용하였다. 스펙트로그램은 시간, 주파수, 진폭의 3차원 데이터를 2차원 영상으로 시각화한 것이며 시간과 주파수에 따른 진폭의 값을 색으로 표현한 것이다. 소리 신호의 특징 벡터중 하나인 MFCC (7)의 값은 차이가 미미한 연속적인 값들의 연속이므로 스펙트로그램 이미지를 사용하여 시각화한 데이터를 학습 데이터로 사용한 기계의 이상 진단 시스템을 제안한다.

수집된 신호의 시계열 간섭 없이 정확하게 나오는 것이 중요하다. Integrated Electronics Piezo-Electric 센서는 앰프가 내장되어있어 전기 장애나 Noise에 강하다 (8)-(10). 따라서 이상 진동 시뮬레이터에서 신호를 수집할 때 Noise에 강한 IEPE 기반의 지향성 마이크를 사용하여 지정된 방향에서의 오는 소리 신호 외의 다른 소리는 감쇄된 신호를 수집하였으며 시뮬레이터의 가동 시간이 5초 이므로 수집한 데이터를 5초 간격의 스펙트로그램 이미지로 변환하는 시각화 과정을 거쳐 7901개의 timestep 샘플을 준비하였다. 또한 소리 신호의 스펙트로그램 이미지를 다룬 선행 연구에서의 학습 데이터의 수가 평균 1000개였음을 미루어보아 학습에 있어서의 충분한 데이터 수가 확보 되었음을 알 수 있다.

본 논문에서는 모델 구현에서 이미지 처리를 위해 Convolution 1D Layer를 사용하고 시계열 데이터 처리를 위한 Long Short Trem Memory 모델을 사용하여 스펙트로그램 이미지 기반 기계 이상 감지 모델을 제안하였으며 성능 비교를 위해 기존의 스펙트로그램 기반 Convolution Neural Networks 모델 (11), 다른 시계열 모델인 Gated Recurrent Unit (12)을 사용한 모델과의 비교를 진행하였다.

본 논문은 2장에서 이상 진단 모델 제안, 3장에서는 실험 및 결과, 4장에서 결론으로 구성된다.

2. 이상 진단 모델 제안

2.1 Convolution 1D Layer

CNN은 심층 신경망이다. CNN은 영상 신호 처리에 강점을 보이는 모델이며 하나 이상의 Convolution Layer, Pooling Layer 및 Fully Connected Layer로 구성된다. 그림 1(CNN.)은 CNN이 입력 데이터를 처리하는 과정을 보여준다. CNN의 Convolution 구조는 Kernal과 같은 작업을 수행하여 영상 처리에 매우 효과적이다 (13). Convolution 연산을 통해 이미지와 Kernal을 다음 계층의 인자로 넘겨주고 이미지 처리 과정의 상황에 따라 Pooling Layer와 Zero-Padding Layer를 추가하며 Feature에 대한 학습률을 높이는 구조를 만들어 간다. Feature를 이용하여 학습을 진행하는 구조 뒤에는 이전의 계층을 거쳐 나온 결과로 Label을 분류하는 층을 만들어준다. Softmax나 sigmoid와 같은 활성 함수를 사용하여 Label값이나 값에 대한 확률값을 추론하며 모델이 마무리된다. 따라서 본 논문에서는 소리 신호의 스펙트로그램 이미지를 처리하기 위한 CNN의 Convolution Layer에 중점을 두어 사용하였다.

그림. 1. CNN에서의 이미지 처리

Fig. 1. The process of CNN processing images

../../Resources/kiee/KIEE.2022.71.9.1274/fig1.png

2.2 RNN-LSTM

RNN은 순환 신경망이다. 입력과 출력이 Sequence 단위로 처리되는 순차 모델이며 시계열 데이터 처리에 강점을 보이는 모델이다. CNN과의 가장 큰 차이점은 정보가 전달되는 방향이다. CNN의 경우 결과값이 Input Layer에서 Output Layer로의 단방향으로 진행되지만, RNN의 경우 Output Layer로의 진행은 물론이고 오차가 역전파의 형태로 진행된다. RNN의 Hidden Layer는 이전 상태의 값과 현재 상태의 연산 값을 활성함수인 tanh를 거쳐 출력값을 도출한다. 다만 RNN에서의 오차 역전파로 인해 기억되어야 할 이전 상태의 단계가 현재 상태와 다를 경우 역전파가 크게 감소하는 Gradient Vanishing 문제가 존재한다. 이를 극복하기 위해 LSTM이 고안되었다 (14).

LSTM은 RNN의 오차 역전파로 인한 Gradient Vanishing 문제를 극복하기위해 고안된 모델로 RNN의 Hidden State에 Cell State를 추가한 구조이다. Cell State는 기억 및 망각의 역할을 하며 forget gate에서는 이전 상태와 현재 값을 받아 sigmoid 활성 함수를 취해주며 sigmoid가 1이면 온전히 기억하는 형태, 0이면 모두 망각 하는 형태를 취한다. Cell State의 input gate에서는 현재 정보를 기억하기 위한 것이며 역전파는 각각의 활성 함수에 대한 Local Gradient와 역전된 Gradient를 곱하여 주는 구조이다. 따라서 본 논문에서는 시계열 데이터를 사용하므로 기울기 소실 문제에 강한 LSTM을 사용하였다.

2.3 개선된 모델 제안

본 논문에서 제안하는 모델은 Conv1D와 LSTM을 결합한 모델을 제안한다. 시뮬레이터를 이용해 취득한 데이터는 시계열 소리 데이터이다. 소리 신호의 특징 중 하나인 MFCC를 이용하여 LSTM에 넣어 구현 해 본 결과 학습의 결과가 유의미하게 나오지 않았다. 그 이유로 취득한 데이터는 시계열 데이터이기 때문에 시간의 흐름에 있어서 데이터의 값이 서로 간섭하기 때문이다. 간섭에 의해 소리 신호의 수치가 비교적 연속적인 값을 가지게 되므로 유의미한 학습 정확도를 얻기 위해 소리 신호의 다른 특징인 스펙트로그램을 사용하여 인식하기 어려운 신호의 작은 차이를 스펙트로그램의 컬러 맵으로 표현하여 학습 시켜 더욱 높은 정확도를 얻을 수 있었다. 그리고 시계열 데이터 처리를 위해 LSTM을 사용하였다. 마지막으로 Output Layer에서 Softmax 활성 함수를 적용하여 결과값에 대한 확률로 결과를 도출하여 주었으며 Convolution Layer와 LSTM Layer를 거칠 때 Batch 별 데이터 편향이 이루어질 수 있으므로 Batch Nomalization Layer (15)를 추가하여 데이터 편향을 방지해 주었다.

표 1은 본 논문에서 제안한 모델의 매개 변수의 값이다. 학습률을 1e+05로 설정하였으며 Batch size를 32로 설정 하였고 학습 횟수를 500회로 두었으며 최적화 함수로 Adam을 사용하여 학습을 진행하였다.

그림. 2. Conv 1D와 LSTM의 결합 모델 구조

Fig. 2. Model Architecture of Convolution Layer and RNN

../../Resources/kiee/KIEE.2022.71.9.1274/fig2.png

표 1. 학습에 사용된 매개변수

Table 1. Parameters used in learning

Parameter Values

Learning Rate

1e+05

Batch size

32

Epoch

500

Optimization Function

Adam(beta_1=0.9, beta_2=0.999)

3. 3. 실험 및 결과

3.1 데이터 구성

본 논문에서는 이상 진동 시뮬레이터에서 이상 진동이 발생 하였을 때의 소리 신호를 이용하여 기계의 이상 유무를 판단할 수 있는 모델을 제작하기 위한 실험을 진행하였다.

이상 진동 시뮬레이터에서 정상 가동과 이상 가동을 나타내기 위해 정상 가동의 상태에서 특정 주파수를 주어 이상 가동으로 구분 지었으며 시뮬레이터가 가동될 때의 소리 신호를 녹음하는 것으로 데이터를 취득하였다. 다만 소리는 Noise의 영향을 많이 받기 때문에 소음에 강한 IEPE 기반의 방향성을 가진 지향성 마이크를 사용하였다. 이상 진동을 발생시키지 않고 작동할 경우 Negative로, 특정 주파수를 주어 이상 진동 발생시 Positive로 분류 하였으며 소리의 샘플링 비율은 16000으로 설정하였다. 그리고 신경망을 통한 학습의 경우 데이터의 형식이 동일해야 하므로 timestep을 5초로 설정하여 데이터를 재구성 해주었다.(15) 그림 3은 이상 진동 시뮬레이터로 수집한 데이터의 파형을 나타내며, 그림 3.(1)은 Negative 데이터를 나타내며 일반적으로 값이 중앙에 있는 안정적인 파형임을 알 수 있고, 그림 3.(2)는 Positive 데이터를 나타내며 파형이 매우 불규칙하고 변화폭이 큰 것을 알 수 있다.

그림. 3. 이상 진동 시뮬레이터로부터 취득한 데이터의 파형

Fig. 3. waveform of the data acquired by the abnormal vibration simulator

../../Resources/kiee/KIEE.2022.71.9.1274/fig3.png

데이터 수집과 전처리가 정상적으로 이루어졌는지 확인한 후, 소리 신호의 Feature 중 하나인 스펙트로그램 이미지를 사용하여 본 논문에서 제안한 모델을 이용하여 학습을 수행한다. 그림 4는 IEPE 지향성 마이크를 이용해 수집한 데이터의 스펙트로그램 이미지이며 가로축은 시간 정보를 세로축은 주파수 정보를 픽셀 별 color 이미지는 진폭 정보를 나타내고 있다.

그림. 4. IEPE기반의 지향성 마이크로부터 취득한 소리 신호의 스펙트로그램

Fig. 4. Spectrogram of sound signals by directional IEPE sensor

../../Resources/kiee/KIEE.2022.71.9.1274/fig4.png

Fig. 4. (1)은 이상 진동이 발생한 Positive 데이터이다. 시뮬레이터의 동작 시작과 끝부분은 이상 진동이 발생하지 않은 Negative 데이터와 유사함을 보이지만 시뮬레이터의 동작 중에는 저주파 부분의 컬러 맵이 Negative 데이터와 명확한 차이를 보이는 것을 알 수 있다.

Fig. 4. (2)는 이상 진동이 발생하지 않은 Negative 데이터이다. Negative 데이터는 전체적으로 White Noise가 저주파 부분에 깔려있음을 알 수 있고 역동적인 파형의 변화가 없이 안정적인 파형의 진행이 이루어짐을 알 수 있다.

3.2 학습 결과

본 논문에서는 기계가 정상적으로 작동할 때와 고장으로 인한 이상 진동이 발생하였을 때의 신호를 각각 약 510분, 150분가량 수집하였다.

Fig. 5는 본 논문에서 제안한 모델에 대한 학습 결과이다. 그림 5.(1)은 학습의 정확도를 나타내며 그림 5.(2)는 학습의 손실률을 나타냅니다. 학습의 정확도는 진동이나 발산이 아닌 1.0에 가까운 수치로 수렴하는 것이 가장 이상적인 학습이라고 할 수 있다. 본 논문에서 학습의 정확도는 약 98%에 수렴하는 것을 알 수 있다. 또한 학습의 손실률은 학습 도중 손실률이 증가하거나 일정 수치 이하로 내려가지 않으면 Underfitting이나 Overfitting의 문제가 발생하여 학습이 제대로 이루어지지 않음을 알 수 있다. 본 논문에서의 학습의 손실률은 0.04로 수렴되는 것으로 보아 의미있는 학습이 이루저 졌음을 알 수 있다.

그림. 5. 학습 결과

Fig. 5. The learning results

../../Resources/kiee/KIEE.2022.71.9.1274/fig5.png

학습에 사용된 데이터가 시계열 소리 신호이기 때문에 시간이 지남에 따라 신호 간의 간섭이 존재할 가능성이 있어서 학습된 모델의 테스트 과정을 통해 확인해보고 이상 진동 판별의 정확도를 알아보았다.

3.3 모델 검증

학습 모델의 검증 과정을 두 가지 방법으로 진행하였는데, 첫 번째는 준비된 테스트 셋을 학습된 모델에 적용하여 테스트 셋의 이상 진동을 판단 여부를 확인하는 것이고, 두 번째는 성능평가지표를 통해 판별 모델의 예측력을 검증하는 것이다.

Fig. 6은 Negative 테스트 셋의 스펙트로그램 이미지를 나타낸 것이다. Negative 테스트셋은 이상 진동이 발생하지 않았으므로 저주파 부분에서의 White Noise를 제외하고 특별한 주파수의 변화가 없음을 알 수 있다. 그림 7은 Positive 테스트 셋의 스펙트로그램 이미지를 나타낸 것이다. Positive 테스트 셋은 이상 진동이 계속 발생하였을 때 이상 진동의 판별이 잘 이루어짐을 알아보기 위한 테스트 셋이며 모든 timestep이 이상 진동으로 이루어져 있기 때문에 White Noise이외에도 특정 주파수에서 Negative와는 다른 연속적인 주파수의 검출이 컬러 맵의 형태로 이루어짐을 알 수 있다. 그림 8은 시계열 데이터의 이상 진동 판별 여부를 나타낸 로그이며, 왼쪽부터 Positive와 Negative 테스트 셋을 나타낸 것이다. 5초의 timestep을 기준으로 Positive와 Negative에 해당하는 라벨을 표시해 주었으며 Positive 테스트 셋과 Negative 테스트 셋을 정확히 분류해내는 모습을 보인다.

그림. 6. Negative 테스트 셋의 스펙트로그램

Fig. 6. Spectrogram of Negative testsets

../../Resources/kiee/KIEE.2022.71.9.1274/fig6.png

그림. 7. Positive 테스트 셋의 스펙트로그램

Fig. 7. Spectrogram of Positive testsets

../../Resources/kiee/KIEE.2022.71.9.1274/fig7.png

그림. 8. 시계열 데이터의 이상 진동 판별 로그

Fig. 8. Log for determining abnormal vibrations in time series data

../../Resources/kiee/KIEE.2022.71.9.1274/fig8.png

분류 모델의 성능평가지표는 Accuracy, Precision, Recall, F1 Score로 총 4가지이며 TP, TN, FP, FN의 값에 의해서 결정된다.

표 2는 제안한 이상 상태 검출 모델의 성능 평가 지표를 나타낸 것이며, Accuracy는 전체 예측 건수에서 정답을 맞힌 건수의 비율이다. 물론 Accuracy가 중요한 지표이고 제안한 모델의 Accuracy는 98.06%로 성능이 좋게 나왔다고 볼 수 있지만 불균형한 데이터 셋에서의 Accuracy를 평가 지표로 단독 사용한다면, 표적이 되는 데이터의 예측을 잘하지 못할 가능성이 있어 다른 분류 지표와 함께 사용해야 한다.

표 2. Negative 테스트셋의 성능 평가 지표

Table 2. Evaluation metrics for negative testsets

Precision

Recall

F1-Score

Support

0 (Negative)

0.99

1.00

0.99

389

1 (Positive)

0.00

0.00

0.00

4

Accuracy

0.99

393

Macro Avg

0.49

0.50

0.50

393

Weight Avg

0.987

0.99

0.98

393

Precision과 Recall은 표적이 되는 데이터를 실제로 맞췄는지, 실제 표적을 얼마나 잘 예측하였는지에 대한 나타내는 지표이다. 두 지표 모두 1이 가장 이상적인 값으로 나타나며 두 값 모두 균등하고 높은 값을 가지는 모델이 성능이 우수한 모델이라고 할 수 있다. 제안한 모델의 검증 결과로는 Negative testset에서 각각 0.99와 1이 나왔으며 Positive testset에서는 두 가지 값 모두 1이 나와 매우 우수한 성능의 모델이라고 할 수 있다.

F1 Score는 Recall과 Precision을 이용한 조화 평균 지표이다. 두 지표가 균등한 값을 가질 경우 F1 Score는 상대적으로 높은 값을 갖게 된다. 제안한 모델의 F1 Score는 0.99로 매우 높은 값을 가지는 것을 확인할 수 있었다. Table. 2는 Negatie 테스트 셋의 평가 지표를 표로 나타낸 것이며, Negative의 Label값을 0으로 설정하였고 0에 대한 Precision, Recall, F1 Score값이 매우 높은 것으로 보아 성능이 우수함을 알 수 있다

표 3은 본 논문에서 제안한 Conv1D와 LSTM 모델, 기존 제시된 분류 모델, Conv1D와 다른 시계열 모델인 GRU모델의 정확도 비교를 나타낸 표이다. Conv1D와 LSTM모델의 정확도는 98.08%, 다른 시계열 모델인 GRU를 사용한 모델은 97.42%, 기존의 제시된 방법을 사용한 분류 모델은 97.98%로 제안한 모델의 우수성을 알 수 있다.

표 3. 실험 결과

Table 3. Experiment Result

K.W.Kang et al [6]

Conv1D + GRU

Conv1D + LSTM (proposed)

Accuracy

97.98 %

97.42 %

98.08 %

그림. 9. 실험 결과

Fig. 9. Experiment Result

../../Resources/kiee/KIEE.2022.71.9.1274/fig9.png

4. 결 론

최근 4차 산업혁명과 하드웨어의 발전으로 인해 산업에서의 인공지능과 빅데이터 처리가 점점 더 요구되고 있다. 스마트 팩토리 산업에는 현재 많은 공정이 관심 및 진행형에 있으며 그 중에서도 예지 보전에 대한 개념이 더욱 주목받고 있다. 본 논문에서는 기계가 작동할 때 센서로부터 받아온 데이터를 분석하고 기계의 이상 여부를 판단하는 예지보전 시스템을 제안하였다.

제안된 모델에 대한 데이터 수집은 기계에서 비정상적인 작동에서의 소리를 시뮬레이터를 이용하여 수집하였으며 수집된 데이터의 feature 중 하나인 MFCC를 이용하여 학습을 진행하려 했지만 시간에 따른 소리의 간섭으로 인해 이상 상태와 정상 가동의 MFCC 값이 크게 차이가 나지 않아 학습 결과가 좋지 않았다. 때문에 시간, 주파수, 진폭의 정보가 모두 포함되어있는 스펙트로그램 이미지를 고안하게 되었고 데이터는 시계열을 기반으로 하기 때문에 모델 구성에 이미지 처리를 위한 Conv1D와 LSTM을 사용하게 되었다. 학습 결과는 98.06%의 아주 높은 정확도를 보여주며 학습 손실은 0.04의 아주 낮은 값으로 수렴하는 이상적인 결과를 얻을 수 있었다. 물론 간섭 효과를 완전히 제거할 수는 없었지만 테스트 셋으로 검증하였을 때, 이상 진동이 발생하지 않은 Negative 테스트 셋에 대해서는 389개의 timestep 중 단 4개의 timestep이 오판되었으며, 이상 진동이 발생한 Positive 테스트 셋에서는 419개의 모든 timestep을 이상 진동으로 정확히 판별하는 결과를 보여주었다.

제시된 판별 모델은 공정의 데이터가 존재하는 한, 어떠한 산업 현장에서도 사용이 가능하며 인공지능이나 빅데이터, ML 등의 기술을 정확히 모르는 사람들도 쉽게 사용이 가능하다. 향후 기계의 이상 여부 판단으로부터 나아가 데이터 추이 예측 등의 더욱 정확한 예지 보전을 위해 추가적인 데이터 처리 기술이나 연구, 학습 모델의 개발 등이 필요하다고 판단된다.

Acknowledgements

References

1 
Su-Jeong Yu, 2017, Fourth Industrial Revolution and Artificial Intelligence, Korea Multimedia Society, Vol. 21, No. 4, pp. 1-8DOI
2 
Song Ju Kim, 2022, Technology Research Trends of Smart Factory through the Keyword Network Analysis, Journal of the Korea Academia-Industrial cooperation Society, Vol. 23, No. 5, pp. 17-23DOI
3 
Byeong-Eob So, 2018, Study on built smart factory using sensors and virtual process design, pp. 22-23DOI
4 
Dae-hoon Kwon, Chang-heon Oh, 2021, Predictive maintenance technology for smart factory, Korean Information and Communication Association's Comprehensive Academi conference Paper Collection, Vol. 25, No. 1, pp. 172-174DOI
5 
, https://min23th.tistory.com/9DOI
6 
Kyung-Won Kang, Kyeong-Min Lee, 2020, CNN-based Automatic Machine Fault Diagnosis Method Using Spectrogram Images, Journal of the Convergence Signal Processing Society, Vol. 21, No. 3, pp. 121-126DOI
7 
Woo-Jin Jang, Ho-Won Yu, Seong-Hyeon Shin, Ho-chong Park, 2016, Audio Genre Classification based on Deep Learning using Spectrogram, Journal of the Korea Broadcasting Media Engineering Association's Academic Presentation Conf, pp. 90-91DOI
8 
Y. K. Oh, W. I. Lee, J. H. Cho, 2018, Development of Sensor Module to Acquire Vibration Signal in Machine Tool, Journal of the Korea Society of Precision Engineering's Academic Presentation, pp. 642-643DOI
9 
Tae-bong Lee, 2007, Condition monitoring and diagnostic techniques using noise signals, Korea Society of Noise and Vibration Engineering Classification, pp. 376-405DOI
10 
Se-won Oh, 2022, IoT-based machine anomaly detection AI technology, The Proceedings of the Korea Electromagnetic Engineering Society, Vol. 33, No. 3, pp. 20-25DOI
11 
Geonkyo Hong, Jeonghoon Choi, Dongjun Suh, 2020, A Study on the Design of Time Series Data-based Deep Learning Model for Detecting Machine Abnormalities, Proceedings of Symposium of the Korean Institute of communications and Information Sciences, pp. 887-888DOI
12 
Seong-Eun Mun, Su-Beom Jang, Jeong-Hyeo k Lee, Jong-Seok Lee, 2016, Technology Trends in Machine Learning and Deep Learning, The Korean Institute of Commucations and Information Sciences, Vol. 33, No. 10, pp. 49-56DOI
13 
, https://itwiki.kr/CNN.DOI
14 
, https://ratsgo.github.io/blog/tags/#rnnDOI
15 
Min su Kim, Jong Pil Yun, Poo Gyeon Park, 2019, Supervised and Unsupervised Learning Based Fault Detection Using Spectrogram, Journal of the Korean Electrical Society, pp. 1575-1576DOI

저자소개

김영준 (YoungJun Kim)
../../Resources/kiee/KIEE.2022.71.9.1274/au1.png

Kim Young-jun received a degree in engineering from Sangmyung University in 2022.

Since 2022, he has been studying for a master's degree at Sangmyung University.

His research interests are artificial intelligence, voice signal processing, emotion recognition, and synthesis.

이석필 (Seok-Pil Lee)
../../Resources/kiee/KIEE.2022.71.9.1274/au2.png

Seok-Pil Lee received BS and MS degrees in electrical engineering from Yonsei University, Seoul, Korea, in 1990 and 1992, respectively.

In 1997, he earned a PhD degree in electrical engineering also at Yonsei University.

From 1997 to 2002, he worked as a senior research staff at Daewoo Electronics, Seoul, Korea.

From 2002 to 2012, he worked as a head of digital media research center of Korea Electronics Technology Institute.

He worked also as a faculty member at Georgia Tech., Atlanta, USA from 2010 to 2011.

He is currently a professor at the dept. of electronic engineering, Sangmyung University.

His research interests include artificial intelligence, audio digital processing and multimedia searching.