프로젝트/IoT

최종 프로젝트 분석 5

edcrfv458 2025. 4. 8. 14:54

회의 전

 

전처리

  • 유지보수 예측 시간인 predicted_remaining_life가 음수인 값
  • 위험 확률인 downtime_risk가 음수이거나 1을 넘어가는 값
    • 해당하는 행을 제거

 

상관관계 분석

  • machine status는 2인 경우에 모두 maintenance_required가 1이라서 상관계수 높다고 생각함

 

그래서 anomaly_flag를 선택해 분석 시작

  • anomaly_flag로 분리해 박스 플롯으로 시각화

0인 경우에도 이상치가 발견됨

 

확인을 위해 0인 경우 온도로 내림차순 정렬해 상위 50개의 데이터를 확인

전부다 기계 상태 2(불량)

 

또한 하위 50개의 데이터도 확인

failure type에서 Overheating이 나타남

 

유지보수 필요없는 경우는 전부 Normal

 

유지보수 필요한 경우는 골고루 있음

 

유지보수 필요한 경우에 대해 failure type으로 구분해 박스플롯 시각화

Normal이 다른 type에 비해 중앙값이 높음

 


회의 후

 

정상인 경우의 Normal 타입과 이상인 경우의 Normal 타입 비교

두 경우 모두 아래쪽에서 이상치 식별

 

박스플롯이 아닌 히스트플롯으로 시각화

  • 유지보수 필요한 데이터에서 정상 범위 안에 있는 데이터가 신경 쓰여 anomaly_flag도 같이 찍어봄

flag 0인데 유지보수 필요한 경우 존재

 

그래서 그룹을 anomaly_flag, maintenance_required에 따라 3개의 그룹으로 나눔

정상 범위에 있는 데이터의 수가 줄었음

 

정상 범위 데이터를 더 잘 구별해내기 위해 분석

  • 정상 데이터의 온도와 진동의 최댓값 구함 ➡️ 90, 80
  • f_1_m_1 데이터에서 온도와 진동을 90, 80으로 기준으로 두고 분석

 

먼저 온도가 90이하인 경우의 진동 확인

구별이 됨

 

그 다음으로 진동이 80이하인 경우의 온도 확인

여기도 구별이 됨

 

그래서 flag 0이고 main 1인 것도 이렇게 구별해낼 수 있을지 확인해봄

그렇게 나타나지 않음

 

혹시 불량 상태인 machine status가 2의 경우 때문에 안 되는 것이라고 생각

  • 기계 상태 2를 제거

그렇게 나타나지 않음

 

그래서 flag 0이고 main 1인 데이터와 flag 0이고 main 0인 데이터가 유사할 것이라고 생각

  • 검정을 통해 확인

humidity에서 유의한 차이가 있다는 결과

 

박스플롯

 

바이올린플롯