최종 프로젝트 분석 5
회의 전
전처리
- 유지보수 예측 시간인 predicted_remaining_life가 음수인 값
- 위험 확률인 downtime_risk가 음수이거나 1을 넘어가는 값
- 해당하는 행을 제거
상관관계 분석
- machine status는 2인 경우에 모두 maintenance_required가 1이라서 상관계수 높다고 생각함
그래서 anomaly_flag를 선택해 분석 시작
- anomaly_flag로 분리해 박스 플롯으로 시각화
확인을 위해 0인 경우 온도로 내림차순 정렬해 상위 50개의 데이터를 확인
또한 하위 50개의 데이터도 확인
유지보수 필요한 경우에 대해 failure type으로 구분해 박스플롯 시각화
회의 후
정상인 경우의 Normal 타입과 이상인 경우의 Normal 타입 비교
박스플롯이 아닌 히스트플롯으로 시각화
- 유지보수 필요한 데이터에서 정상 범위 안에 있는 데이터가 신경 쓰여 anomaly_flag도 같이 찍어봄
그래서 그룹을 anomaly_flag, maintenance_required에 따라 3개의 그룹으로 나눔
정상 범위 데이터를 더 잘 구별해내기 위해 분석
- 정상 데이터의 온도와 진동의 최댓값 구함 ➡️ 90, 80
- f_1_m_1 데이터에서 온도와 진동을 90, 80으로 기준으로 두고 분석
먼저 온도가 90이하인 경우의 진동 확인
그 다음으로 진동이 80이하인 경우의 온도 확인
그래서 flag 0이고 main 1인 것도 이렇게 구별해낼 수 있을지 확인해봄
혹시 불량 상태인 machine status가 2의 경우 때문에 안 되는 것이라고 생각
- 기계 상태 2를 제거
그래서 flag 0이고 main 1인 데이터와 flag 0이고 main 0인 데이터가 유사할 것이라고 생각
- 검정을 통해 확인