목표데이터 전처리의 필요성과 핵심 방법불균형 데이터 문제 해결범주형 데이터 인코딩 기법피처 엔지니어링 기법실습 1. 데이터 전처리원시(raw) 데이터에서 불필요하거나 손실(noise)이 있는 부분을 처리하고 분석 목적에 맞는 형태로 만드는 과정 필요성모델 정확도 및 신뢰도 향상이상치나 결측치가 많은 상태로 학습하면 예측 성능이 떨어짐효율적인 데이터 분석과 모델 훈련을 위해 필수 제조업 사례센서가 간헐적으로 측정에 실패(결측값)센서 오작동으로 인해 극단적으로 큰 값이 기록(이상치)정상 제품과 불량 제품의 데이터 분포가 매우 다름(불균형) 금융 사례증권사나 은행에서 고객 정보가 유실되거나 특정 시점의 주가나 거래량 데이터가 취합되지 않은 경우(결측값)특정 종목에 대해 드물게 발생하는 급등라그 단일 대량 거래..