2025/03/12 2

실무에 쓰는 머신러닝 기초 1주차 (전처리)

목표데이터 전처리의 필요성과 핵심 방법불균형 데이터 문제 해결범주형 데이터 인코딩 기법피처 엔지니어링 기법실습 1. 데이터 전처리원시(raw) 데이터에서 불필요하거나 손실(noise)이 있는 부분을 처리하고 분석 목적에 맞는 형태로 만드는 과정 필요성모델 정확도 및 신뢰도 향상이상치나 결측치가 많은 상태로 학습하면 예측 성능이 떨어짐효율적인 데이터 분석과 모델 훈련을 위해 필수 제조업 사례센서가 간헐적으로 측정에 실패(결측값)센서 오작동으로 인해 극단적으로 큰 값이 기록(이상치)정상 제품과 불량 제품의 데이터 분포가 매우 다름(불균형) 금융 사례증권사나 은행에서 고객 정보가 유실되거나 특정 시점의 주가나 거래량 데이터가 취합되지 않은 경우(결측값)특정 종목에 대해 드물게 발생하는 급등라그 단일 대량 거래..

AI/머신러닝 2025.03.12

실무에 쓰는 머신러닝 기초 1주차 (머신러닝)

목표머신러닝의 개념과 데이터 분석에서의 역할을 이해머신러닝 모델링 프로세스의 각 단계 파악머신러닝, 딥러닝, AI의 관계 및 차이를 알기 1. 머신러닝인간의 개입을 최소한으로 하여 컴퓨터가 데이터를 학습해 패턴을 찾아내고, 새로운 데이터에 대해 예측이나 분류를 수행하는 기술 3대 요소데이터: 양질의 정보알고리즘: 문제 해결 위해 순서대로 처리하는 방법 또는 규칙컴퓨팅 파워: 컴퓨터가 얼마나 빠르고 많은 연산을 할 수 있는지 나타내는 능력치, GPU 머신러닝, AI, 딥러닝 관계인공지능: 사람의 지능적인 작업을 기계가 수행하도록 만드는 광범위한 개념머신러닝: AI 실현하기 위한 방법 중 하나데이터로부터 특징이나 규칙을 찾아내서 학습하는 것딥러닝: 머신러닝의 하위 분야사람의 뇌신경을 본떠 만든 인공신경망으로..

AI/머신러닝 2025.03.12