EDA & 데이터 분석 29

엔진 센서 데이터 기반 결함 예측 및 품질관리 분석(1)

엔진 센서 데이터 기반으로 정상(0)/불량(유형 1, 2, 3) 분류 변수MAP: 흡기 매니폴드 절대압, 대략 0~5 kPaTPS: 스로틀 개도율Force: 엔진에서 측정된 힘, 대략 0~400 NPower: 엔진에서 발휘되는 출력, 0~35 kWRPM: 엔진 회전수, 대략 1000~4000 RPMConsumption L/H: 시간단 연료 소묘율, 0~10 I/hConsumption L/100km: 주행거리당 연료 소비랑Speed: 차량 속도CO: 배기가스 중 일산화탄소 비율HC: 배기가스 중 탄화수소 농도CO2: 배기가스 중 이산화탄소 비율O2: 배기가스 중 산소 비율Lambda: 공기-연료비 이론치에 대한 실제값의 비율AFR: 실제 공기-연료비Fault: 엔진 결함 상태기본 정보 확인결함 유형(1, ..

태블로 과제

일자별 생장현황 ➡️ 막대 그래프 일자별 에너지 사용량 ➡️ 트리 맵 일자별 에너지 사용량 대비 열매수 ➡️ 시계열 그래프 일자별 총 생산량 ➡️ 지도 대시보드 통합 데이터 분석가 채용 공고를 볼 때 우대 사항에 Tableau 사용 경험이 많이 써있어서 사용해보고 싶었는데 그동안 python을 이용해 해왔던 시각화를 drag and drop으로 하는 것이 쉬워보였지만 생각보다 결과를 뽑아내는 것이 어려웠고 평소에는 정해진 것을 해결하는 방식으로 문제 풀이를 해왔기 때문에 어떤 데이터를 이용해 어떠한 결과를 뽑아낼지 생각을 하는 것이 힘들었다.

실습으로 배우는 태블로 4주차 - 4 (실무 대시보드 활용)

학습 목표실무에서 활용하는 대시보드 종류와 지속적으로 대시보드 운영할 수 있는 방법실무 대시보드 종류 매출 대시보드Action: OKR 체크, 매출 현황과 매출 증감 원인 파악프로덕트 대시보드Action: AARRR, 퍼널 분석, 코호트 분석마케팅 프로모셔 대시보드Action: 캠페인이나 쿠폰의 ROI 측정, 시즌별 프로모션별 성과 비교실험 대시보드Action: 실험 메트릭(CVR, CTR 등) 비교, 실험군과 대조군 비교, 실험 세그먼트별 사후 분석머신러닝 모델 모니터링 대시보드Action: 모델 A와 B의 성능 비교 및 모니터링, 이상 탐지 모니터링 Discover | Tableau PublicExplore stunning data visualizations and the talented commun..

실습으로 배우는 태블로 4주차 - 3 (대시보드 만들기)

학습 목표비즈니스 대시보드 결과물 생성[실습] 비즈니스 대시보드 만들기아래 대시보드 요구사항을 참고해 KPI 대시보드 생성문제: 경영진 요청 업무 - 2023년 KPI 지표 트렌드가 궁금, 매출 대시보드 작업 요청요구사항비즈니스 시나리오: 이커머스 Superstore는 다양한 상품을 판매하는 온라인 상점입니다. 고객은 전 세계에서 온라인으로 제품을 주문하고 배송받을 수 있어요. 회사는 여러 카테고리와 지역에서 다양한 제품을 제공하고 있어요.비즈니스 목표: Superstore의 2023년 매출은 전년(2022) 대비 n% 증가를 목표로 합니다.대시보드 목적: 매출의 트렌드와 매출에 영향을 미치는 주요 요인을 파악하고 싶습니다.대시보드 뷰어: 경영진 및 전사 지표 설정: 주요 지표를 최소 4가지 선정ex) ..

실습으로 배우는 태블로 4주차 - 2 (대시보드 설계와 구성)

학습 목표대시보드의 목적 및 지표를 설정하고, 대시보드 전체 설계 프로세스 학습대시보드 구축 프로세스대시보드 뷰어 및 목적 선정: 누가 보는 대시보드인지문제 정의: 어떤 목적으로 쓰는 대시보드인지필요한 데이터 선정 및 데이터 마트 구축: 어떤 데이터가 필요할지(매출 데이터, 고객 데이터)지표 선정: 어떤 지표를 선정해야할지스케치: 어떻게 대시보드 레이아웃을 구성할지 & 색상으로 강조시각화: 어떤 그래프를 활용할지대시보드 생성액션: 대시보드에서 어떤 의사결정과 액션을 수립할 수 있을지완성된 대시보드 게시 또는 대시보드팀 뷰어 권한 부여지표 정의 및 선정(가장 중요한 부분) 비즈니스 별 지표 선정산업과 주요 비즈니스 모델에 따라 자주 발생하는 문제와 핵심 지표가 달라짐 메트릭 하이라키중요한 문제를 Level..

실습으로 배우는 태블로 4주차 - 1 (계산식 활용하기)

학습 목표Tableau의 작동 원리와 LOD 계산식을 이론/실습으로 학습실습 데이터 Superstore: Tableau 내장 데이터4개년 커머스 데이터Order ID:  상품 주문 고유 아이디(primary key)Order Date: 상품 주문 날짜Ship Date: 배송 날짜Ship Mode: 배송 유형First ClassSame DaySecond ClassStandard ClassCustomer ID: 고객 아이디Category: 상위 카테고리SubCategory: 하위 카테고리Sales: 판매량Discount: 할인율Profit: 순이익텍스트 테이블 데이터 형태SQL, Python 에서 사용하는 데이터 프레임과 비슷하게 행과 열로 구성(피벗 테이블)테이블 구조화 형식에는 대표적으로 wide for..

실습으로 배우는 태블로 3주차(데이터 시각화, 선그래프, 막대그래프, 맵차트, 파이차트, 트리맵차트)

학습 목표Tableau 활용해 다양한 그래프 시각화이론 & 실습데이터 시각화데이터를 그래프 형식으로 나타내어 직관적으로 이해하기 쉽게 만듦데이터의 추세, 분포, 상관 관계 등을 시각적으로 표현 차트 고르는 방법비교, 관계, 분포, 구성 & 데이터의 형태에 따라 구분 Tableau 차트 소개표현 방식: Tableau 오른쪽 화면의 표현 방식 기능은 데이터에 적합한 대표적으로 24개의 그래프를 활용종류: 텍스트 테이블, 히트맵, 맵 차트, 파이 차트, 막대 차트, 트리맵, 라인 차트, 영역 차트, 분산형 차트, 박스 플랏 데이터 시각화의 장점데이터를 빠르게 이해하고 의사결정 가능협업할 때, 효과적인 커뮤니케이션 가능직관적인 데이터의 이해를 통해 인사이트 도출 가능 실습 데이터 소개listingsId: 고유 ..

실습으로 배우는 태블로 2주차(Tableau 설명, 실습)

학습 목표Tableau 실습 환경 준비하고 기본 구성 파악Tableau 소개 구조Tableau Desktop: 컴퓨터에서 로컬로 강력한 계산과 뷰, 대시보드를 작성Tableau Prep Builder: Tableau Desktop에 필요한 데이터 전처리 역할Tableau Server: 온프레미스 서버를 사용해 대스보드를 공유하고 협업 역할Tableau Desktop: Tableau Desktop에서 데이터를 시각화하는 역할Tableau Cloud(Tableau Online): Tableau Server가 SaaS 버전으로 제공되는 형태Tableau Server: Tableau Server를 통해 게시 및 배포 사용유로 툴이기에 보유한 라이센스에 따라 대시보드 업무 및 접근 권한이 다름creator: 전체..

통계학 6주차[가설검정의 주의점]

목표가설검정의 다양한 주의점 이해주의점들 참고하여 가설검정 진행6.1 재현 가능성: 우연히 결과가 나오는 것이 아닌, 항상 일관된 결과가 나오는지 확인해야 함동일한 연구나 실험 반복했을 때 일관된 결과가 나오는지 여부연구의 신뢰성을 높이는 중요한 요소최근 p 값에 대한 논쟁이 두드러지고 있음(p값 사용하지 않아야 된다 vs 유의수준을 0.05에서 변경해야 한다)가설검정 원리상의 문제나 가설검정의 잘못된 사용이 낮은 재현성으로 이어진다는 문제 발생최근 논문을 다시 재현해 실험을 해보는데 똑같은 결과가 안나오는 사례가 많아 재현성 위기가 문제되고 있음중요성결과가 재현되지 않는다면 해당 가설의 신뢰도가 떨어짐원인실험 조건을 동일하게 조성하기가 어려움완전 동일하게 똑같은 실험을 수행하는 것이 쉽지 않음가설검정 ..