데이터전처리 4

데이터 전처리 & 시각화 4주차(시각화)

사례바다오염의 주범은 바다쓰레기바다쓰레기 줄이기 위해 빨대 사용금지가 얼마나 효과있을까실제 데이터 살펴보면 전세계 바다 쓰레기의 0.03%가 플라스틱 빨대로 인한 것이며, 가장 많이 문제가 되고 있는 것은 46%를 차지하고 있는 어망실제 바다 쓰레기의 약 50%가 어업활동으로 인해 발생했다는 사실을 바탕으로 어떤 의사결정이 가능할까효율/효과 측면에서 우리는 어업활동에서 발생하는 바다쓰레기를 줄이는 방안을 모색해야 한다고 분석 결과 전달 가능어쩌면, 종이빨대를 만드는 예산을 어업활동에서 쓰레기가 발생하지 않도록 개선시키는 것에 활용하는 것도 제안 가능즉, 어디에 집중을 하고 어떤 전략을 수립해야할지 방향을 제시하는 역할을 데이터를 통해 전달하는 것이 데이터 분석의 역할이며, 분석된 결과에 따라 다양한 의사..

데이터 전처리 & 시각화 3주차(데이터프레임 다루기)

Pandas 데이터 저장, 호출seaborn 라이브러리에 존재하는 데이터 불러와 csv파일로 저장index 파라미터는 데이터의 인덱스 저장 여부를 결정또는 데이터 호출 시 인덱스 부분을 제거하고 가져오는 방식도 있음엑셀 파일의 경우는 pd.to_excel 사용 인덱스 미지정인덱스 지정인덱스 정렬 함수: sort_index()컬럼을 인덱스로 사용: set_index()인덱스의 정보와 타입을 확인: index인덱스 변경: index 인덱스를 기존 값으로 설정: rest_index()기존 인덱스 열 누락 여부 결정위한 drop 파라미터컬럼 데이터 프레임 생성컬럼 호출(시리즈 형태) 컬럼명 정보: columns컬럼명 변경특정 컬럼명만 변경: rename컬럼 추가컬럼 제거: del데이터 확인 df.head() ➡..

데이터 전처리 & 시각화 2주차

데이터 전처리내가 원하는 데이터를 보기 위해 하는 모든 활동 데이터 형태정형 데이터엑셀 시트, 표와 같이 행과 열이 명확한 데이터비정형 데이터이미지, 비디오 등 정형화 되지 않은 데이터 데이터 전처리는 왜?방대한 양의 데이터에 불규칙한 규칙이 존재 데이터 전처리는 어떻게?일정한 규칙을 적용해 통일따라서 데이터 전달의 목적성과 효과성이 중요 Pandas VS Excel자동화와 프로그래밍 가능대용량 데이터 처리복잡한 데이터 처리 및 분석확장성과 유연성버전 관리 Pandas 구조시리즈(Series)1차원 배열의 형태를 갖는다인덱스에는 한 가지 기준에 의해 데이터가 저장데이터 프레임(DataFrame)2차원 배열의 형태를 갖는다인덱스와 컬럼이라는 두 가지 기준에 의해 데이터가 저장

데이터 전처리 & 시각화 1주차

강의내용Pandas를 활용해 간단하게 데이터 전처리Matplotlib을 활용해 데이터 시각화단순히 스킬셋뿐만 아니라 데이터 분석에 대해 고민 데이터 분석가비즈니스 분석가주로 비즈니스 문제를 이해하고 해결하기 위해 데이터를 분석비즈니스 프로세스 및 요구 사항 파악하고, 데이터 기반으로 의사 결정 지원업무 프로세스 개선, 비즈니스 모델 분석, 요구 사항 관리 등을 수행프로덕트 분석가제품이나 서비스의 성가를 평가하고 개선하기 위해 데이터를 분석사용자 행동 및 제품 성능과 관련된 데이터를 분석하여 제품 개선에 기여주로 제품 경험과 사용자 행동에 대한 분석을 수행하며, A/B 테스트, 사용자 경로 분석 등을 담당BI 분석가기업의 비즈니스 인텔리전스 플랫포모가 도구를 사용하여 데이터를 시각화하고 보고서를 작성주로 ..