EDA & 데이터 분석/데이터분석 15

데이터 분석 파이썬 종합반 2주차(파이썬 리스트, 튜플 자료형)

리스트와 튜플의 차이리스트: 요소 변경 가능튜플: 요소 변경 불가능리스트 메소드요소 추가list1.append(a): 리스트에 a 요소 추가list1.extend([a,b,c]): 리스트에 a, b, c 요소 추가(다른 리스트의 모든 요소를 추가)list1.insert(a, b): 리스트의 a번 인덱스에 b 추가요소 제거list1.remove(a): 리스트에서 a 값 제거data = list1.pop(a): 리스트에서 a 인덱스 요소 반환하고 제거del list1[a]: 리스트에서 a 인덱스 요소 제거list1.clear(): 리스트의 모든 요소 제거 iris 데이터 불러오기딕셔너리키-값 쌍의 데이터를 저장하는 자료구조 딕셔너리 메소드keys = dict1.keys(): 딕셔너리의 모든 키 값을 저장va..

데이터 분석 4주차(가설, 검증)

데이터 분석 순서문제 정의 및 가설 설정데이터 분석 기본 세팅데이터 분석분석 결과 시각화최종 결론직접 가설을 세우고 검증주어진 임무: 다른 강의에 비해, 게임 종합반의 구매 전환률 안정적이지 않기 때문에 이번 달은 게임 종합반 수강생 유입에 집중해 액션 플랜을 계획 기본 세팅 데이터 호출유저마다 유입 미디어가 다름 가설을 세움: 여러 광고 매체 중 효율이 낮은 매체에 사용한 비용을 가장 효율이 좋은 매체에 집행한다면 효율을 증대시킬 수 있을 것이다.  데이터 확인discounted 컬럼의 수는 5564 밖에 안됨 실제로 확인 결측치 제거 각 매체별 인원 수를 파악 groupby 적용인스타 그램의 효율이 좋음 시각화 실제 값을 이용해 비교 [결론: 오프라인 광고 비중을 줄이고 인스타그램의 비중을 늘림]지금..

데이터 분석 3주차(시각화)

데이터 분석의 순서문제 정의 및 가설 설정데이터 분석 기본 세팅 하기➡️ pandas데이터 분석분석 결과 시각화 ➡️ matplotlib결론 내리기 실제 직장에서 발생할법한 데이터 이용해 분석상황 1. 최적의 타이밍에 강의의 수강을 독려하는 메세지를 보내는 것이 좋을까?목표: 수강생들이 가장 많이 or 적게 듣는 시간과 요일 데이터를 이용해 분석의사 결정 1. 수강생들이 어느 요일에 가장 수업을 많이 듣는지의사 결정 2. 가장 수강생들이 많은 지역 1. 수강생이 가장 수업을 많이 듣는 요일/시간수강생들이 수업을 많이/적게 듣는 시간을 알면 독려나 동기부여 문자 보내기 가능 데이터 호출lecture_id: 강의 IDaccess_data: 강의를 시청한 날짜/시간user_id: 유저 ID날짜 데이터가 통으로..

데이터 분석 2주차(Pandas, Matplotlib 라이브러리 사용)

핵심엑셀과 파이썬은 그냥 데이터 분석을 위한 도구일 뿐데이터 분석하는 역량을 길러야 함가설 세우고 ➡️ 데이터 분석 ➡️ 결과 도출, 해석Pandas데이터 분석 기본 세팅 하기, 데이터 분석하기 부분에서 사용Pandas 사용 선언 ➡️ 데이터 호출 ➡️ 데이터 확인 및 표 읽기 ➡️ 공백란 제거라이브러리 호출: 다른 사람이 만들어 놓은 기능을 사용데이터 호출sep = ','는 ,를 기준으로 분리하겠다는 의미각 컬럼의 널값 확인널값 제거상관 계수 계산pearson 모드를 사용+ Survived 변수와 다른 변수 간의 관계를 보고 싶으므로 Survived와 Survived 간의 관계는 관심 없음엑셀 파일 불러오는 법Matplotplib데이터 시각화하는 도구라이브러리 호출위에서 저장한 상관계수 시각화 (모든 ..