파이썬 7

데이터 전처리 & 시각화 4주차(시각화)

사례바다오염의 주범은 바다쓰레기바다쓰레기 줄이기 위해 빨대 사용금지가 얼마나 효과있을까실제 데이터 살펴보면 전세계 바다 쓰레기의 0.03%가 플라스틱 빨대로 인한 것이며, 가장 많이 문제가 되고 있는 것은 46%를 차지하고 있는 어망실제 바다 쓰레기의 약 50%가 어업활동으로 인해 발생했다는 사실을 바탕으로 어떤 의사결정이 가능할까효율/효과 측면에서 우리는 어업활동에서 발생하는 바다쓰레기를 줄이는 방안을 모색해야 한다고 분석 결과 전달 가능어쩌면, 종이빨대를 만드는 예산을 어업활동에서 쓰레기가 발생하지 않도록 개선시키는 것에 활용하는 것도 제안 가능즉, 어디에 집중을 하고 어떤 전략을 수립해야할지 방향을 제시하는 역할을 데이터를 통해 전달하는 것이 데이터 분석의 역할이며, 분석된 결과에 따라 다양한 의사..

데이터 전처리 & 시각화 3주차(데이터프레임 다루기)

Pandas 데이터 저장, 호출seaborn 라이브러리에 존재하는 데이터 불러와 csv파일로 저장index 파라미터는 데이터의 인덱스 저장 여부를 결정또는 데이터 호출 시 인덱스 부분을 제거하고 가져오는 방식도 있음엑셀 파일의 경우는 pd.to_excel 사용 인덱스 미지정인덱스 지정인덱스 정렬 함수: sort_index()컬럼을 인덱스로 사용: set_index()인덱스의 정보와 타입을 확인: index인덱스 변경: index 인덱스를 기존 값으로 설정: rest_index()기존 인덱스 열 누락 여부 결정위한 drop 파라미터컬럼 데이터 프레임 생성컬럼 호출(시리즈 형태) 컬럼명 정보: columns컬럼명 변경특정 컬럼명만 변경: rename컬럼 추가컬럼 제거: del데이터 확인 df.head() ➡..

데이터 분석 파이썬 종합반 5주차(유용한 문법)

파일 다루기 파일 확장자CSV 파일: Comma Separated Values의 약자로, 데이터를 쉼표로 구분하여 저장하는 형식Excel 파일: 표 형태로 데이터를 저장하는 Microsoft Excel의 형식JSON 파일: JavaScript Object Notation의 약자로, 데이터를 저장하는 간단한 형식텍스트 파일: 일반 텍스트로 된 데이터 저장하는 파일 파일 불러오기import pandas as pd# csv 파일 (.csv)df = pd.read_csv('file.csv')# Excel 파일 (.xls, .xlsx)df = pd.read_excel('file.xlsx')# JSON 파일 (.json)df = pd.read_json('file.json')# 텍스트 파일 (.txt, .dat)df..

데이터 분석 파이썬 종합반 4주차(함수, 변수)

함수 개념입력을 받아 원하는 처리를 한 후 출력을 내보내는 작업을 수행하는 코드 블록프로그램 내에서 특정한 기능을 수행하기 위해 코드를 논리적으로 그룹화하여 재사용 가능한 형태로 정의 함수의 필요성코드의 재사용모듈화유지 보수 요이성가독성 향상변수의 종류전역변수(Global Variables)프로그램 전체에서 접근 가능한 변수로, 어디서든 사용이 가능여러 함수에서 공통적으로 사용되는 값을 저장할 때 유용프로그램이 시작될 때 생성되고, 프로그램이 종료될 때까지 메모리에 유지지역 변수(Local Variables)특정한 범위에서만 접근 가능한 변수로, 해당 범위를 벗어나면 사용 불가능함수가 실행될 때 생성되고, 함수가 종료되면 메모리에서 제거되므로 메모리 관리에 효율적 인수 vs 매개변수함수 정의할 때 매개변..

데이터 분석 파이썬 종합반 3주차(조건문, 반복문)

데이터 가공할 때 특정 조건에 따라 가공하는 일이 많고 보통 이러한 작업은 반복 수행이  많기 때문에 조건문과 반복문을 함께 쓰는 경우가 많음뿐만 아니라 대용량의 데이터 AI 모델에 하나씩 집어 넣을 때, AI 모델을 여러번 반복 학습할 때에도 반복문이 사용 설명데이터 분석시 특정 데이터에 조건을 부여머신러닝의 반복되는 학습큰 용량의 데이터를 한번에 메모리에 넣지 않고 여러번 나누어서 넣을 때 목적데이터 가공AI 모델 사용조건문if 조건: if 문을 이용해 조건을 만족할 때의 실행할 것을 작성elif 다른 조건: elif 문을 이용해 또 다른 조건을 만족할 때의 실행할 것을 작성else: 위의 조건들을 다 만족하지 못 할 때 실행할 것을 작성 연산>, =, 좌 우를 비교해 참 또는 거짓의 bool 값을 ..

데이터 분석 5주차(가설, 검증, 코호트)

좋은 가설풀고자 하는 문제의 방향성과 일치하는 가설테스트 가능한 가설액션으로 이어질 수 있는 가설 문제 상황교육의 목적은 완주율인데 웹 개발 종합반의 완주율이 크게 낮아짐이에 대해 어떤 요소들이 영향을 끼쳤는지 파악 문제 파악문제를 파악하기 위해서는 쪼개는 과정이 중요수강생들이 완주하기 까지의 여정을 살펴보면 문제가 되는 요소들을 파악할 수 있음 완주 여정 추측강의를 들을 수 있는 시간적 여유가 생김시간은 컨트롤하기 힘듦(직장인, 학생)강의를 들어야겠다고 마음을 먹음찐한 관리라는 수강을 독려하는 서비스 존재강의를 듣기 위해 콘텐츠에 접근웹페이지 시스템의 불편 사항, 영상 오류 여부 등이 영향을 미쳤는지 확인 - 없다고 가정콘텐츠를 목표한 부분까지 들음흥미도와 실용성을 체크해봐야 함기존 1개의 문제를 4개..

데이터 분석 파이썬 종합반 2주차(파이썬 리스트, 튜플 자료형)

리스트와 튜플의 차이리스트: 요소 변경 가능튜플: 요소 변경 불가능리스트 메소드요소 추가list1.append(a): 리스트에 a 요소 추가list1.extend([a,b,c]): 리스트에 a, b, c 요소 추가(다른 리스트의 모든 요소를 추가)list1.insert(a, b): 리스트의 a번 인덱스에 b 추가요소 제거list1.remove(a): 리스트에서 a 값 제거data = list1.pop(a): 리스트에서 a 인덱스 요소 반환하고 제거del list1[a]: 리스트에서 a 인덱스 요소 제거list1.clear(): 리스트의 모든 요소 제거 iris 데이터 불러오기딕셔너리키-값 쌍의 데이터를 저장하는 자료구조 딕셔너리 메소드keys = dict1.keys(): 딕셔너리의 모든 키 값을 저장va..

728x90