EDA & 데이터 분석/BI
실습으로 배우는 태블로 2주차(Tableau 설명, 실습)
edcrfv458
2025. 2. 12. 14:56
학습 목표
- Tableau 실습 환경 준비하고 기본 구성 파악
Tableau 소개
구조
- Tableau Desktop: 컴퓨터에서 로컬로 강력한 계산과 뷰, 대시보드를 작성
- Tableau Prep Builder: Tableau Desktop에 필요한 데이터 전처리 역할
- Tableau Server: 온프레미스 서버를 사용해 대스보드를 공유하고 협업
역할
- Tableau Desktop: Tableau Desktop에서 데이터를 시각화하는 역할
- Tableau Cloud(Tableau Online): Tableau Server가 SaaS 버전으로 제공되는 형태
- Tableau Server: Tableau Server를 통해 게시 및 배포
사용
- 유로 툴이기에 보유한 라이센스에 따라 대시보드 업무 및 접근 권한이 다름
- creator: 전체 권한 보유(원본 데이터 편집, 대시보드 편집, 게시, 보기)
- explorer: 대시보드 편집과 게시 가능
- viewer: 접근 권한이 있거나 공유된 통합 문서 대시보드 보기만 가능
- 주로 데이터 분석가/엔지니어, BI 분석가/엔지니어가 편집 권한을 받음
Tableau 실습
- Tableau Public: 대시보드 작업 결과물을 PC의 로컬에 저장
- Tableau Desktop: Online 계정에 클라우드 공간에 저장
데이터 연결
- 데이터 연결 방식
- 기본 제공 데이터, 파일(csv, xlsx 등), 커넥터(클라우드, 빅쿼리, DB 등 연동) 3가지 활용
- 데이터 원본 연결 형태
- 커넥터 연동시(특히 SQL 쿼리 사용), 라이브 연결 대신 추출 연결로 선택하는 것이 태블로 대시보드 만드는 시간을 줄일 수 있음
- 라이브: 원본 파일이 바뀌면 연동이 되며, 새로고침 버튼을 클릭하면 실시간으로 데이터 업데이트 가능
- 추출: 라이브 연결을 끊고 현재 데이터만 로컬로 가져오는 형태이며, 원본 데이터 파일 클 때 사용
- 커넥터 연동시(특히 SQL 쿼리 사용), 라이브 연결 대신 추출 연결로 선택하는 것이 태블로 대시보드 만드는 시간을 줄일 수 있음
데이터 전처리
- 불필요한 컬럼이 많은 경우
- 컬럼 오른쪽 클릭 ➡️ 숨기기
- 컬럼이 시트에서도 나타나지 않음
- 데이터 유형 변경
- 컬럼 오른쪽 클릭 ➡️ 데이터 유형 변경
- 데이터 원본 탭에서도 가능하고 워크시트에서도 가능
- Host is Superhost 컬럼이 bool 타입인데 문자열 타입으로 변경
테이블 관계 만들기
- 테이블 병합 방식(관계, 유니온, 조인, 블렌딩)
- 관계: 조인과 달리 하나의 테이블로 병합하지 않고 테이블간 관계를 설정해서 뷰에서 필드 사용 가능
- 조인보다 유인하고 동적인 방법으로 효율적, 실무에서 많이 활용
- 공통 키를 이용해 연결
- 유니온: 테이블 구조가 같은 형태인 경우, 테이블 병합이 가능
- SQL의 UNION과 비슷한 개념
- 조인: 테이블은 항상 하나의 테이블로 병합
- SQL의 조인과 비슷한 개념으로 Left join, inner join 등 종류가 있으며, 2개 이상의 테이블을 하나의 테이블로 병합
- 블렌딩: 물리적으로 테이블을 병합하지 않고, 워크시트 화면에 두 테이블이 같이 있는 형태
- 서로 다른 데이터 베이스에서 데이터를 불러오고 임시로 분석할 때 사용하는 방법
- 관계: 조인과 달리 하나의 테이블로 병합하지 않고 테이블간 관계를 설정해서 뷰에서 필드 사용 가능
- 커넥터 연동: 구글 빅쿼리
- Tableau Server에 구글 빅쿼리를 연결
- 워드 클라우드 시각화: 텍스트, 크기, 색상
Tableau 구성 및 기능 소개
구성
- 전체 탭 구성: 워크시트, 대시보드, 스토리
- 워크시트: 기본 작업 공간
- 대시보드: 여러 개의 워크시트를 통합해서 대시보드로 생성
- 실무에서는 각 워크시트별로 작업해서 통합 대시보드로 합쳐서 결과물을 활용
- 스토리: 여러 개의 워크시트와 대시보드를 합쳐 하나의 인포그래픽 형태의 스토리로 생성
- 마크 활용법: 색상, 크기, 텍스트, 세부정보, 도구 설명
- 분석 탭(분석 패널): 상수 라인, 평균 라인, 사분위수, 박스플롯 등 통계적인 것들 표현
기능과 용어
- 차원(dimension) vs 측정값(metric)
- 측정값은 집계함수(SUM, AVG, COUNT 등)를 활용해 계산하고 비교
이름 | 설명 | 예시 |
차원 | 측정 기준 또는 분석의 기준 | 유저 아이디, 지역, 상품명 등 |
측정값 | 측정하는 값 또는 항목 | 매출, 리텐션, 전환율 등 |
- 연속형과 불연속형
- 차원과 측정값은 연속형과 불연속형으로 구분
- 연속형: 하나로 연결되어 이어진 데이터, 녹색 측정값과 차원
- 불연속형: 이어지지 않고 각각 구분되는 개별적인 데이터, 파란색 측정값과 차원
- 차원과 측정값은 연속형과 불연속형으로 구분
- 계산된 필드
- 기존 컬럼을 계산해 새로운 컬럼을 생성
- 상단 분석 탭 ➡️ 계산된 필드 만들기
- 매개변수
- 계산, 필터 또는 참조선에서 상수 값으로 대체할 수 있는 숫자, 날짜 또는 문자열과 같은 통합 문서 변수
- 사용자가 대시보드와 워크시트의 데이터 필터링하거나 조정할 수 있는 기능
- 주로 계산된 필드에 추가해서 사용
- 예) 날짜 범위를 선택하거나 상위 고객을 필터링하여 작업 가능