EDA & 데이터 분석/BI

실습으로 배우는 태블로 2주차(Tableau 설명, 실습)

edcrfv458 2025. 2. 12. 14:56

학습 목표

  • Tableau 실습 환경 준비하고 기본 구성 파악

Tableau 소개

 

구조

  • Tableau Desktop: 컴퓨터에서 로컬로 강력한 계산과 뷰, 대시보드를 작성
  • Tableau Prep Builder: Tableau Desktop에 필요한 데이터 전처리 역할
  • Tableau Server: 온프레미스 서버를 사용해 대스보드를 공유하고 협업

 

역할

  • Tableau Desktop: Tableau Desktop에서 데이터를 시각화하는 역할
  • Tableau Cloud(Tableau Online): Tableau Server가 SaaS 버전으로 제공되는 형태
  • Tableau Server: Tableau Server를 통해 게시 및 배포

 

사용

  • 유로 툴이기에 보유한 라이센스에 따라 대시보드 업무 및 접근 권한이 다름
    • creator: 전체 권한 보유(원본 데이터 편집, 대시보드 편집, 게시, 보기)
    • explorer: 대시보드 편집과 게시 가능
    • viewer: 접근 권한이 있거나 공유된 통합 문서 대시보드 보기만 가능
  • 주로 데이터 분석가/엔지니어, BI 분석가/엔지니어가 편집 권한을 받음

Tableau 실습

  • Tableau Public: 대시보드 작업 결과물을 PC의 로컬에 저장
  • Tableau Desktop: Online 계정에 클라우드 공간에 저장

 

데이터 연결

  • 데이터 연결 방식
    • 기본 제공 데이터, 파일(csv, xlsx 등), 커넥터(클라우드, 빅쿼리, DB 등 연동) 3가지 활용
  • 데이터 원본 연결 형태
    • 커넥터 연동시(특히 SQL 쿼리 사용), 라이브 연결 대신 추출 연결로 선택하는 것이 태블로 대시보드 만드는 시간을 줄일 수 있음
      • 라이브: 원본 파일이 바뀌면 연동이 되며, 새로고침 버튼을 클릭하면 실시간으로 데이터 업데이트 가능
      • 추출: 라이브 연결을 끊고 현재 데이터만 로컬로 가져오는 형태이며, 원본 데이터 파일 클 때 사용

 

데이터 전처리

  • 불필요한 컬럼이 많은 경우
    • 컬럼 오른쪽 클릭 ➡️ 숨기기
    • 컬럼이 시트에서도 나타나지 않음
  • 데이터 유형 변경
    • 컬럼 오른쪽 클릭 ➡️ 데이터 유형 변경 
    • 데이터 원본 탭에서도 가능하고 워크시트에서도 가능
    • Host is Superhost 컬럼이 bool 타입인데 문자열 타입으로 변경

 

테이블 관계 만들기

  • 테이블 병합 방식(관계, 유니온, 조인, 블렌딩)
    • 관계: 조인과 달리 하나의 테이블로 병합하지 않고 테이블간 관계를 설정해서 뷰에서 필드 사용 가능
      • 조인보다 유인하고 동적인 방법으로 효율적, 실무에서 많이 활용
      • 공통 키를 이용해 연결
    • 유니온: 테이블 구조가 같은 형태인 경우, 테이블 병합이 가능
      • SQL의 UNION과 비슷한 개념
    • 조인: 테이블은 항상 하나의 테이블로 병합
      • SQL의 조인과 비슷한 개념으로 Left join, inner join 등 종류가 있으며, 2개 이상의 테이블을 하나의 테이블로 병합
    • 블렌딩: 물리적으로 테이블을 병합하지 않고, 워크시트 화면에 두 테이블이 같이 있는 형태
      • 서로 다른 데이터 베이스에서 데이터를 불러오고 임시로 분석할 때 사용하는 방법
  • 커넥터 연동: 구글 빅쿼리
    • Tableau Server에 구글 빅쿼리를 연결
    • 워드 클라우드 시각화: 텍스트, 크기, 색상

Tableau 구성 및 기능 소개

 

구성

  • 전체 탭 구성: 워크시트, 대시보드, 스토리
    • 워크시트: 기본 작업 공간
    • 대시보드: 여러 개의 워크시트를 통합해서 대시보드로 생성
      • 실무에서는 각 워크시트별로 작업해서 통합 대시보드로 합쳐서 결과물을 활용
    • 스토리: 여러 개의 워크시트와 대시보드를 합쳐 하나의 인포그래픽 형태의 스토리로 생성
  • 마크 활용법: 색상, 크기, 텍스트, 세부정보, 도구 설명
  • 분석 탭(분석 패널): 상수 라인, 평균 라인, 사분위수, 박스플롯 등 통계적인 것들 표현

 

기능과 용어

  • 차원(dimension) vs 측정값(metric)
    • 측정값은 집계함수(SUM, AVG, COUNT 등)를 활용해 계산하고 비교
이름 설명 예시
차원 측정 기준 또는 분석의 기준 유저 아이디, 지역, 상품명 등
측정값 측정하는 값 또는 항목 매출, 리텐션, 전환율 등
  • 연속형과 불연속형
    • 차원과 측정값은 연속형과 불연속형으로 구분
      • 연속형: 하나로 연결되어 이어진 데이터, 녹색 측정값과 차원
      • 불연속형: 이어지지 않고 각각 구분되는 개별적인 데이터, 파란색 측정값과 차원
  • 계산된 필드
    • 기존 컬럼을 계산해 새로운 컬럼을 생성
    • 상단 분석 탭 ➡️ 계산된 필드 만들기
  • 매개변수
    • 계산, 필터 또는 참조선에서 상수 값으로 대체할 수 있는 숫자, 날짜 또는 문자열과 같은 통합 문서 변수
    • 사용자가 대시보드와 워크시트의 데이터 필터링하거나 조정할 수 있는 기능 
    • 주로 계산된 필드에 추가해서 사용
      • 예) 날짜 범위를 선택하거나 상위 고객을 필터링하여 작업 가능