본문 바로가기
데이터베이스

DW(데이터 웨어하우스), 다차원 모델링 개요

by C.D.콤파스 2023. 7. 19.

다차원 모델링은 데이터 웨어하우스와 비즈니스 인텔리전스(Business Intelligence, BI) 시스템에서 사용되는 중요한 개념 중 하나입니다.

데이터 웨어하우스는 다양한 소스로부터 추출된 데이터를 통합하여 효율적으로 저장하고, 해당 데이터를 분석하여 의사 결정에 도움을 주는 역할을 수행합니다.

다차원 모델링은 이러한 데이터 웨어하우스에서 데이터를 조직화하고 사용자들이 데이터를 쉽게 이해하고 접근할 수 있도록 하는 방법론입니다.

 

다차원 모델링의 주요 개념은 "차원(dimension)"과 "측정값(measure)"입니다. 이 두 가지 개념을 사용하여 데이터를 직관적으로 이해하기 쉬운 형태로 구성합니다.

 

차원(Dimension): 차원은 데이터를 설명하는 기준이나 항목들의 집합입니다. 예를 들어, 제품 판매 데이터를 다루는 경우, "시간", "제품", "지역"과 같은 차원을 가질 수 있습니다. 각 차원은 계층적으로 구성되며, 특정 차원에는 여러 수준의 속성들이 존재합니다.

  • 예시: "시간" 차원 
  • 연도 → 분기 → 월 → 일

측정값(Measure): 측정값은 데이터 웨어하우스에서 분석하고자 하는 수치형 데이터입니다. 주로 수량, 금액, 판매량, 이익 등이 측정값으로 사용됩니다. 이러한 측정값들은 차원의 조합에 따라 달라지며, 다차원 모델링을 통해 다양한 각도에서 데이터를 살펴볼 수 있습니다.

  • 예시: "판매량" 측정값

다차원 모델링은 "스타 스키마(Star Schema)"와 "스노우플레이크 스키마(Snowflake Schema)" 두 가지 주요 구조를 사용합니다.

  1. 스타 스키마(Star Schema): 스타 스키마는 가장 간단한 형태의 다차원 모델링 구조로, 중심 테이블(또는 사실 테이블)과 이와 연결된 차원 테이블들로 구성됩니다. 중심 테이블은 측정값을 포함하고, 차원 테이블들은 해당 차원의 속성들을 담고 있습니다. 스타 스키마는 쿼리의 성능을 높이고, 데이터의 이해를 쉽게 돕는 장점이 있습니다.

스타스키마(Star Schema)

  1. 스노우플레이크 스키마(Snowflake Schema): 스노우플레이크 스키마는 스타 스키마와 유사하지만 차원 테이블들이 정규화되어 있어 더 많은 테이블로 구성됩니다. 이로 인해 저장 공간을 더 효율적으로 사용할 수 있지만, 쿼리 성능이 스타 스키마보다 약간 떨어질 수 있습니다.

스노우플레이크 스키마(Snowflake Schema)

다차원 모델링은 사용자들이 직관적이고 효과적으로 데이터를 분석하고 시각화할 수 있도록 돕는 중요한 기술로, 데이터 웨어하우스 및 비즈니스 인텔리전스 구축 시에 널리 활용됩니다.