ADP(데이터분석 전문가)/스터디노트

[2과목] 데이터 처리 프로세스

bonanza 2021. 2. 2. 10:15

1. 데이터 웨어하우스

  • 데이터 웨어하우스는 ODS를 통해 정제 및 통합된 데이터가 데이터 분석과 보고서 생성을 위해 적재되는 데이터 저장소

 

2. 데이터 웨어하우스의 테이블 모델링 기법

  • 스타 스키마 (조인 스키마): Fact Table은 제 3정규형으로 모델링, Dimensional Table은 제 2정규형으로 모델링

   - 장점: 스노우 플레이크 스키마에 비해 복잡도가 낮아서 이해하기 쉽고, 쿼리 작성이 용이하고 조인 테이블 개수가 적다.

   - 단점: 차원 테이블들의 비정규화에 따른 데이터 중복으로 인해 테이블로 데이터를 적재할 때 상대적으로 많은 시간이 소요된다.

별모양이라 스타스키마

 

  • 스노우 플레이크 스키마: 차원 테이블을 제 3정규형으로 모델링

   - 장점: 데이터의 중복이 제거돼 데이터 적재시 시간이 단축된다.

   - 단점: 스타 스키마에 비해 스키마 구조의 복잡성이 증가하므로 조인 테이블의 개수가 증가하고 쿼리 작성의 난이도가 상승된다.

눈송이 모양이라 스노우 플레이크 스키마

 

3. ODS와 DWH 비교

반응형