데이터 분석 5

[Book] 파이썬책 - Introduction to 파이썬

이번에 본 책은 Introduction to 파이썬 이라는 책이다. www.kyobobook.co.kr/product/detailViewKor.laf?mallGb=KOR&ejkGb=KOR&linkClass=&barcode=9791196440947 Introduction to 파이썬 - 교보문고 이 책은 다양한 난이도의 예제를 재미있게 풀어보면서 자연스럽게 파이썬 프로그래밍의 기초와 활용 방법을 익힐 수 있도록 고안되었습니다. 프로그래밍을 처음 접하는 초보자나 다른 컴퓨터 www.kyobobook.co.kr 책의 목차는 아래와 같다. 보시다피시 목차가 매우 깁니다... 목차가 자세히 안보이는 점 죄송합니다 ㅠㅠ 이 책의 장점위주로 설명해 보려한다. 1. 알찬 내용 구성 목차가 매우매우 길다. 파이썬에 기본..

학습/Book 2021.03.28

[2과목] 데이터 처리 프로세스

1. 데이터 웨어하우스 데이터 웨어하우스는 ODS를 통해 정제 및 통합된 데이터가 데이터 분석과 보고서 생성을 위해 적재되는 데이터 저장소 2. 데이터 웨어하우스의 테이블 모델링 기법 스타 스키마 (조인 스키마): Fact Table은 제 3정규형으로 모델링, Dimensional Table은 제 2정규형으로 모델링 - 장점: 스노우 플레이크 스키마에 비해 복잡도가 낮아서 이해하기 쉽고, 쿼리 작성이 용이하고 조인 테이블 개수가 적다. - 단점: 차원 테이블들의 비정규화에 따른 데이터 중복으로 인해 테이블로 데이터를 적재할 때 상대적으로 많은 시간이 소요된다. 스노우 플레이크 스키마: 차원 테이블을 제 3정규형으로 모델링 - 장점: 데이터의 중복이 제거돼 데이터 적재시 시간이 단축된다. - 단점: 스타 ..

[2과목] ETL 개요

1. ETL의 개념 및 특징 ETL(Extraciton, Transformation and Load)은 데이터의 이동 및 변환 절차와 관련된 업계 표준 용어이다. 다양한 데이터 원천으로부터 데이터를 추출 및 변환하여 운영 데이터 스토어(ODS, Operation Data Store), 데이터 웨어하우스(DW, Data Warehouse), 데이터 마트(DM, Data Mart)등에 데이터를 적재하는 작업의 핵심 구성요소이다. MPP(Massive Parallel Processing)을 지원 2. ETL의 작업 단계 3. ODS 구성단계 인터페이스 단계: 다양한 데이터 원천(Source)으로 부터 데이터를 획득하는 단계 스테이징 단계: 데이터 원천들로부터 트랜잭션 데이터들이 추출되어 하나 또는 그 이상의 ..

[블로그] 티스토리 - 구글 애널리틱스 연동하기 (티스토리 통계 믿을만 한가....)

우리가 쓰는 티스토리 통계 믿을만 한가? 티스토리 블로그에 기본 탑재되어있는 저 티스토리 통계 믿을만 한가...? 답: 못 믿는다.. 왜냐하면 우리네 홈페이지는 온갓 검색엔진봇들이 들락날락 하면서 새로운 글이 업데이트 됐네? 하면 가서 각자의 검색 엔진에 업데이트를 한다. 즉, 티스토리의 통계는 온갖 봇들이 왔다갔다 한것까지 체크되닌깐 정확한 통계가 아니다. 그래서 구글 애널리틱스(google analytics)를 떠야 된다. 구글 애널리틱스는 홈페이지의 고객의 행동 패턴 및 모든 기록을 수집하는 툴이다. https://analytics.google.com/ Redirecting... analytics.google.com 준비물: 구글 ID 1. 구글 애널리틱스 계정 생성 - 이것 저것 체크할게 많은데 ..

학습/블로그 2021.01.21

[사설] 데이터 분석가(Data analyst) vs 데이터 과학자(Data scientist)

·흔히, 일상에서 많이 물어보는 질문이 있다. 데이터 분석가(Data analyst)와 데이터 과학자(Data scientist)의 차이가 뭔가? 쉽게 대답하기 힘들것이다. 아마 명확한 차이에 대해 정립해본적이 없을테니.. 나 또한, 이에 대해 고민해보지 않아 실제 면접에 나왔을 때 대답하느라 혼났다. 시중에 서적에서 찾아보자. 과거에 읽었던 책에 있는 데이터 분석가(Data analyst)와 데이터 과학자(Data scientist)의 차이이다. 데이터 분석가는 데이터 정제 및 원인 분석과 결과 분석 작업(현황분석)을 주로 하고, 일부 경험 있는 분석가는 드물게 추정 작업(예측 분석)도 한다. 데이터 과학자는 현황 분석보다는 주로 산업별 전문 지식을 갖고 예측 최적화 작업을 한다. - "데이터 과학 무..

728x90
반응형