ADP(데이터분석 전문가)/스터디노트

[4과목] 통계분석의 이해

bonanza 2021. 2. 28. 14:05

1. 표본 추출 방법

  • 단순랜덤 추출법(simple random sampling)
  • 계통추출법(systematic sampling)
  • 집락추출법(cluster random sampling)
  • 층화추출법(stratified random sampling)

계통추출법/집락추출법/층화추출법

 

2. 측정

질적척도(범주형자료, 숫자들의 크기 차이가 계산되지 않는 척도)

  • 명목척도: 어느 집단에 속하는지 분류할 때 (성별, 출생지 등)
  • 순서척도: 서열관계를 측정할 때 (만족도, 학년, 신용등급 등)

        → 1등이 3등보다 높다는 것은 알지만, 얼마나 높은지는 알수 없음 (사칙연산이 불가능)

 

양적척도(수치형자료, 숫자들의 크기 차이를 계산할 수 있는 척도)

  • 구간척도: 속성의 양을 측정하는 것으로 구간이나 구간사이의 간격이 의미가 있음 (온도, 지수)

        → "20도가 30도에 비해 10도 춥다"라고는 할 수 있지만, 1.5배 춥다는 못함 (곱/나누기 연산 불가)

        → "0값이면 "없다"라고 표현할 수 없음 (절대적 0이 존재하지 않음)

  • 비율척도: 각격에 대한 비율이 의미를 가지는 자료, 절대적인 기준 0이 존재하고, 사칙연산이 가능 (무게, 나이, 시간 등)

        → "2배 무겁다" 가능함

 

3. 통계분석

  • 기술통계(descriptive statistics)
  • 통계적 추론(inferenace statistics)
    • 모수추정: 모집단의 특성인 모수를 분석
    • 가설검정: 가설이 옳고 그른지를 결정
    • 예측: 불확실성을 해결하기 위해 효율적인 의사결정 방법

 

4. 확률분포

  • t분포: 평균이 동일한지 검정 → t검정
  • 카이제곱분포: 두집단(범주형 데이터)간의 동질성을 검정 → 교차검정 - 적합도검정/동립성검정/동질성검정
  • F분포: 셋이상의 집단간의 평균 (분산의 동일성 검정) → ANOVA

 

5. 가설검정

  • 제 1종 오류와 제 2종 오류

 

6. 왜도와 첨도

  • 왜도는 비대칭정도인 3제곱, 첨도는 뾰족한 정도인 4제곱

왜도가 양수/음수
첨도가 양수/음수

 

7. 막대그래프 vs 히스토그램

  • 히스토그램: 범주형 데이터, 막대 간격이 있음
  • 히스토그램: 연속형 데이터, 막대 간격이 없음

 

8. 상관분석 (r)

반응형

'ADP(데이터분석 전문가) > 스터디노트' 카테고리의 다른 글

[4과목] 회귀분석  (0) 2021.03.07
[4과목] 통계분석 방법론  (0) 2021.03.04
[4과목] 데이터 가공  (3) 2021.02.25
[4과목] R기초  (1) 2021.02.23
[4과목] 데이터 분석 개요  (0) 2021.02.20