1. 표본 추출 방법
- 단순랜덤 추출법(simple random sampling)
- 계통추출법(systematic sampling)
- 집락추출법(cluster random sampling)
- 층화추출법(stratified random sampling)
2. 측정
질적척도(범주형자료, 숫자들의 크기 차이가 계산되지 않는 척도)
- 명목척도: 어느 집단에 속하는지 분류할 때 (성별, 출생지 등)
- 순서척도: 서열관계를 측정할 때 (만족도, 학년, 신용등급 등)
→ 1등이 3등보다 높다는 것은 알지만, 얼마나 높은지는 알수 없음 (사칙연산이 불가능)
양적척도(수치형자료, 숫자들의 크기 차이를 계산할 수 있는 척도)
- 구간척도: 속성의 양을 측정하는 것으로 구간이나 구간사이의 간격이 의미가 있음 (온도, 지수)
→ "20도가 30도에 비해 10도 춥다"라고는 할 수 있지만, 1.5배 춥다는 못함 (곱/나누기 연산 불가)
→ "0값이면 "없다"라고 표현할 수 없음 (절대적 0이 존재하지 않음)
- 비율척도: 각격에 대한 비율이 의미를 가지는 자료, 절대적인 기준 0이 존재하고, 사칙연산이 가능 (무게, 나이, 시간 등)
→ "2배 무겁다" 가능함
3. 통계분석
- 기술통계(descriptive statistics)
- 통계적 추론(inferenace statistics)
- 모수추정: 모집단의 특성인 모수를 분석
- 가설검정: 가설이 옳고 그른지를 결정
- 예측: 불확실성을 해결하기 위해 효율적인 의사결정 방법
4. 확률분포
- t분포: 평균이 동일한지 검정 → t검정
- 카이제곱분포: 두집단(범주형 데이터)간의 동질성을 검정 → 교차검정 - 적합도검정/동립성검정/동질성검정
- F분포: 셋이상의 집단간의 평균 (분산의 동일성 검정) → ANOVA
5. 가설검정
- 제 1종 오류와 제 2종 오류
6. 왜도와 첨도
- 왜도는 비대칭정도인 3제곱, 첨도는 뾰족한 정도인 4제곱
7. 막대그래프 vs 히스토그램
- 히스토그램: 범주형 데이터, 막대 간격이 있음
- 히스토그램: 연속형 데이터, 막대 간격이 없음
8. 상관분석 (r)
반응형
'ADP(데이터분석 전문가) > 스터디노트' 카테고리의 다른 글
[4과목] 회귀분석 (0) | 2021.03.07 |
---|---|
[4과목] 통계분석 방법론 (0) | 2021.03.04 |
[4과목] 데이터 가공 (3) | 2021.02.25 |
[4과목] R기초 (1) | 2021.02.23 |
[4과목] 데이터 분석 개요 (0) | 2021.02.20 |