ADsP 42

[4과목] 통계분석의 이해

1. 표본 추출 방법 단순랜덤 추출법(simple random sampling) 계통추출법(systematic sampling) 집락추출법(cluster random sampling) 층화추출법(stratified random sampling) 2. 측정 질적척도(범주형자료, 숫자들의 크기 차이가 계산되지 않는 척도) 명목척도: 어느 집단에 속하는지 분류할 때 (성별, 출생지 등) 순서척도: 서열관계를 측정할 때 (만족도, 학년, 신용등급 등) → 1등이 3등보다 높다는 것은 알지만, 얼마나 높은지는 알수 없음 (사칙연산이 불가능) 양적척도(수치형자료, 숫자들의 크기 차이를 계산할 수 있는 척도) 구간척도: 속성의 양을 측정하는 것으로 구간이나 구간사이의 간격이 의미가 있음 (온도, 지수) → "20도가..

[4과목] 데이터 가공

1. 변수의 구간화 binning: 신용평가 모형의 개발에서 연속형 변수를 범주형 변수로 구간화 하는데 쓰는 방법 (ex. 신용점수 100~90점은 A, 신용점수 90~80은 B ...) 의사결정나무: 여러번의 분리기준으로 구간화 2. 결측치 단순대치법 - complete analysis: 결측치 값 제거 단순대치법 - 평균대치법: 데이터의 평균으로 대치 (비조건부 평균 대치, 조건부 평균대치) 단순대치법 - 단순확률 대치법: Hot-deck 방법, KNN방법 다중대치법: m번의 대치를 통해 m개의 가상적 완전자료 생성 (대치-분석-결합_ 3. 이상치 ESD(Extreme Studentized Deviation): 3시그마 떨어진 값 기하평균 - 2.5*표준편차 < data < 기하평균 + 2.5 * 표..

[4과목] R기초

1. 데이터 분석 도구의 현황 분석도구 비교 SAS SPSS R Python 프로그램 비용 유료, 고가 유료, 고가 오픈소스, 무료 오픈소스, 무료 설치용량 대용량 대용량 모듈화로 간단 모듈화로 간단 (배우기 쉬움) 다양한 모듈 지원 및 비용 별도구매 별도구매 오픈소스 오픈소수 최신 알고리즘 및 기술반영 느림 다소 느림 매우 빠름 매우 빠름 (기계학습에 능숙) 학습자료 입수의 편의성 유료 도서 위주 유료 도서 위주 공개 논문 및 자료 많음 공개 논문 및 자료 많음 질의를 위한 공개 커뮤니티 NA NA 매우 활발 매우 활발 유지보수 쉽다 쉽다 어렵다 어렵다 2. 대화형 모드와 배치모드 대화형 모드 (interactive mode): 프롬프트에 코딩을 하여 결과를 바로 알 수 있음 배치모드 (batch mo..

[4과목] 데이터 분석 개요

1. 시각화 전통적 데이터 분석 과 빅데이터 분석의 차이는 "시각화" EDA과정은 시각화가 필수 2. 공간분석 공간분석(spatial analysis): 공간적 차원과 관련된 속성들을 시각화 3. 탐색적 자료 분석(EDA) 특이한 점이나 의미 있는 사실을 도출하고 분석의 최종 목적을 달성해가는 과정 구조적 관계를 알아가는 과정 4가지 주제: 저항성 강조, 잔차 계산, 자료변수의 재표현, 그래프를 통한 현시성 4. 통계분석 기술통계(descriptive statistics): 표본데이터에 대해 숫자나 그래프로 표현 추론통계(inferential statistics): 표본의 표본통계량으로 부터 모집단의 특성인 모수에 관해 통계적으로 추론 5. 데이터 마이닝 대용량 데이터에 대해 관계, 패턴, 규칙등을 탐색..

[3과목] 분석 거버넌스 체계 수립

1. 분석 거버넌스 체계 분석 거버넌스 체계 구성요소: Organization, Process, System, Data, Human Resource 분석 준비도의 6가지 구성요소: 분석업무 파악, 인력 및 조직, 분석기법, 분석 데이터, 분석 문화, IT 인프라 분석업무파악 발생한 사실 분석업무 예측 분석업무 시뮬레이션분석업무 최적화 분석업무 분석업무 정기적 개선 인력 및 조직 분석 전문가 직무 존재 분석 전문가 교육훈련프로그램 관리자들의 기본적인 분석능력 전사분석업무총괄조직존재 경영진의 분석업무 이해능력 분석업무 업무별 적합한 분석기법 사용 분석업무 도입방법론 분석기법 라이브러리 분석기법 효과성 평가 분석기법 정기적 개선 분석 데이터 분석업무를 위한 데이터 충분성 분석업무를 위한 데이터 신뢰성 분석업무..

[3과목] 마스터 플랜 수립 프레임 워크

1. 마스터 플랜 수립 프레임 워크 우선 순위 고려 요소 적용범위/방식 고려 요소 1) 우선 순위 평가 전략적 중요도: 전략적 필요성, 시급성 ROI관점: 투자비용 요소, 비즈니스 효과 투자비용 요소: volume, variety, velocity 비즈니스 효과: value * 우선순위 평가 기준: 시급성, 난이도 → '시급성'에 둔다면 3→4→2, '난이도'에 둔다면 3→1→2 실행용이성: 투자 용이성, 기술 용이성 2) 이행계획 수립 로드맵 수립: Stage 1: 데이터 분석체계 도입 Stage 2: 데이터 분석 유효성 검증 Stage 3: 데이터 분석 확산 및 고도화

[3과목] 분석과제 발굴 방법론

1. 분석과제 발굴 방법론 개요 하향식 접근법과 상향식 접근법 상향식 (바텀-업) 접근법의 대표적인 방법론: 프로토타입 모델 하향식 (탑-다운) 접근법의 대표적인 방법론: 폭포수 모델 최적의 의사결정은 두 접근방식의 상호 보완 관계 → 디자인 씽킹 2. 하향식 접근법 1) 문제 탐색 ① 비즈니스 모델 기반 문제 탐색 비즈니스 모델 캔버스를 활용한 과제 발굴 방법 5가지 영역 ② 분석 기회 발굴의 범위 확장 분석 기회 발굴의 범위 확장의 4가지 관점 - 거시적 관점의 메가 트렌드: STEEP (social, technological, economic, enviromental, political) - 경쟁자 확대 관점: 대체재, 경쟁자, 신규 진입자 - 시장의 니즈 탐색 관점: 고객, 채널, 영향자 - 역량..

[3과목] 분석 방법론

1. KDD 분석 방법론 KDD(Knowledge Discovery in Databases)는 데이터 마이닝 프로세스 KDD 분석 절차 (5가지 프로스세스) 1) 데이터셋 선택 (Selection) 2) 데이터 전처리 (Preprocessing) 3) 데이터 변환 (Transformation) 4) 데이터 마이닝 (Data Mining) 5) 데이터 마이닝 결과 평가 (Interpretation/Evaluation) 2. CRISP-DM 분석 방법론 CRISP-DM(Cross Industry Standard Process for Data Mining)은 계층적 프로세스 모델로 4개의 레벨과 6단계의 프로세스로 구성 4레벨 구조 6단계의 프로세스 1) 업무이해 (Business Understanding) ..

[ADP/ADsP] 필기 시험 접수 일정 및 고사장

제20회 데이터분석 전문가(ADP)-필기 · 입실시간 : 09:30 까지 · 접수기간 : 02.16(화) 10:00 ~ · 시험시간 : 10:00 부터 · 시 험 일 : 2021.03.13(토) · 고사장 No. 고사장명 주소 잔여좌석 1 ADP (서울) 성동공고 서울 중구 다산로 290 성동공업고등학교 387 2 ADP (부산) 세정고 부산 부산진구 양정로 88-12 세정고등학교 42 3 ADP (대구) 이곡중 대구 달서구 선원로37길 65 이곡중학교 38 4 ADP (인천) 산곡고 인천 부평구 원적로416번길 25 산곡고등학교 80 5 ADP (광주) 광주중 광주 서구 화개중앙로 60 광주중학교 33 6 ADP (대전) 충남여중 대전 중구 동서대로 1368 충남여자중학교 41 7 ADP (춘천) 춘천..

[3과목] 데이터 분석 기획의 이해

1. 분석 대상과 방법 분석은 분석의 대상과 분석의 방법에 따라 4가지로 나뉨 2. 목표 시점 별 분석 기획 방안 당면한 과제를 빠르게 해결하는 "과제 중심적인 접근 방식"과 지속적인 분석 내재화를 위한 "장기적인 마스터 플랜 방식"으로 나뉨 3. 분석 기획시 고려사항 가용 데이터 (Available data) 적절한 활용 방안과 유즈케이스 (Proper business use case) 장애요소들에 대한 사전 계획 수립 (Low barrier of execution) 4. 분석 방법론 개요 분석방법론의 필수 내용: 절차(procedures), 방법(methods), 도구와 기법(tools&techniques), 템플릿과 산출물(templates&outputs) 5. 분석 방법론 생성과정 6. 방법론의 ..

728x90
반응형