데이터분석 전문가 35

[4과목] R기초

1. 데이터 분석 도구의 현황 분석도구 비교 SAS SPSS R Python 프로그램 비용 유료, 고가 유료, 고가 오픈소스, 무료 오픈소스, 무료 설치용량 대용량 대용량 모듈화로 간단 모듈화로 간단 (배우기 쉬움) 다양한 모듈 지원 및 비용 별도구매 별도구매 오픈소스 오픈소수 최신 알고리즘 및 기술반영 느림 다소 느림 매우 빠름 매우 빠름 (기계학습에 능숙) 학습자료 입수의 편의성 유료 도서 위주 유료 도서 위주 공개 논문 및 자료 많음 공개 논문 및 자료 많음 질의를 위한 공개 커뮤니티 NA NA 매우 활발 매우 활발 유지보수 쉽다 쉽다 어렵다 어렵다 2. 대화형 모드와 배치모드 대화형 모드 (interactive mode): 프롬프트에 코딩을 하여 결과를 바로 알 수 있음 배치모드 (batch mo..

[4과목] 데이터 분석 개요

1. 시각화 전통적 데이터 분석 과 빅데이터 분석의 차이는 "시각화" EDA과정은 시각화가 필수 2. 공간분석 공간분석(spatial analysis): 공간적 차원과 관련된 속성들을 시각화 3. 탐색적 자료 분석(EDA) 특이한 점이나 의미 있는 사실을 도출하고 분석의 최종 목적을 달성해가는 과정 구조적 관계를 알아가는 과정 4가지 주제: 저항성 강조, 잔차 계산, 자료변수의 재표현, 그래프를 통한 현시성 4. 통계분석 기술통계(descriptive statistics): 표본데이터에 대해 숫자나 그래프로 표현 추론통계(inferential statistics): 표본의 표본통계량으로 부터 모집단의 특성인 모수에 관해 통계적으로 추론 5. 데이터 마이닝 대용량 데이터에 대해 관계, 패턴, 규칙등을 탐색..

[3과목] 분석 거버넌스 체계 수립

1. 분석 거버넌스 체계 분석 거버넌스 체계 구성요소: Organization, Process, System, Data, Human Resource 분석 준비도의 6가지 구성요소: 분석업무 파악, 인력 및 조직, 분석기법, 분석 데이터, 분석 문화, IT 인프라 분석업무파악 발생한 사실 분석업무 예측 분석업무 시뮬레이션분석업무 최적화 분석업무 분석업무 정기적 개선 인력 및 조직 분석 전문가 직무 존재 분석 전문가 교육훈련프로그램 관리자들의 기본적인 분석능력 전사분석업무총괄조직존재 경영진의 분석업무 이해능력 분석업무 업무별 적합한 분석기법 사용 분석업무 도입방법론 분석기법 라이브러리 분석기법 효과성 평가 분석기법 정기적 개선 분석 데이터 분석업무를 위한 데이터 충분성 분석업무를 위한 데이터 신뢰성 분석업무..

[3과목] 마스터 플랜 수립 프레임 워크

1. 마스터 플랜 수립 프레임 워크 우선 순위 고려 요소 적용범위/방식 고려 요소 1) 우선 순위 평가 전략적 중요도: 전략적 필요성, 시급성 ROI관점: 투자비용 요소, 비즈니스 효과 투자비용 요소: volume, variety, velocity 비즈니스 효과: value * 우선순위 평가 기준: 시급성, 난이도 → '시급성'에 둔다면 3→4→2, '난이도'에 둔다면 3→1→2 실행용이성: 투자 용이성, 기술 용이성 2) 이행계획 수립 로드맵 수립: Stage 1: 데이터 분석체계 도입 Stage 2: 데이터 분석 유효성 검증 Stage 3: 데이터 분석 확산 및 고도화

[3과목] 분석과제 발굴 방법론

1. 분석과제 발굴 방법론 개요 하향식 접근법과 상향식 접근법 상향식 (바텀-업) 접근법의 대표적인 방법론: 프로토타입 모델 하향식 (탑-다운) 접근법의 대표적인 방법론: 폭포수 모델 최적의 의사결정은 두 접근방식의 상호 보완 관계 → 디자인 씽킹 2. 하향식 접근법 1) 문제 탐색 ① 비즈니스 모델 기반 문제 탐색 비즈니스 모델 캔버스를 활용한 과제 발굴 방법 5가지 영역 ② 분석 기회 발굴의 범위 확장 분석 기회 발굴의 범위 확장의 4가지 관점 - 거시적 관점의 메가 트렌드: STEEP (social, technological, economic, enviromental, political) - 경쟁자 확대 관점: 대체재, 경쟁자, 신규 진입자 - 시장의 니즈 탐색 관점: 고객, 채널, 영향자 - 역량..

[3과목] 분석 방법론

1. KDD 분석 방법론 KDD(Knowledge Discovery in Databases)는 데이터 마이닝 프로세스 KDD 분석 절차 (5가지 프로스세스) 1) 데이터셋 선택 (Selection) 2) 데이터 전처리 (Preprocessing) 3) 데이터 변환 (Transformation) 4) 데이터 마이닝 (Data Mining) 5) 데이터 마이닝 결과 평가 (Interpretation/Evaluation) 2. CRISP-DM 분석 방법론 CRISP-DM(Cross Industry Standard Process for Data Mining)은 계층적 프로세스 모델로 4개의 레벨과 6단계의 프로세스로 구성 4레벨 구조 6단계의 프로세스 1) 업무이해 (Business Understanding) ..

[ADP/ADsP] 필기 시험 접수 일정 및 고사장

제20회 데이터분석 전문가(ADP)-필기 · 입실시간 : 09:30 까지 · 접수기간 : 02.16(화) 10:00 ~ · 시험시간 : 10:00 부터 · 시 험 일 : 2021.03.13(토) · 고사장 No. 고사장명 주소 잔여좌석 1 ADP (서울) 성동공고 서울 중구 다산로 290 성동공업고등학교 387 2 ADP (부산) 세정고 부산 부산진구 양정로 88-12 세정고등학교 42 3 ADP (대구) 이곡중 대구 달서구 선원로37길 65 이곡중학교 38 4 ADP (인천) 산곡고 인천 부평구 원적로416번길 25 산곡고등학교 80 5 ADP (광주) 광주중 광주 서구 화개중앙로 60 광주중학교 33 6 ADP (대전) 충남여중 대전 중구 동서대로 1368 충남여자중학교 41 7 ADP (춘천) 춘천..

[3과목] 데이터 분석 기획의 이해

1. 분석 대상과 방법 분석은 분석의 대상과 분석의 방법에 따라 4가지로 나뉨 2. 목표 시점 별 분석 기획 방안 당면한 과제를 빠르게 해결하는 "과제 중심적인 접근 방식"과 지속적인 분석 내재화를 위한 "장기적인 마스터 플랜 방식"으로 나뉨 3. 분석 기획시 고려사항 가용 데이터 (Available data) 적절한 활용 방안과 유즈케이스 (Proper business use case) 장애요소들에 대한 사전 계획 수립 (Low barrier of execution) 4. 분석 방법론 개요 분석방법론의 필수 내용: 절차(procedures), 방법(methods), 도구와 기법(tools&techniques), 템플릿과 산출물(templates&outputs) 5. 분석 방법론 생성과정 6. 방법론의 ..

[2과목] 클라우드 인프라 기술 - 2

1. 메모리 가상화: VMware 기법 VMware는 한대의 컴퓨터로 마치 여러 대의 컴퓨터를 사용하는 것 같은 가상의 공간을 만들어 주는 프로그램 VMware는 하이퍼바이저 내에 Shadow Page Table을 별도로 두어 VPN과 MPN의 중간 변환 과정을 가로챔 (매핑) 매핑 연산을 하드웨어적으로 도와주는 것을 TLB(Translation Lookaside Buffer) 하이퍼바이저의 핵심 모듈은 VMkernel VMkernel: 서비스 콘솔, 디바이스 드라이버들의 메모리 영역을 제외한 나머지 전체 메모리 영역을 모두 관리하면서 가상머신에 메모리를 할당 * 예시) 가상 머신 메모리 할당 - 예를 들어, 여러 개의 가상머신이 동시에 수행중인 경우라면 위의 그림과 같은 메모리 사용 상황이 발생할 수 ..

[2과목] 클라우드 인프라 기술 - 1

1. 클라우드 컴퓨팅 Infrastructure as a Service(IaaS, 아이아스, 이에스) IaaS는 컴퓨팅, 네트워킹, 스토리지 및 기타 인프라스트럭처를 사용하기 위한 서비스이며, 사용자는 필요할 때마다 서비스를 통해 리소스를 구입 Platform as a Service(PaaS, 파스) PaaS는 사용자 정의 응용 프로그램을 개발하고 사용할 수 있는 개발자를 위한 프레임워크를 제공 Software as a Service(SaaS, 사스) SaaS는 타사 공급 업체가 관리하는 사용자에게 응용 프로그램을 제공하기 위해 인터넷을 사용 서버 가상화: 물리적인 서버와 운영체제 사이에 적절한 계층을 추가해 서버를 사용하는 사용자에게 물리적인 자원은 숨기고 논리적인 자원만 보여주는 기술 서버 가상화의 ..

728x90
반응형