시각화 2

[4과목] 데이터 분석 개요

1. 시각화 전통적 데이터 분석 과 빅데이터 분석의 차이는 "시각화" EDA과정은 시각화가 필수 2. 공간분석 공간분석(spatial analysis): 공간적 차원과 관련된 속성들을 시각화 3. 탐색적 자료 분석(EDA) 특이한 점이나 의미 있는 사실을 도출하고 분석의 최종 목적을 달성해가는 과정 구조적 관계를 알아가는 과정 4가지 주제: 저항성 강조, 잔차 계산, 자료변수의 재표현, 그래프를 통한 현시성 4. 통계분석 기술통계(descriptive statistics): 표본데이터에 대해 숫자나 그래프로 표현 추론통계(inferential statistics): 표본의 표본통계량으로 부터 모집단의 특성인 모수에 관해 통계적으로 추론 5. 데이터 마이닝 대용량 데이터에 대해 관계, 패턴, 규칙등을 탐색..

[시각화] 위키피디아를 이용한 워드클라우드 구현(word cloud)

키워드 분석시 많이 쓰이는 방법이 두가지가 있다. (1) 키워드 네트워크 (keyword network) - 한 문장안에 어떠한 단워와 같이 언급되었는지를 확인 - 보통은 뉴스같은데에서 많이 쓰임 (2) 워드클라우드 (word cloud) 태그 클라우드(영어: tag cloud) 또는 워드 클라우드(word cloud)는 메타 데이터에서 얻어진 태그들을 분석하여 중요도나 인기도 등을 고려하여 시각적으로 늘어 놓아 웹 사이트에 표시하는 것이다. 보통은 2차원의 표와 같은 형태로 태그들이 배치되며 이때 순서는 알파벳/가나다 순으로 배치 된다. 시각적인 중요도를 강조를 위해 각 태그들은 그 중요도(혹은 인기도)에 따라 글자의 색상이나 굵기등 형태가 변한다. 사용자는 이렇게 표시된 태그 중 마음에 드는 키워드를..

728x90
반응형