데이터사이언스/시각화 5

[오류] matplotlib 한글깨짐 해결 (2)

기존 블로그에서 안되는 경우들이 발생한다. -> 대부분 font의 경로를 못잡는 경우이다. 2021/01/15 - [시각화] - [오류] matplotlib 한글깨짐 해결 (1) [오류] matplotlib 한글깨짐 해결 (1) 한글을 분석할때 발생하는 현상인 한글 깨짐 현상을 해결해보자. 현상은 다음과 같다. 필요 라이브러리: matplotlib 우선 matplotllib을 import해야된다. * 일반적으로 matplotlib내 pyplot 모듈을 쓰고, 보통 databonanza.tistory.com 이럴때는 font의 경로를 직접잡아주자! 필요라이브러리: matplotlib matplotlib에서는 font_manager라는 모듈이 있다. 1. 사용할 수 있는 font 경로 확인 import ma..

[matplotlib] matplotlib 한글깨짐 해결 (1)

한글을 분석할때 발생하는 현상인 한글 깨짐 현상을 해결해보자. 현상은 다음과 같다. 필요 라이브러리: matplotlib 우선 matplotllib을 import해야된다. * 일반적으로 matplotlib내 pyplot 모듈을 쓰고, 보통은 plt로 정의한다. import matplotlib.pyplot as plt plt.text(0.5,0.5,'한글') plt.xlabel('시간') plt.ylabel('값') plt.show() 그림과 같이 한글이 깨진다. (그림 내 한글 표시, x축, y축 라벨 등) 1. 한글 폰트 받기 - 우리에 Naver 형님들은 한글폰트를 무료로 배포하고 있다. - 다운로드: hangeul.naver.com/2017/nanum [네이버 한글한글 아름답게 : 글꼴모음] 한글의..

[시각화] 한국 위키피디아를 이용한 워드클라우드(wordcloud)

키워드 분석 - 한국 위키피디아를 이용한 워드클라우드 한국 wikipedia에서 키워드 추출을 위해서는 한국 자연어처리가 필요하다 필요 라이브러리: wordcloud, matplotlib, wikipediaapi from wordcloud import WordCloud import matplotlib.pyplot as plt import wikipediaapi - wikipedia와 wikipediaapi는 다른 라이브러리임 (참고: https://pypi.org/project/wikipedia/ 와 pypi.org/project/Wikipedia-API/ ) * wikipedia-api 라이브러리 설치방법 pip install wikipedia-api 코드 설명 - 한글일때 중요한건 읽을때 encodi..

[시각화] 위키피디아를 이용한 워드클라우드 구현(word cloud)

키워드 분석시 많이 쓰이는 방법이 두가지가 있다. (1) 키워드 네트워크 (keyword network) - 한 문장안에 어떠한 단워와 같이 언급되었는지를 확인 - 보통은 뉴스같은데에서 많이 쓰임 (2) 워드클라우드 (word cloud) 태그 클라우드(영어: tag cloud) 또는 워드 클라우드(word cloud)는 메타 데이터에서 얻어진 태그들을 분석하여 중요도나 인기도 등을 고려하여 시각적으로 늘어 놓아 웹 사이트에 표시하는 것이다. 보통은 2차원의 표와 같은 형태로 태그들이 배치되며 이때 순서는 알파벳/가나다 순으로 배치 된다. 시각적인 중요도를 강조를 위해 각 태그들은 그 중요도(혹은 인기도)에 따라 글자의 색상이나 굵기등 형태가 변한다. 사용자는 이렇게 표시된 태그 중 마음에 드는 키워드를..

728x90
반응형