키워드분석 2

[시각화] 한국 위키피디아를 이용한 워드클라우드(wordcloud)

키워드 분석 - 한국 위키피디아를 이용한 워드클라우드 한국 wikipedia에서 키워드 추출을 위해서는 한국 자연어처리가 필요하다 필요 라이브러리: wordcloud, matplotlib, wikipediaapi from wordcloud import WordCloud import matplotlib.pyplot as plt import wikipediaapi - wikipedia와 wikipediaapi는 다른 라이브러리임 (참고: https://pypi.org/project/wikipedia/ 와 pypi.org/project/Wikipedia-API/ ) * wikipedia-api 라이브러리 설치방법 pip install wikipedia-api 코드 설명 - 한글일때 중요한건 읽을때 encodi..

[시각화] 위키피디아를 이용한 워드클라우드 구현(word cloud)

키워드 분석시 많이 쓰이는 방법이 두가지가 있다. (1) 키워드 네트워크 (keyword network) - 한 문장안에 어떠한 단워와 같이 언급되었는지를 확인 - 보통은 뉴스같은데에서 많이 쓰임 (2) 워드클라우드 (word cloud) 태그 클라우드(영어: tag cloud) 또는 워드 클라우드(word cloud)는 메타 데이터에서 얻어진 태그들을 분석하여 중요도나 인기도 등을 고려하여 시각적으로 늘어 놓아 웹 사이트에 표시하는 것이다. 보통은 2차원의 표와 같은 형태로 태그들이 배치되며 이때 순서는 알파벳/가나다 순으로 배치 된다. 시각적인 중요도를 강조를 위해 각 태그들은 그 중요도(혹은 인기도)에 따라 글자의 색상이나 굵기등 형태가 변한다. 사용자는 이렇게 표시된 태그 중 마음에 드는 키워드를..

728x90
반응형