데이터사이언스 27

[시각화] 한국 위키피디아를 이용한 워드클라우드(wordcloud)

키워드 분석 - 한국 위키피디아를 이용한 워드클라우드 한국 wikipedia에서 키워드 추출을 위해서는 한국 자연어처리가 필요하다 필요 라이브러리: wordcloud, matplotlib, wikipediaapi from wordcloud import WordCloud import matplotlib.pyplot as plt import wikipediaapi - wikipedia와 wikipediaapi는 다른 라이브러리임 (참고: https://pypi.org/project/wikipedia/ 와 pypi.org/project/Wikipedia-API/ ) * wikipedia-api 라이브러리 설치방법 pip install wikipedia-api 코드 설명 - 한글일때 중요한건 읽을때 encodi..

[시각화] 위키피디아를 이용한 워드클라우드 구현(word cloud)

키워드 분석시 많이 쓰이는 방법이 두가지가 있다. (1) 키워드 네트워크 (keyword network) - 한 문장안에 어떠한 단워와 같이 언급되었는지를 확인 - 보통은 뉴스같은데에서 많이 쓰임 (2) 워드클라우드 (word cloud) 태그 클라우드(영어: tag cloud) 또는 워드 클라우드(word cloud)는 메타 데이터에서 얻어진 태그들을 분석하여 중요도나 인기도 등을 고려하여 시각적으로 늘어 놓아 웹 사이트에 표시하는 것이다. 보통은 2차원의 표와 같은 형태로 태그들이 배치되며 이때 순서는 알파벳/가나다 순으로 배치 된다. 시각적인 중요도를 강조를 위해 각 태그들은 그 중요도(혹은 인기도)에 따라 글자의 색상이나 굵기등 형태가 변한다. 사용자는 이렇게 표시된 태그 중 마음에 드는 키워드를..

[window] 운영체제 환경 확인 방법 (32비트, 64비트?)

여러가지 프로그램을 깔을때, 32비트인지 64비트인지는 중요하다. 64비트 같은경우에 더 높은 프로세스로 인해 32비트로 만들어진 프로그램이 실행이 가능한데, 32비트 같은경우 64비트기반 프로그램은 실행이 안된다. (그래서 보통 64비트 프로그램은 32비트용 64비트용이 나눠져 있다) 확인방법은 1. 윈도우 탐색기 > 내PC > 오른쪽마우스 > 속성 2. 시스템 종류 확인 내 PC같은 경우 Windows10 64비트 운영체제 인 것을 확인할 수 있다.

[오류] 모듈 설치시 SSL: CERTIFICATE_VERIFY_FAILED 발생

회사같은 경우에 외부망을 방화벽으로 막아놨다. Anaconda promt롤 통해 모듈 설치시(pip install / conda install) 아래와 같은 에러메서지가 발생한다. “connection error: [SSL: CERTIFICATE_VERIFY_FAILED] certificate verify failed” 해결방법은 크게 2가지이다. 방법1. SSL Verify 해제 Anaconda promt롤 통해 설치시 미리 코드를 하나 더 넣는다. $ conda config --set ssl_verify false $ conda install pip 설치패키지 예를들어 tensorflow를 설치하면 $ conda install pip tensorflow 입력하면 된다. 방법 2. URL로 바로 설치 ..

[python] 아나콘다 설치

파이썬(Python)은 프로그래밍 언어로, 파이썬언어를 쉽게 사용할 수 있는 통합개발환경 (IDE: Integrated Development Environment)을 통해 구동된다. *IDE는 에디터(editor)라고도 함 파이썬을 사용하는 방법은 크게 두가지이다. (설치 환경 window 10 64bit) 1) 파이썬 + IDE (예: Pycharm) 따로 설치 2021/01/05 - [Python] - [python] 파이썬 + 파이참 설치 [python] 파이썬 + 파이참 설치 파이썬(Python)은 프로그래밍 언어로, 파이썬언어를 쉽게 사용할 수 있는 통합개발환경 (IDE: Integrated Development Environment)을 통해 구동된다. *IDE는 에디터(editor)라고도 함 ..

[python] 파이썬 + 파이참 설치

파이썬(Python)은 프로그래밍 언어로, 파이썬언어를 쉽게 사용할 수 있는 통합개발환경 (IDE: Integrated Development Environment)을 통해 구동된다. *IDE는 에디터(editor)라고도 함 파이썬을 사용하는 방법은 크게 두가지이다. (설치 환경 window 10 64bit) 1) 파이썬 + IDE (예: Pycharm) 따로 설치 ① 파이썬 다운로드: www.python.org/downloads/ * Python은 3.x와 2.x가 있으나, Python 3.x버전으로 설치! * 참고) Tensorflow 2.2이상 구동시 Python 3.8 설치 ② 파이참 다운로드: www.jetbrains.com/pycharm/download/#section=windows - IDE에..

About Me

국내 제조 대기업(하는 행태는 소기업) 데이터분석팀에서 밥벌이 하고 있는 Bonanza입니다. 머신러닝 데이터 분석으로 밥벌이를 한지 이제 8년정도가 되어가니, 논문도 쓰고 특허도 내고 그럽니다. (사실 대학원에서 공부한 것까지 포함이예요) #쓸데없이가방끈만김 밥벌이는 하는데, 잘하는지는 모르겠어요. 주 업무는 정도 되는것 같고요. * 제조업에서의 인공지능에 대해 기대감이 많은게 사실이다. 그러나 모든 제조업이 마찬가지겠지만, 아직 제조업에 인공지능이 적용하기엔 어려움이 많은게 사실이다. 대표적인 문제로 ① 기업의 목표는 수익창출 → 인공지능이 수익창출/비용절감에 도움이 될까? ② 인공지능은 SW에 개념이지만, 실제 적용은 HW+SW의 결합의 한계성 ③ 제조업은 숙련된 기계/전기 전문가(장이)도 완벽히 ..

728x90
반응형