본문 바로가기

전체 글286

쥬피터 노트북 | LDA 실습 코드 하나하나 구동이 잘 되는지 오류가 어디 줄line 에서 났는지 확안하기 위해 쥬피터 노트북을 사용하려고 한다. cmd 에서 인스톨하려고 하는데 꿀팁이 있어 남겨 놓는다 ! pip install 라이브러리 ! conda install 라이브러리 설치 할 때 pip 혹은 conda 를 install 하여 사용하는 것은 기본! cmd 에서 설치하는 명령어 그대로 쥬피터 노트북에서도 사용이 가능한데, 앞에 ! 를 붙여주면 커맨드창(cmd)에서 입력하는 것과 동일하게 처리해줘~ 라는 뜻이라고 한다! * 어쩐지 쥬피터 노트북에서 이것저것 눌러보다 ! 를 붙이니 색이 변하더라( 색이 변하는 것은 def 등 무슨 의미를 내포하고 있는 것임) 단어들의 출력이 아니라 한 단어만 출력되는 오류 발생 같은 코드 같은데 .. 2021. 10. 14.
LDA | 실습하기 응 내가 하면 안되고 남이 하면 되고~ 엊그제 그 놈의 gensim 이 계속 안 깔려서 LDA 실습을 못했는데 선배가 도와주니 그냥 됨 잘 됨 LDA gensim 오류 해결 cmd - pip install gensim (혹은 cmd - conda install gensim) !! 리눅스 체제를 이용해서 필요한 패키지를 다운받아주는데, 콘다에 웬만한 패키지가 있다고 해서 콘다 인스톨로 필요한 패키지를 담에 깔아보려고 한다~ (cmd) conda activate test : test 가상환경을 만들어줘서 실행 쌉가능 (cmd) conda acivate base : 기본적으로 실행되고 있는 base 환경 예를 들어 판다스 라는 패키지를 깔아주려고 한다! 1, 2순으로 입력하여 실행~ 1. (cmd) conda.. 2021. 10. 14.
LDA | 실습하기 마지막으로 시각화하는 단계이다 (lda_model, bow_corpus, dictionary) : lda 모델로 진행하고, Bag of Words 를 이용하여 단어의 등장빈도를 알고, 딕셔너리 형태로 지정해준다. 역시 시각화 할 때가 가장 짜릿하다.. 우측에 파란색 막대는 전체 워드에서 차지하는 빈도수를 의미하고 빨간색 막대는 해당 토픽에서 등장하는 특정단어의 빈도수를 의미한다~ 2021. 10. 13.
LDA | DTM, TF-IDF https://conanmoon.medium.com/%EB%8D%B0%EC%9D%B4%ED%84%B0%EA%B3%BC%ED%95%99-%EC%9C%A0%EB%A7%9D%EC%A3%BC%EC%9D%98-%EB%A7%A4%EC%9D%BC-%EA%B8%80%EC%93%B0%EA%B8%B0-58-8f05f611d783 데이터과학 유망주의 매일 글쓰기 — 58 Topic Modelling conanmoon.medium.com 공부하다가 토픽모델링 코드작성 등이 너무 잘 정리되어 있어서 참고하라고 남겨놓는다. 하나하나 코드의 의미를 알려주는 것부터 코드작성하는 순서를 상세하게 다루고 있어 LDA 실습하는 데 큰 도움이 되었다. Topic Modeling 추상적인 의미(Topic)를 찾을 수 있는 통계적 모델링 기법.. 2021. 10. 13.