본문 바로가기
2021-1/Expert

쥬피터 노트북 | LDA 실습

by 이망고_ 2021. 10. 14.

코드 하나하나 구동이 잘 되는지

오류가 어디 줄line 에서 났는지 확안하기 위해 쥬피터 노트북을 사용하려고 한다.

 

cmd 에서 인스톨하려고 하는데 꿀팁이 있어 남겨 놓는다

! pip install 라이브러리
! conda install 라이브러리

설치 할 때 pip 혹은 conda 를 install 하여 사용하는 것은 기본! 

cmd 에서 설치하는 명령어 그대로 쥬피터 노트북에서도 사용이 가능한데,

앞에 ! 를 붙여주면 커맨드창(cmd)에서 입력하는 것과 동일하게 처리해줘~ 라는 뜻이라고 한다!

 

* 어쩐지 쥬피터 노트북에서 이것저것 눌러보다 ! 를 붙이니 색이 변하더라( 색이 변하는 것은 def 등 무슨 의미를 내포하고 있는 것임)

단어들의 출력이 아니라 한 단어만 출력되는 오류 발생

같은 코드 같은데 뭐는 시뮬 하나만 토큰화되어서 나오고

위의 코드는 데이터에서 모두 토큰화되어서 나오더라

이유가 뭔지 계속 다시 따라 적었다.

 

 

이게 바로 전의 코드

 

* 한 번 추측해보자 

리스트에서 단어들이 토큰화되어서 나와야 하는데, 왜 첫 번째 단어만 토큰화되어서 나오고 끝이 날까

 

 

 

 

 

 

답은, for 문에서 return 이 위의 코드는 잘 매칭이 되었고

아래 코드는 for 문 속의 if 문에 return 이 매칭되어 있었다. 그러니 for 반복문에서 반복이 되서 출력이 되지 않았던 것이다. 반복문이 실행되지 않았으니 결과는 첫 번째 단어만 하나 달랑 출력되고 말게 되었다. 

마지막 단계인 시각화 단계에서 막힌다?

pyLDAvis  모듈이 없다고 나와서 깔아보니~ 명칭이 이것이 아니었다

  • ! pip install -c ehremo pyldavis 
  • (쥬피터노트북이니 ! : 코맨드창(cmd)에서는 느낌표 없이 pip/conda install 로 실행해주면 됨~)

LDA 시각화 완성

'2021-1 > Expert' 카테고리의 다른 글

LDA | Delete Korean Stopword  (0) 2021.10.23
LDA | 혼자 구현해보기  (0) 2021.10.14
LDA | 실습하기  (0) 2021.10.14
LDA | 실습하기  (0) 2021.10.13
LDA | DTM, TF-IDF  (0) 2021.10.13