Tokenize1 word2vector를 통한 단어 임베딩과 K-means로 클러스터링, 신규 데이터 예측까지-1 뉴스기사를 모으고 뉴스 제목을 word2vec 알고리즘으로 임베딩한후 k-means를 적용하여 클러스터링 해보았다. 그리고 새로 들어오는 기사들은 이미 클러스터링 되어있는 k-means 학습모델에 따라 재분류 되어지도록 하는 방법이다. 여러 블로그나 구글링을 통해서 보게되면 안되는경우도 많이 있고 새롭게 적용해야할 것들이 많다보니 아.. 너무 어렵더라.... 하지만... 여기 기록되는 내용들 또한 불친절한 내용들이 많을것이다ㅠ 코드만 가지고 따라하긴 어려울것이다 기초적인 내용들을 아시는분들에 한해서만 보시길... 여기 기록되는 내용은 3단계에 거쳐서 진행될 것이다. 그안에서도 중복되는 내용이 많으므로 간략하게 설명해보겠다. 여기에 적용된 개발 환경을 보자면! windows 환경 python 3.7 gen.. 2020. 5. 8. 이전 1 다음