코사인유사도 2

리뷰의 의미적 토픽분류를 적용한 감성분석 모델

논문명: 리뷰의 의미적 토픽 분류를 적용한 감성분석 모델 저자: 임명진, 김판구, 신주현 저널: 스마트미디어 저널 발간일: 2020년 06월 드라마 리뷰 데이터를 대상으로 "토픽 별" 감성분석을 수행한 논문이다. ▶ 분석 프로세스 및 결과 분석 프로세스와 과정 별 결과는 다음과 같다. 1. LDA (Latent Dirichlet Allocation) 리뷰데이터들을 대상으로 LDA토픽모델링을 수행한다. 문서 내 주제 분포 분석 및 주제 내 단어 분포를 분류하기 위해 LDA를 사용했다. LDA를 사용해 토픽간 관련성을 최소로하는 토픽을 총 3가지 도출하였다. 2. Semantic Topic Reclassification 해당 논문에서 눈 여겨 보았던 부분이다. LDA를 통해 데이터를 토픽 별로 분류하였는데,..

코사인 유사도(cosine similarity)/ 파이썬 구현

▶ 코사인 유사도란? 우리는 벡터 간 유사도를 측정함으로써 두 벡터가 얼마나 비슷한지를 알 수 있다. 그 유사도를 측정하는 방법 중 하나가 코사인 유사도이다. 벡터가 "유사하다"는 것은 두 벡터의 길이와 방향이 비슷한 방향과 길이를 가진다는 의미이다. 코사인 유사도는 두 벡터의 방향, 즉 각도에 기초해서 유사도를 측정한다. 다음과 같은 좌표들을 가진 세 벡터가 있다고 해보자. 그림을 보면 A벡터와 B벡터가 A와 C벡터는 유사할 것으로 보인다. 코사인 유사도로 측정하였을 때에도 우리의 추측과 일치하는지 알아보자. ▶ 코사인 유사도 공식 이때 각도 theta, 즉 v1과 v2 사이의 각도가 0에서 90도 사이이면 코사인 값이 +값이 나오고 90에서 180도 사이로 둔각이면 -값이 나온다. 따라서 코사인 유사..