본문 바로가기
2023-4/졸업 논문

[성능평가] 협업필터링 데이터셋 만들기

by 이망고_ 2023. 4. 11.

 

성능평가 

1. 타깃논문 구현

2. 가장 기본적인 추천방법인 협업필터링 을 진행하려고 했는데

해당 데이터에는 평점 점수가 존재하지 않았다.

 

협업필터링의 경우, 사용자들이 평가한 아이템의 평점을 기반으로 추천을 수행하는 방식이다.

그렇기에 데이터셋에 평점이 없는 경우 추천을 수행하는 것이 어렵다.

두가지 방법이 있었다.

1. 임의로 평점 점수 부여하기

2. 평점이 없는 경우에도 추천을 수행할 수 잇는 방식으로 구현하기 : 인기도 기반 추천, 콘텐츠 기반 추천, 하이브리드 추천(두방법 조합)

 

우선은, 1번으로 평점을 임의로 부여하기로 하였다.

그냥 떠오르는 게 랜덤.. 하지만 후에 유저에게 추천을 해줄 때 오차가 너무 심할 것 같았고,

일반적으로 평점 정보를 생성할 수 있는 방법을 채택하였다.

가장 간단한 방법인 : 사용자가 방문한 장소의 수를  평점으로 사용하였다

 

우선은 데이터셋 100개로 진행하였고 잘 생성이 된 듯 보여서 실제 20만개의 데이터셋에도 점수를 부여한 후에,

협업필터링을 해주려고 한다. 

'2023-4 > 졸업 논문' 카테고리의 다른 글

[성능평가] keyerror  (0) 2023.04.11
[성능평가] 협업필터링  (0) 2023.04.11
클러스터링과 분류  (0) 2023.04.06
데이터 전처리  (0) 2023.03.22
학위논문 아이디어  (0) 2023.03.02