본문 바로가기
2022-2/논문 아이디어

A Point-of-Interest Recommendation Method ExploitingSequential, Category and Geographical Influence

by 이망고_ 2022. 8. 30.

이전에 랩세미나세에서 발표했던 논문이 poi 추천을 고려한 요소가 사람의 기억력 요소와 협업필터링을 통하여 유저간의 유사도를 분석하여 제안한 것이었다.

그 논문에서도 지리적 요소를 포함하지 않았다고 언급하고 있었고, 이 논문의 경우 지리적 요소를 고려하였다.

(심지어 kde 커널 밀도 추정을 통해 개인이 가지고 있는 지리적 선호 경향의 유사성을 고려하였고, a 알파로 하여금 지리적인 물리적 특성을 나라마다 다르게 가중치를 두었다. 가중치는 0부터 1까지로 설정가능하다)

 

1. s: 특징은 유저가 순차적으로 방문한 poi를 고려하여 순차적 패턴을 고려하였고, 어느 시간대에 방문하였는지 하루 중의 시간대를 4개의 t구간으로 나누어서 고려해주었다.

2. c : 또한 유저의 유사도를 단순히 코사인 유사도로 측정하지 않고, 위에 언급하였던 순차 패턴을 이들이 가상의 순차도를 만들었고 유사도를 poi 의 갯수로 나누어주었다. 그리고 이들이 주장하는 것이 트래블러의 경우 호텔 방문이 잦고, 학생의 경우 도서관의 방문이 잦다고 이야기 하고 있다. 그래서 idf 공통적인 단어 언급을 통해 카테고리를 나누어주었다. 유저의 유사도 분석에서 유저들의 카테고리까지 고려하여, 해당 카테고리의 유저라면 1를 주고, 아니라면 0값을 주었다.

3. g : 지리적 요인을 함께 고려해주었다. a알파로 하여금 지리적으로 물리적으로 특성이 다름을 다른 가중치로 표현을 해주었고, 0~1까지의 가중치를 부여할 수 있다. 그리고 지리적 특성은 개인마다 다르다고 말하고 있었다. 어떤 사람의 경우 10km 반경의 poi를 선호하고, 다른 이의 경우 30km반경이내를 선호할 수 있다는 것이다. 이러한 본질적이고 개인의 특성을 반영할 수 있는 수식으로 kde커널밀도추정 이 존재한다. 저자들은 kde 중 가우시안 분포도를 선택하여 개인의 지리적 선호도 유사도가 비슷한 유저 또한 고려하게 된다. 

 

간단한 프레임워크는 이러하다.

 

 

또 다른 요소는 워드 임베딩에 사용한 cbow 모델(인공신경망)을 사용하였다는 점이다.

이 모델은 주로 단어 임베딩에 사용되는 기술로, 주변 단어를 통해 중심 단어를 예측할 수 있는 방법인데, 이를 central poi 를 찾는 데 사용하였다는 점이 흥미롭다. 

 

 

아이디어로 활용가능하다면,

이전 poi 첫 논문으로 랩세를 진행하였을 때 사람의 기억력 감퇴에 의해 poi 에 영향을 준다는 내용의 논문을 발표하였다.

이 때 지도 교수님께서 의문점을 가지신 부분이 사람마다 개인의 기억력 감소의 효과가 다를 것인데 이를 반영하지는 않았느냐, 였다.

 

이번 논문에서 본질, 혹은 개인의 특성을 고려하는 수식인 kde 개념을 배웠는데, 사람의 기억력을.. 데이터화 해서 kde 를 적용시킬 수 있을런지 모르겠다. 다만, 드는 생각은 kde 개념을 고려하면 개인의 기억력 감퇴 효과도 개인의 차마다 고려할 수는 있겠다, 였다. 

 

이를 어떻게 적용시킬 수 있을까.

이것이 또한 아이디어가 될 수 있을까.

기억력은 아이큐에 의존하는지, 평균적으로 대학이나 학력을 통해 비슷한 기억력을 가지고 있다고 유사성을 표현해도 되는지 

 

아이디어를 덧붙여도, 한 번 여쭈어 봐도 좋을 것 같다. 

 

 

(오랜만에 쓰는 블로그.. 

이제 1년차 여름방학이 갔고, 

반성은 공세나 영세를 꾸준히 진행하고 있었음에도 블로그에 게시하지 않은 게으름..

 

이제 2학년이 되었고, 벌써 개강이다.

3학기에는 좀 더 부지런하고 학업과 연구에 집중할 수 있는 내가 되기를)