[POI4] 가우시안 커널 밀도함수와 멱함수
마지막 논문인 이번 논문에서 특이한 점은 유저의 집단을 활성집단, 비활성집단으로 나눈 것이다.
이렇게 나누는 것이 딱 잘라서 얘는 얘다, 쟤는 쟤다, 라고 나누기에는 애매모호한 부분이 있어 퍼지이론을 사용하였다.
퍼지 클러스터링 이론은 컴퓨터가 이러한 애매모호함을 인식하도록 군집화하는 이론인데
키나 몸무게 등 어느 집단에 속한다고 말하기가 애매한 측도를 클러스터링할 때 사용한다.
간단히 말하자면, 비유사성 정도를 사용하여 군집해준다.
이때 활성 유저 집단을 가우시안 커널 밀도함수로 분포시켜준다.
비활성 집단은 멱함수의 이론을 따른다고 이야기하는데,
멱함수를 잠시 검색해보니 음.. 인간 행동에 있어서 버스트(폭발적인 증가)가 있게 되는데, 이는 사람들의 일상 패턴에서 우선순위가 정해져 있기에 멱함수 분포를 따르게 된다고 한다.
이해한 바로는, 우리가 직장이나 학교에서 주된 생활을 하고 하루나 주중에 우리에게 남은 시간은 한정적이게 되는데 이 시간동안 대체적으로 우리는 유사한 행동패턴을 띄게 된다고 한다.
일상 생활 중에서 우선순위에 따라 행동을 하고, 남은 유효한 시간에 버스트하여 우선순위대로 일을 몰아서 하게 된다는.. 맞는 말 같기도 하다. (추가적으로, 디지털 시대에 접어들면서 사람의 모든 행동들을 정량화하는 버릇이 생긴다고 하였고, 우리의 프라이버시가 완전히 없어짐을 의미한다고 하였다.)
유튜브로 이론에 대해 더 공부해볼것
정리하자면,
활성화 집단에서도 커널 밀도 함수를 따라서 본질적인 행동 패턴을 찾아 분류하고,
비활성화 집단에서는 대개 우리의 행동 패턴을 따르게 된다는 멱함수를 적용해준다는~ 그런