Recommender systems survey(2)

728x90

4. Evaluation of recommender systems results

RS 연구가 시작된 이래로 예측과 추천에 대한 평가가 중요 해졌다. RS 분야의 연구는 예측과 추천을 위한 기술, 방법 및 알고리즘의 품질을 알기 위해 품질 측정 및 평가 메트릭을 요구하게 된다. 평가 메트릭과 평가 프레임 워크는 동일한 문제에 대한 여러 솔루션의 비교를 통해 더 나은 결과를 생성하는 다양한 유망한 연구 라인에서의 RS 선택을 용이하게 합니다.

가장 일반적으로 사용되는 품질 측정은 다음과 같습니다 : (1) 예측치 평가, (2) 추천 세트 평가, (3) 순위 목록으로 추천 평가가 있다.

평가 메트릭은 (a) 예측 메트릭으로 분류 될 수 있습니다 : 정확도에 대한 : 평균 절대 오차 (MAE), 평균 제곱 오차의 루트 (RMSE), 정규화된 오차의 평균의 평균 (NMAE); 및 범위(coverage) (b) set 추천(분류집합) 메트릭 : 정밀도, 리콜 및 수신자 조작 특성 (ROC) (c) 순위 추천 메트릭 : 반감기 및 할인된 누적 이득 그리고 (d) 다양성 메트릭 : 추천 항목의 다양성 및 참신성. 검증 프로세스는 가장 일반적인 교차 검증 기술 (랜덤 서브 샘플링 및 k- 폴드 교차 검증)을 사용하여 수행됩니다. 콜드 스타트 상황에서는 제한된 수의 사용자 (또는 항목) 투표로 인해 실험을 수행하기 위해 선택된 일반적인 방법이 Leave-one-out 교차 검증입니다.

대부분의 기사는 RS 결과의 정확성 개선 시도(RMSE, MAE 등)에 대해 논의한다. 추천(정확성, 리콜, ROC 등)의 개선을 시도하는 것도 일반적이다.

현재 이 분야는 정확성과 정밀도를 희생하더라도 다양하고 혁신적인 추천을 가진 알고리즘을 생성하는 데 관심이 커지고 있습니다. 이러한 측면을 평가하기 위해 추천 신뢰도와 다양성을 측정하기 위한 다양한 메트릭이 제안되었다.

4.1 Quality of the predictions: mean absoute error, accuracy and coverage

예측 품질: 평균 오차 절댓값, 정확도, 커버리지.

$ O_{u} = \left \{ i \in I | p_{u,i} \notin \bullet \wedge r_{u,i} \notin \bullet \right \} $

$U$를 RS 사용자 집합으로 정의하고, $I$ 는 RS 항목전체의 집합으로 정의하고, 항목 $i$에 대한 사용자 $u$의 평가점수를 $r_{u,i}$ 라 정의한다. $ \bullet $ 은 평점이 부족을 나타내며, 사용자 $u$가 $i$에 평가하지 않았다는 것을 $r_{u,i} = \bullet$ 과 같이 표현한다. $p_{u,i}$ 는 사용자 $u$의 항목 $i$에 대한 예측평점을 말한다.

위의 $O_{u}$는 사용자 $u$가 가진 예측 값들에 의해서 평점이 매겨진 항목들의 집합을 말한다.

추천 시스템의 MAE와 RMSE를 사용자의 MAE의 평균치로써 정의한다.

$|p_{u,i} - r_{u,i}|$ 는 실제값과 예측치의 절댓 차이로 예측에 대한 오차를 설명한다.

MAE는 모든 유저들에 대한 절대 오차 평균을 구하기 위해 각각의 절대 오차 평균에 대한 평균을 구하고, RMSE는 각 사용자들의 절대오차평균에 루트를 씌운 것들의 평균을 말한다.

커버리지는 특정 RS에 적용되는 메트릭으로부터 예측할 수 있는 용량으로 정의 될 수 있습니다. 간단히 말해서, 각 활성 사용자(active user)의 적어도 하나의 k- 이웃이 그 활성 사용자에 의해 아직 평가되지 않은 항목을 평가할 수 있는 상황의 백분율을 계산한다. 우리는 $k_{u,i}$를 항목 $i$를 평가한 $u$의 이웃 집합으로 정의. 시스템의 커버리지를 사용자의 커버리지 평균으로 정의하였다.

$C_{u} = \left \{ i \in I|r_{u,i} = \bullet \wedge K_{u,i} \notin \varnothing \right \}$

$D_{u} = \left \{ i \in I | r_{u,i} = \bullet \right \}$

$coverage = \frac{1}{U} \sum_{u \in U} (100 \times \frac{C_{u}}{D_{u}})$

$C_{u}$ 는 활성사용자 $u$가 평가하지 않은 항목에 대해 $k$이웃 사용자들은 평가한 항목의 수를 나타내며, $D_{u}$는 활성사용자 $u$가 평가하지 않은 항목들의 수 이다.

그렇게 해서 $C_{u}$와 $D_{u}$의 비율을 백분율로 환산하고 그 퍼센트들의 합을 총 유저의 수로 나누게 되면, 한 추천시스템 매트릭스에서 평균적으로 커버할 수 있는 수치를 구할 수 있고, 이로써 다른 추천시스템과의 것들과 비교할 수 있다.

4.2 Quality of the set of recommendations: precision, recall and F1

이번 절에선 presicion(정밀도), recall(재현율), F1을 통한 추천 품질 측정을 정의한다. 정밀도는 positive라고 예측한 것들 중에서 실제로 positive인 것들의 비율, 재현율은 실제 positive인 것들 중에서 positive로 잘 예측한 것들을 말한다. F1 값은 이 둘 사이의 조합을 말한다.

$X_{u}$를 사용자 $u$에 대한 추천 셋으로 정의하고, $Z_{u}$를 사용자 $u$에게 추천한 $n$개의 추천 셋이라고 정의한다. 사용자 $u$에 대한 $n$개의 추천에 의해 생성된 추천에 대한 정밀도, 재현율, F1 을 적절한 임계치 $\theta$ 를 사용하여 나타낸다. 모든 사용자에 대해 $n$ 개의 추천을 받아들인다고 가정하면 아래와 같이 나타낸다.

$precision = \frac{1}{U} \sum_{u \in U} \frac{\left \{ i \in Z_{u} | r_{u,i} \geqslant \theta \right \}}{n}$

$recall = \frac{1}{U} \sum_{u \in U} \frac{\left \{i \in Z_{u}|r_{u,i} \geqslant \theta \right \}}{\left \{i \in Z_{u}|r_{u,i} \geqslant \theta \right \} + \left \{ i \in Z^{c}_{u}|r_{u,i} \geqslant \theta \right \}}$

$F1 = \frac{2 \times precision \times recall}{precision + recall}$

$n$에 대해 다시 한번 내 생각으로 표현해보면, 사용자에게 추천한 모든 항목의 개수는 $n$이라고 한다. 즉 정밀도 공식을 말로 풀어서 설명해보면, 사용자에게 추천한 $n$ 개의 항목이라는 것은 분류에서 흔히 얘기하는 positive로 예측한 개수라고 할 수 있다. 예를 들어 사용자가 특정 항목을 구매할 것이다(positive)라고 예측하여 추천한 항목들이 $n$개 라고 할 수 있다. 즉, 정밀도는 사용자가 추천 받은(positive로 예측된) $n$개의 항목들 중에서 실제로 사용자가 구매(actual positive)한 항목의 개수라고 할 수 있다.

리콜 공식 또한 말로 풀어본다면,$\left \{ i \in Z^{c}_{u}|r_{u,i} \geqslant \theta \right \}$ 는 사용자 $u$가 추천받지 않은 모든 항목들 $Z^{c}_{u}$ 중에서 예컨데 $u$가 구매한 항목 정도로 얘기할 수 있다. 즉, 분모는 추천을 받았던 안받았던, 실제로 사용자 $u$가 구매한 항목들의 수이다. 분모는 정밀도에서와 마찬가지로 추천받은 것들중에서 실제로 $u$가 구매한 항목의 개수이다. $\theta$는 이진의 경우(예컨데, 구매:1, 비구매:0)에는 '1' 로 표현이 되지 않을까 생각이 든다. 아직 구현을 해보지 않아서 어떻게 $\theta$ 값을 보는지에 대해서는 확실히 모르겠다.

4.3 Quality of the list of recommendations: rank measures

추천 항목의 $n$이 작지 않을 때, 사용자는 추천 목록의 첫 번째 항목에 더 큰 중요성을 부여합니다. 순위가 높은 항목의 경우에 낮은 순위에서 발생한 오류보다 더 심각하다. 순위 측정은 이러한 것을 고려한다. 가장 자주 사용되는 우선 1.반감기(half-life)가 있는데, 이는 사용자가 상단의 추천에서 멀어질 때, 사용자의 관심이 기하급수적으로 감소한다고 가정한다. 다음은 2. discounted cumulative gain인데 말처럼, 상위랭크에서 멀어질수록 누적 획득량(사용자의 관심)이 감소한다는 뜻이다.

$HL = \frac{1}{U} \sum_{u \in U} \sum^{N}_{i=1} \frac {max(r_{u,p_{i}} - d, 0)}{2^{(i-1)/(\alpha -1)}}$

$ DCG^{k} = \frac{1}{U} \sum(r_{u,p_{1}} + \sum^{k}_{i=2} \frac{r_{u,p_{i}}}{log_{2}(i)})$

먼저 반감기 공식에 대해서 살펴보자. $p_{i}, .... , p_{n}$ 은 추천 리스트들을 나타낸다. $r_{u,p_{i}}$는 항목 $p_{i}$에 대한 사용자 $u$의 실제 평가를 나타낸다. $k$는 평가된 아이템의 순위를 나타내며, $d$는 default rating 이다. $\alpha$는 각 리스트에 담긴 항목들의 수이며, 그 항목에 사용자가 리뷰할 가능성은 50%이다.

[Empirical analysis of predictive algorithms for collaborative filtering]에서의 설명을 좀 빌려보면, 사용자가 순위 리스트에 있는 항목을 구매or선택할 확률을 추정한 것이 반감기 공식이라 한다. 목록에 있는 각 연속적인 항목들은 갈수록 기하급수적으로 노출되기 힘들어 진다고 가정한다. 결과적으로 반감기 공식을 활용하여 순위가 매겨진 항목 목록에서의 각 항목($i$)의 예상 유용성(expected utility)을 구하는 것이다.

쉽게 말하면 사용자 한명 한명이 추천받은 리스트 속 항목별로 사용자가 들여다 볼 확률들의 합을 구하는데, 이때 그 각 항목별 확률을 반감기 알고리즘을 적용하여 구하는 것이다.

$\alpha$ 값은 반감기 감소에 대한 파라미터 값이다. 그리고 $d$값은 기본 등급(default rating/ neutral vote)으로 항목들 중 사용할 수 없는 것들에 대해 효율적으로 대처하게 한다. 그러므로 이 각 사용자에게 추천된 항목들이 추천 리스트에서 순위가 낮아질수록 값이 줄어들게 된다. 이들을 모두 합하고, 또 모든 사용자들에 대해서 평균값을 구하여 최종 $HL$ 값을 구하게 된다.

한마디로 요약하면 추천리스트의 항목들의 순위에 대해 사용자가 매긴 평점과 비교하여 순위에 맞게끔 추천이 잘 됐는지를 평가함.

4.4 Novelty and diversity

신규성 평가 지표는 사용자가 이미 알고 있는 항목들과 추천 받은 항목들 사이의 정도를 나타낸다. 다양성 평가 지표는 추천 항목들 간의 다름의 정도를 카리킨다.

$diversity_{z_{u}} = \frac{1}{Z_{u}(Z_{u}-1)} \sum_{i \in Z_{u}}\sum_{j \in Z_{u},j \neq i} [1 - sim(i,j)]$

$novelty_{y_{i}} = \frac{1}{Z_{u}-1}\sum_{j \in Z_{u}}[1 - sim(i,j)], i \in Z_{u}$

유사도 $(i,j)$ 는 메모리 기반에서 아이템 간의 CF 유사도를 나타낸다. $Z_{u}$는 사용자 $u$에게 추천된 $n$개 추천 항목들의 집합을 나타낸다.

쉽게 말해, 다양성 척도는 모든 추천 항목들에 대한 유사도 행렬을 통해 유사도 평균을 내는 것이고, 신규성은 특정 항목 $i$에 대한 모든 다른 추천 항목 $j$ 간의 유사도 평균을 구한 값이다. 이 둘은 전체를 기준으로 유사도 평균을 구하느냐 하나의 항목에 대한 유사도 평균을 구하냐인 방식의 차이인 것으로 보여진다.

4.5 Stability

예측 및 추천의 안정성은 RS에 대한 사용자의 신뢰에 영향을 미친다. RS는 제공하는 예측이 짧은 기간 동안 강하게 변하지 않으면 안정적입니다. Adomavicius와 Zhang 은 안정성의 품질 측정인 MAS (Mean Absolute Shift)를 제안합니다. 이 측정은 알려진 등급 R1 집합과 모든 알려지지 않은 등급의 예측 집합인 P1을 통해 정의됩니다. 일정 기간 동안 RS 사용자는 이러한 알려지지 않은 등급의 하위 집합 S를 생성하고 RS는 이제 새로운 예측인 P2를 만들 수 있습니다.MAS는 다음과 같이 정의된다.

$stability = MAS = \frac{1}{|P_{2}|} \sum_{(u,i) \in P_{2}} |P_{2}(u,i) - P_{1}(u,i)|$

MAS 말 그대로 변화 수치의 절댓값 평균을 말한다. 쉽게 말해서 사용자 $u$가 이전에 추천받았던 것들과 일정기간 동안 또 여기저기 평가를 하게되고, 또 이 데이터를 바탕으로 새롭게 추천한 집합인 $P_{2}$가 생성되고, 이전의 $P_{1}$집합과의 절댓값 차의 평균 값을 토대로 얼마나 예측이 크게 변하지 않고 안정적인지를 나타내게 됩니다.

4.6 Reliability

예측이나 추천의 신뢰성은 얼마나 이 예측을 심각하게 고려할 수 있는지를 알려준다. 4.5 평점을 줄거라고 예측을 한다면, 사용자는 이 항목에 대해 만족하기를 원한다. 하지만 이 예측치 4.5 점이라는 것은 추천시스템이 이 사용자가 항목을 좋아할 것이라고 결론 지을 만한 특정 지표가 반영되어 있지 않다. 또한 4.5 예측평점을 구할 때 참고하는 사용자가 많으면 많을수록 더 신뢰할 수 있다.

여기서 제안하는 방식은 비교하는데 사용되는 품질 측정이 아니지만 예측 및 추천과 관련된 품질 측정으로 간주될 수 있다. 이러한 방식으로 RS는 한 쌍의 값( 예측값, 신뢰성 값 )을 제공하고, 사용자는 (4, 0.9)를 (4.5, 0.1) 보다 더 선호하게 될 것이다. 결과적으로 사용자가 결정을 내릴 때 고려할 수 있는 새로운 이해가능한 요소를 제공한다. 그럼에도 불구하고 이러한 신뢰성 측정의 사용은 knn 알고리즘에 기초한 RS에 제한되어 있다.

$f_{s}(S_{u,i}) = 1 - \frac{\bar{s}}{\bar{s}+S_{u,i}} , S_{u,i} = \sum_{v \in K_{u,i}} sim(u, v)$

$p_{u,i}$ 예측값에 대한 신뢰도의 정의는 $S_{u,i}$ 와 $V_{u,i}$ 두 요소에 기초한다. $S_{u,i}$는 $p_{u,i}$를 생성하기 위해 사용된 이웃들의 유사도를 나타내고, $V_{u,i}$는 항목 $i$에 이웃들에 대한 평가 사이의 불일치 정도를 나타낸다. $\bar{s}$와 $\bar{v}$는 각각 $S_{u,i}$ 와 $V_{u,i}$의 중앙 값이다.

추천된 항목에 대한 신뢰도인 $R_{u,i}$를 구하기 위해 위의 공식을 차례로 활용하는 것이다. 실제 구현을 해보지 않아 $R_{u,i}$ 공식 속을 다 뜯어보며 이해하진 않았지만, $S_{u,i}$와 $V_{u,i}$에 대한 것을 활용하기 때문에 이들에 대한 이해를 하였다. 중요한 것만 얘기를 해보자면 가장 위에 $S_{u,i}$ 같은 경우에는 앞서 말했던 가정처럼 하나의 예측을 하더라도 이웃사용자들을 많이 고려하면 고려할수록 그 신뢰가 높아진다는 것을 수식에 담았으며, 반대로 $V_{u,i}$와 같은 경우는 분산과 같은 개념으로써 값이 크다는 것은 예측과 실제 값 사이에 일치하는 정도가 작다는 것을 의미한다. 이 두 요소를 활용하여 하나의 수치로 점수화한 값이 $R_{u,i}$라고 생각하면 될 듯하다.

5. Social information

소셜 정보를 활용하여 메모리기반 추천시스템을 개선한다. 첫째, 추가 정보를 결합하여 추천하여 성능을 향상, 둘째, 기존에 존재하지 않은 추천시스템을 개발한다. 셋째, 특정 추천시스템을 생성, 제안 또는 개선하지 않고 사회정보와 협력 프로세스간의 가장 중요한 관계를 발견하는 연구의 기초를 제공.

웹이 발전함에 따라 추천시스템도 점점더 사회적 정보인 팔로워, 친구 목록, 게시물, 블로그, 태그 등을 통합하기 시작했다. 이러한 정보는 추천시스템을 개선한다. 이러한 소셜정보다 전통적인 메모리 기반 정보를 강화하기 때문에 메모리 기반 추천시스템에 내재된 희소성 문제를 개선한다.

소셜 네트워크의 급증으로 콘텐츠 기반 필터링이 더욱 중요해졌다. 부가적인 정보들이 예측 및 추천의 정확성을 증가시켜준다.

신뢰 정보를 사용하는 추천시스템이 좋은 적용 범위를 유지함과 동시에 정확도 측면에서 가장 효과적이라 함.

5.1 Social filtering

소셜 정보는 암시적으로나 명시적으로 수집이 될 수 있다. 통신이나 웹로그를 통해서 말이다. 암시적, 명시적 데이터를 조합하여 추천을 생성할수도 있다. 이러한 조합이 추천의 성능을 좋게 만든다.

5.2 Content-based filtering

유사한 속성을 가진 항목은 유사하게 평가될 것이라는 개념을 기반으로 하여 과거에 측정된 것을 기반으로 사용자에게 추천을 한다. 예를 들어, 사용자가 '자동차', '엔진', '가솔린'이라는 단어가 있는 웹 페이지를 좋아한다면, CBF는 자동차 세계와 관련된 페이지를 추천할 것이다. CBF는 RS가 태그, 게시물, 의견 및 멀티미디어 자료와 같은 웹 2.0 환경에서 일하는 사용자의 항목에 대한 정보를 통합함에 따라 특히 중요해지고 있다.

콘텐츠 기반 필터링에 대한 두 가지 어려운 문제는 제한된 콘텐츠 분석과 과도한 전문화이다. 첫 번째 문제는 다양한 콘텐츠(이미지, 비디오, 오디오, 텍스트 등)에서 신뢰할 수 있는 자동화된 정보를 추출하는 데 어려움이 있어 추천의 품질을 크게 감소시킬 수 있다. 두 번째 문제(과밀화)는 사용자가 자신이 좋아하거나 선호하는 항목과 매우 유사한 항목에 대해서만 추천을 받는 현상을 말하며, 따라서 사용자는 자신이 좋아할 수도 있지만 알려지지 않은 항목에 대한 추천을 받지 못하고 있다(예: 사용자가 픽션 영화에 대한 추천만 받는 경우).

(1) 추천을 위한 아이템의 속성을 추출하고, (2) 활성 사용자의 선호도와 아이템의 속성을 비교하며, (3) 사용자의 관심사에 맞는 특성을 가진 아이템을 추천한다.

Li는 CF에 대한 입력인 ratting 행렬을 속성에 따라 항목을 클러스터링함으로써 생성된 다른 행렬과 결합함으로써 새로운 행렬을 생성한다. 이는 블로그 다른 글에 게재되어 있다. https://data-science-hi.tistory.com/76. Hu andPu 에서 저자는 새로운 사용자 문제를 최소화하기 위해 CF 유사성 측정에 성격 특성을 통합합니다. https://hci.epfl.ch/publications/2010/hupu-RSWEB2010.pdf

베이지안을 활용하여 CF, CBF의 특성을 결합하여 보다 정확한 추천을 생성함. http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.19.6363&rep=rep1&type=pdf

지식 기반 기술을 사용하여 콜드 스타트 문제를 해결해야 한다고 제안합니다.

6. Additional recommender systems objectives

그림 9와 같이 네가지 방식으로 협업필터링과 콘텐츠 기반 필터링의 방법을 적절히 섞어서 통합에 활용한다. 메모리 기반에서의 하이브리드 필터링의 접근 방식이라고 보면 된다.

A

Group-Based Recipe Recommendations: Analysis of Data Aggregation Strategies

https://dl.acm.org/doi/pdf/10.1145/1864708.1864732?download=true

Group-based recipe recommendations | Proceedings of the fourth ACM conference on Recommender systems

ABSTRACT Collaborative filtering recommendations were designed primarily for individual user models and recommendations. However, nowadays more and more scenarios evolve, in which the recommended items are consumed by groups of users rather than by individ

dl.acm.org

-> 'switches between recommendation techniques depending on the situation' 그룹 기반의 전략과 개인화 전략의 하이브리드 전략을 제시함. 개인화전략은 정확도는 가장 높지만 가장 낮은 커버리지(계산가능범위)를 갖고, 일반적인 방법은 정확도가 가장 낮지만 가장 높은 커버리지를 갖는다. 그룹 기반은 모두 다소 준수하다.

짧게 요약하면, 유저에게 가중치를 준다. 가족, 배우자 등이면 이와 연관되어 있는 사용자일 경우 긍/부정적인 영향에 쉽게 노출되기 때문에 가중치를 낮게 책정해준다. 예를 들면 applicant는 0.5, partner는 0.3, child는 0.1 이 있다.

https://reader.elsevier.com/reader/sd/pii/S095741741001506X?token=EFAFA7D0C297DF661E7AB801FE08C1677E168C1EE0BAF0946D60FBA0ED75B1AFCD8FE8E5A20473A69659C83D641B3697

On the design of individual and group recommender systems for tourism

This paper presents a recommender system for tourism based on the tastes of the users, their demographic classification and the places they have visit…

www.sciencedirect.com

-> 개인화 또는 그룹을 대상으로 관광명소를 추천하는데, 인구통계학정보, 콘텐츠 기반, 일반 평점데이터를 활용한다. 복잡한 관광지 추천을 자세하게 기술하였다. 추천 항목에 점수를 매기는 방법도 기술하고 있다. 개인, 그룹, 하이브리드,항목 데이터로 부터 각기 점수를 계산하고 마지막에 통합하여 추천 항목의 그룹을 리턴한다.

https://reader.elsevier.com/reader/sd/pii/S0957417411007482?token=2AB8A29BD6760180FA07995499AA0FE96FCFE53D48D78DC5ED559525892AF31C441DB306513D7BFDB934F24D4134A684

불러오는 중입니다...

-> 사용자 그룹에 대한 음악추천 시스템을 기술하였다. 이를위해 개인들의 평점을 집계하는 방법이나 그룹 선호도 모델을 설계하는 것을 기술한다.

https://reader.elsevier.com/reader/sd/pii/S0957417411009675?token=756498D78FB348B91B45239F79B94EADEAE203BEF7D7DA99F44FDF1F68C5AF79BCA162ACB98D30B143E7A1212D386AFD

불러오는 중입니다...

-> 전통적인 협업필터링의 가능성을 열어주는 2가지 방법을 제안한다.

Group Recommendations with Rank Aggregation and
Collaborative Filtering

http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.453.2513&rep=rep1&type=pdf

불러오는 중입니다...

-> 그룹에 대한 효과적인 추천을 생성하기 위해 그룹 구성원의 개별 선호도를 만족시켜야 한다. 그러므로 이 논문에선 협업 필터링 시스템에서 생성된 개별 추천 목록을 통합하여 얻은 그룹 추천의 효과를 분석한다. 집단 내 사용자들이 유사할수록 집단 추천이 더 효과적임을 확인한다.

실험은 집단의 각 구성원에게 집단에 대해 생성된 순위별 추천(예측)의 효과와 각 구성원에게 생성된 순위별 추천의 효과를 비교하는 것으로 진행한다.

https://reader.elsevier.com/reader/sd/pii/S0306457313000174?token=DD20F64798B90E2ADDF56CDF6FC04D6C265C906B29F7B619DC138C2AC61603DD410DCC62E2C7EB751A63F2F64A6A3C3F

불러오는 중입니다...

-> 그룹 추천 유사도 행렬을 제공하고, 협업 필터링 프로세스의 실제 유사도 행렬에서 그룹 사용자의 집합을 다루는 편리성을 입증한다.

협력 필터링에 사용되는 실제 유사도 행렬에 그룹 사용자 집합을 포함시키는 것이 바람직하다. 시스템 성능은 상당히 향상되고 정확도는.. 쏘쏘이다.

사용자가 받은 추천을 정당화하는 설명을 제공하는것은 중요하다. 왜냐하면 시스템에 의해 생성된 결과에 대한 사용자 신뢰도를 높이는데 도움이 되기 때문이다.

-> human style 로 설명한다. 항목을 추천하면, 다른 사람이 좋게 평가했기 때문에 추천한 것이고, item style로 설명하면 어떤 아이템은 활성 사용자가 좋게 평가했던 것들과 동시에 좋게 평가된 아이템이기 때문에 추천한다.

geo-social에 기초한 하이브리드 인간/항목 설명 방법을 채택하기도 한다.

7. Recommender systems trends

7.2 Location-aware recommender systems

암묵적인 데이터를 활용하다.

모바일 기기의 사용이 증가함에 따라 위치 인식 시스템에 더욱 널리 보급되고 있다. 이웃에 의해 추천하면서 동시에 거리도 고려한다(가중치).

7.3 Bio-inspired approaches

제안된 모델 기반 RS의 대부분은 주로 유전 알고리즘(GA)과 신경망(NN)을 사용하는 바이오 영감을 받은 접근법에 기초한다. 인공 면역 네트워크(ANT)를 기반으로 한 모델도 제안되었다.GA는 자연선택과 가장 적합한 생존과 같은 진화 원리에 기초한 휴리스틱 접근법이다. GA는 주로 RS의 두 가지 측면에서 사용되었습니다 : 클러스터링 [120,243]과 하이브리드 사용자 모델 [76,99,7]. RS의 특징을 개선하기 위한 일반적인 기술은 처음에는 유사한 사용자의 클래스 그룹이 획득되는 방식으로 모든 사용자에 대한 클러스터링을 수행하는 것으로 구성되며, 이후 원하는 CF 기술을 각 클러스터에 적용할 수 있어 유사한 결과를 얻을 수 있지만 훨씬 짧은 계산 시간에 적용될 수 있다. GA 기반 K-means [121]와 같은 공통 유전적 클러스터링 알고리즘을 사용하는 것이 일반적이다.

8. Related works and original contributions of the paper

9. Conclusion

추천 시스템은 필터링을 통한 추천 정확도 향상에 초점이 있었고, 대부분의 메모리기반 방법과 알고리즘은 knn행렬, 집계로의 접근, 특잇값분해, 확산 기반 방법 등에서 개발되고 최적화 되었다.

기존의 하이브리드 접근법을 이용한 사회 정보를 포함하는 알고리즘을 적용 및 개발하였다.(신뢰 인지 알고리즘, 사회적 적응 접근, 소셜 네트워크 분석 등). 현재 하이브리드 앙상블 알고리즘은 위치 정보를 기존의 추천 알고리즘에 통합하고 있다.

평가로는 정확성, 참신성, 수용성 등이 있었다.

향후 연구에서는

1) 다양한 유형의 이용 가능한 정보를 사용하는 기존의 추천 방법의 적절한 조합.

2) 사물인터넷에서 다양한 센서와 장치의 개별 잠재력을 최대한 활용하기 위한 방법.

3) 추천 과정에서 개별 사용자의 습관, 소비 및 취향과 관련된 경향의 획득 및 통합.

4) 추천을 위한 것이 아닌 RS 데이터 베이스로부터의 데이터 마이닝( 예: 시장조사, 트렌드, 인구 통계학적 집단의 각기다른 특성의 시각화)

5) 추천인 시스템 프로세스에 대한 보안과 프라이버시를 가능하게 하는 것.

6) 새로운 평가 조치 및 비표준화된 평가 조치에 대한 표준 개발.

7) 이질적 데이터의 자동 분석을 위한 유연한 프레임워크 설계 사용.

728x90

'Reading' 카테고리의 다른 글

Matrix Factorization Techniques for Recommender Systems (0)	2020.04.01
A Hybrid Movie Recommender System Based on Neural Networks (0)	2020.02.27
A new approach for combining content-based and collaborative filters (0)	2020.02.03
Toward the Next Generation of Recommender Systems: A Survey of the State-of-the-Art and Possible Extensions(2005) (0)	2020.01.21
Using Content-Based Filtering for Recommendation (0)	2020.01.21

데하

Recommender systems survey(2)

4. Evaluation of recommender systems results

4.1 Quality of the predictions: mean absoute error, accuracy and coverage

$C_{u} = \left \{ i \in I|r_{u,i} = \bullet \wedge K_{u,i} \notin \varnothing \right \}$

$D_{u} = \left \{ i \in I | r_{u,i} = \bullet \right \}$

$coverage = \frac{1}{U} \sum_{u \in U} (100 \times \frac{C_{u}}{D_{u}})$

4.2 Quality of the set of recommendations: precision, recall and F1

$precision = \frac{1}{U} \sum_{u \in U} \frac{\left \{ i \in Z_{u} | r_{u,i} \geqslant \theta \right \}}{n}$

$recall = \frac{1}{U} \sum_{u \in U} \frac{\left \{i \in Z_{u}|r_{u,i} \geqslant \theta \right \}}{\left \{i \in Z_{u}|r_{u,i} \geqslant \theta \right \} + \left \{ i \in Z^{c}_{u}|r_{u,i} \geqslant \theta \right \}}$

$F1 = \frac{2 \times precision \times recall}{precision + recall}$

4.3 Quality of the list of recommendations: rank measures

$HL = \frac{1}{U} \sum_{u \in U} \sum^{N}_{i=1} \frac {max(r_{u,p_{i}} - d, 0)}{2^{(i-1)/(\alpha -1)}}$

$ DCG^{k} = \frac{1}{U} \sum(r_{u,p_{1}} + \sum^{k}_{i=2} \frac{r_{u,p_{i}}}{log_{2}(i)})$