본문 바로가기
728x90
반응형

추천시스템19

Collaborative Filtering 에서의 유사도 지표 제안 논문(2). 이번 장에서는 아래의 포스팅 처럼 2가지 논문을 요약했던 것 처럼 또 2가지 논문을 살펴본 내용을 간략하게 요약하고자 한다. Collaborative Filtering 에서의 유사도 지표 제안 논문. Collaborative Filtering 에서의 유사도 지표 제안 논문. CF 알고리즘에서 새로운 유사도 지표를 제안하여 기존 보다 나은 성능을 내도록 연구한 논문에 대한 간략한 정리. 이번 장에서는 2개의 논문에 대한 정리를 한다. 기존의 어떤 문제를 해결하 data-science-hi.tistory.com 1. Integrating Triangle and Jaccard similarities for recommendation (2017). 먼저 소개할 논문은 Integrating Triangle and.. 2020. 11. 9.
Collaborative Filtering 에서의 유사도 지표 제안 논문. CF 알고리즘에서 새로운 유사도 지표를 제안하여 기존 보다 나은 성능을 내도록 연구한 논문에 대한 간략한 정리. 이번 장에서는 2개의 논문에 대한 정리를 한다. 기존의 어떤 문제를 해결하고자 하는지, 제안하려는 유사도 지표가 주는 이점, 한계점 등에 대해 간략하게 정리한다. 1. A new similarity measure for collaborative filtering based recommender systems 2019, Achraf Gazdar, Lotfi Hidri. 요약: CF 알고리즘은 유사도 지표를 토대로 유사한 사용자 집단을 구성하고, 이를 토대로 추천이 이루어진다. 이 때, 유사도를 측정하는 부분에 있어서 지금껏 다양한 유사도를 제안해왔고, 이 논문은 심플하고 효율적인 유사도 지표를 .. 2020. 10. 29.
추천시스템에서의 유사도 지표와 피드백 특징 연구. CF알고리즘에서 메모리 기반의 kNN 알고리즘에서 주요 이슈로 기본적으로 cold-start가 있고, 그리고 또 동시 평가 아이템을 기준으로 유사도를 구하는 알고리즘의 특성상, 동시 평가 아이템이 적을 수 밖에 없는 평점 매트릭스에서 더 잘 유사도를 구하기 위한 연구들에 대해 알아본다. 주어진 평점 매트릭스는 늘 sparse하다. 그럴 수 밖에 없는 것이 아이템은 제한되어 있고, 사용자는 상대적으로 훨씬 많다. 특정 사용자 둘 간의 유사도를 구하려해도 동시에 평가한 항목들이 소수여서 제대로 유사도가 측정되지 않는다. 이를 개선하고 싶으면 먼저, 유사도를 구하는 방법들에 대해 탐구할 필요가 있다. 유사도를 구하는 식은 다양하며 각 유사도가 가진 특징을 보고 적절히 발전을 시키면 기존의 base simila.. 2020. 10. 23.
메모리 기반 CF 추천시스템의 문제점 메모리 기반 Collaborative Filtering 추천시스템이 가진 문제점들에 대해 정리를 해본다. 크게 User-based, Item-based를 토대로 정리를 하였다. - Memory based Collaborative Filtering User based 추천시스템의 경우, 새로운 사용자에 대한 정보가 없기 때문에 이미 존재하는 사용자들과의 유사도를 구하는데 있어서 어려움이 있고, 이는 추천의 질을 떨어뜨린다. 이 문제가 바로 Cold-Start 문제인데, 새로운 사용자는 아직 application 사용 경험이 없기 때문에 취향을 나타내는 feedback이 거의 존재하지 않는다. 이에 이미 가지고 있는 Demography(인구통계)정보를 활용하는 방법이 있다. 사용자의 인구학적 통계자료인 성별.. 2020. 8. 23.
SVD 를 활용한 협업필터링 협업필터링은 메모리 기반과 모델 기반으로 나뉜다고 했다. 근데 여기서 모델기반 중 클러스터링 기법, 행렬 축소 기법, 딥러닝 기법이 있는데 이번 장에서는 행렬 축소 기법 중 하나인 SVD(특잇값 분해: Singular Vector Decomposition)에 대하여 간단히 알아보고, MovieLens데이터를 SVD를 활용하여 추천을 하는 코딩을 해보도록 하였다. https://drive.google.com/drive/folders/1EwDW7RMbJrKvvDdZCHWpFpQ2gbmpj1Y9?usp=sharing 위의 링크를 타면 사용중인 movielens 데이터를 txt형태로 받을 수 있따. 1. SVD란 SVD는 Latent Semantic Indexing의 부분으로써, 동의어나 다의어로부터 오는 문제.. 2020. 2. 22.
surprise를 활용한 협업필터링(collaborative filtering) 협업필터링에는 메모리 기반, 모델 기반으로 또 나뉘어지게 되는데, 앞서 메모리 기반 협업필터링을 item-based와 user-based로 각각 연습한다. 이번에는 협업필터링을 파이썬에 surprise 라이브러리를 사용해서 item-based, user-based를 구현하고, 잠재 요인 모델(Latent Factor Models)도 실행해본다. Li 님[2]의 블로그를 보고 데이터는 movielens를 사용하여 몇가지 옵션만 달리해가며 따라해보았다. 우선 필요한 라이브러리와 데이터를 가져온다. 데이터는 계속 쓰던 movielens 데이터를 사용한다. # 라이브러리 불러오기 import os import pandas as pd from surprise import Reader, Dataset u.data... 2020. 2. 13.
728x90
반응형