본문 바로가기
728x90
반응형

Programming_Collective Intelligence/3.군집발견2

구매 데이터를 활용한 사용자 군집화 제 6회 엘포인트 데이터를 가지고 추천을 적용할 아이디어를 만들어 보기 위해 사용자 간의 구매패턴을 활용하여 유사 사용자 군집화를 공부해 보려고 한다. 데이터 분석에 이렇게 투자하고 그 가치를 널리 공유함에 있어서 기업들의 이런 활동들은 늘 감사할 따름이다...ㅠ 우선 주어진 데이터를 잘 병합하고, 분석하기 쉬운 형태로 변형시켜주도록 하겠다. 1. 사용할 데이터. 우선 아래의 데이터는 온라인 행동 정보 데이터이다. 한단계 밑에 거래 정보 데이터의 BIZ_UNIT 과 비교해보면 A03이라는 카테고리로만 이루어져 있기 때문에 A03은 온라인을 나타내는 카테고리이며, 온라인 행동 정보 데이터의 가장 마지막 14번째 변수 기기유형을 통해 디바이스의 종류를 알 수 있다. 우선 사용자 군집화를 만들기 위한 것이 목.. 2019. 12. 29.
지도/비지도 학습 /단어 벡터 이번 3장에서는 2장의 아이디어를 이용하여 유사항목을 가진 그룹을 자동으로 검출하는 군집 기법 2개를 소개한다. 즉, 인기 블로그 집합에서 그리고 소셜 네트워킹 웹 사이트로부터의 사람들의 요구에서 그룹을 찾기 위해 군집을 사용하는 방법을 보여준다. 지도/비지도 학습 지도 학습: 정답 값을 가진 데이터를 토대로 입출력을 사용하여 새로 주어진 데이터에 대한 답을 찾도록 학습하는 방법. 신경망, 결정트리, SVM, 베이지안 필터링 등. 비지도 학습: LABEL값이 주어지지 않고, 데이터 집합 내에서 구조를 발견하는데 의의가 있는 학습 방법. 군집 알고리즘. 단어 벡터 군집용 데이터를 준비하는 일반적인 방법은 항목 비교에 사용될 숫자 특성들의 공통집합을 결정하는 것이다. 예컨데 2장에서 평론가의 평가점수를 영화.. 2019. 12. 29.
728x90
반응형