본문 바로가기
728x90
반응형

Programming_Collective Intelligence18

선호도 최적화 앞서 최적화로 해결할 수 있는 문제에 대한 예를 보았다. 하지만 전혀 관련이 없어보여도 동일한 방법을 사용할 수 있는 문제들이 많이 있다. 최적화 요건으로 문제를 풀기위해 필요한 조건 1. 문제가 정의된 비용 함수를 가지는지 -> 비용함수를 구할 수 있는지 2. 유사한 해답이 유사 결과를 내는지 -> 입력값에 따라 합리적인 결과가 도출되는지 이런 속성을 가진 모든 문제를 최적화로 다 풀 수는 없지만 전혀 생각치 못한 흥미로운 결과를 최적화를 통해서 얻어낼 수 있다! 이번에는 최적화 결과를 내는 다른 문제를 살펴본다. 제한된 자원을 선호를 표현한 사람들에게 분배하여 가능한 모두 행복하게 하는 방법을 찾는 문제를 생각해보자. 학생 기숙사 최적화 학생들을 그들의 1지망, 2지망 선택을 반영해서 기숙사에 배치하.. 2020. 1. 4.
시뮬레이티드 어닐링/유전자 알고리즘 저번 장에서 최적화 중 local minimum에 빠지는 것을 방지하기 위한 방법으로 두가지를 제시하였고, 본 장에서 예시를 통해 이어서 설명해보록 한다. 1. 시뮬레이티드 어닐링(Simulated Annealing): 물리학에서 영감을 받은 최적화 기법이다.. 어닐링이란 합금을 가열한 후 천천히 냉각하는 과정을 말한다. 원자는 주변을 뛰어다니다가 점차 낮은 에너지 준위로 정착하기 때문에, 원자들은 가장 낮은 에너지 배치를 찾을 수 있다. 각설하고, 시뮬레이티드 어닐링은 계속해서 좋은 방향으로 움직인다. 처음에는 좋지 않은 해답으로 시작할 순 있지만 점차 끝에 이르러서는 더 좋은 해답만을 선택하게 된다.. 매 반복마다 해답 내 숫자들 중 하나를 무작위로 선택하고 특정한 방향으로 변경한다. 큰 비용을 가진.. 2020. 1. 3.
최적화 예제_단체여행 이 장에서는 한 문제에 대한 수백만의 가능한 해답 중 최적 해답을 찾도록 설계된 최적화 알고리즘을 소개한다. 이 알고리즘의 다양한 사용법이 같은 지역을 여행하는 단체 여행객이 최적의 비행편을 찾는 문제와 학생들을 기숙사에 배치하는 가장 좋은 방법 그리고 최소의 교차점을 가지는 네트워크 배치 문제를 통해 소개한다 ~ 통계적 최적화(statistics optimization)란 기법을 사용해서 협업 문제를 해결하는 방법에 대해 살펴볼 예정이다. 최적화는 여러 다른 해답을 시도하고 결과 품질을 판단한 후 해답에 점수를 매겨 특정 문제에 대한 최적의 해답을 찾는다. 최적화는 너무 많은 해답을 가지고 있어 전부 시도해 보기 어려운 경우에 일반적으로 사용된다. -단체 여행 예제 여러 다른 장소에서 출발하여 같은 목.. 2020. 1. 1.
PageRank 이 장에서는 입력 받은 단어로 문서들을 찾아주고, 단어들에 가장 연관도가 높은 순으로 결과를 정렬하는 전문 검색엔진을 다룬다. 전문 검색에 사용하는 알고리즘들은 집단 지성 알고리즘 중에서 제일 중요한 것들에 해당되고, 이 분에에서 새로운 아이디어로 많은 갑부들이 탄생했다고 한다... 많은 사람들은 구글이 연구 프로젝트에서 세장에서 제일 인기 있는 검색엔진으로 초고속 성장한 이유가 페이지랭크 알고리즘에 있다고 믿는다. 1. 검색엔진이란? : 검색엔진을 만드는 첫번째 단계는 문서 수집 방법을 개발하는 것이다. 크롤링이나 기업 인트라넷과 같이 고정된 문서 컬렉션으로 시작하는 경우가 있다. 문서들은 모은 후 색인을 하는데 이 때 여러 다른 단어들의 위치와 문서들을 담는 큰 테이블을 만드는 과정이 포함된다. 어떤.. 2020. 1. 1.
구매 데이터를 활용한 사용자 군집화 제 6회 엘포인트 데이터를 가지고 추천을 적용할 아이디어를 만들어 보기 위해 사용자 간의 구매패턴을 활용하여 유사 사용자 군집화를 공부해 보려고 한다. 데이터 분석에 이렇게 투자하고 그 가치를 널리 공유함에 있어서 기업들의 이런 활동들은 늘 감사할 따름이다...ㅠ 우선 주어진 데이터를 잘 병합하고, 분석하기 쉬운 형태로 변형시켜주도록 하겠다. 1. 사용할 데이터. 우선 아래의 데이터는 온라인 행동 정보 데이터이다. 한단계 밑에 거래 정보 데이터의 BIZ_UNIT 과 비교해보면 A03이라는 카테고리로만 이루어져 있기 때문에 A03은 온라인을 나타내는 카테고리이며, 온라인 행동 정보 데이터의 가장 마지막 14번째 변수 기기유형을 통해 디바이스의 종류를 알 수 있다. 우선 사용자 군집화를 만들기 위한 것이 목.. 2019. 12. 29.
지도/비지도 학습 /단어 벡터 이번 3장에서는 2장의 아이디어를 이용하여 유사항목을 가진 그룹을 자동으로 검출하는 군집 기법 2개를 소개한다. 즉, 인기 블로그 집합에서 그리고 소셜 네트워킹 웹 사이트로부터의 사람들의 요구에서 그룹을 찾기 위해 군집을 사용하는 방법을 보여준다. 지도/비지도 학습 지도 학습: 정답 값을 가진 데이터를 토대로 입출력을 사용하여 새로 주어진 데이터에 대한 답을 찾도록 학습하는 방법. 신경망, 결정트리, SVM, 베이지안 필터링 등. 비지도 학습: LABEL값이 주어지지 않고, 데이터 집합 내에서 구조를 발견하는데 의의가 있는 학습 방법. 군집 알고리즘. 단어 벡터 군집용 데이터를 준비하는 일반적인 방법은 항목 비교에 사용될 숫자 특성들의 공통집합을 결정하는 것이다. 예컨데 2장에서 평론가의 평가점수를 영화.. 2019. 12. 29.
728x90
반응형