"집단 지성 프로그래밍"이라는 책을 토대로 데이터를 활용한 다양한 기술과 알고리즘에 대한 학습을 합니다. 책의 순서대로 차근차근 간략하게 요약해 나가면서 얕고 넓게 지식을 익히는 것이 목표입니다. 끝까지 화이팅!
1. 집단지성이란
* 한 무리의 사람들의 행동, 선택, 아이디어들을 결합해서 통찰력을 생성하는데 사용한다고 합니다. 즉 단체의 성격, 특징 정도로 생각하면 될 것 같습니다.
예를 들어 표본조사, 인구조사가 있습니다. 이런 통계적 방법 등을 이용하여 새로운 결론을 유추하는 것을 집단지성이라고도 말합니다.
위키피디아, 구글 검색엔진 등도 있습니다.
2.기계학습이란
* 컴퓨터가 스스로 학습하게 하는 알고리즘에 관련된 인공지능의 한 영역이라고 합니다. 대부분의 경우 주어진 데이터의 집합을 이용해서 데이터의 속성에 관한 정보를 추론하는 알고리즘을 말합니다. 미래에 발견될 다른 데이터에 관한 예측이 가능해집니다. 무작위 데이터가 아니라면 패턴들을 가지고 있기 때문에 이를 법칙화시키게 되는데 이 법칙화를 시키기 위해서 데이터의 중요한 측면(feature)들을 결정할 모델(model)을 학습시켜야 한답니다.
대부분의 기계학습 알고리즘은 수학과 통계학에 기반을 두고 있습니다. 단순상관분석, 회귀분석 등도 기계학습의 분야입니다.
3.기계학습의한계
* 기계학습은 만능이 아닙니다. 이전에 없던 패턴의 경우 오류가 발생될 확률이 높습니다.
새로운 정보에 대한 판단을 해야 할 경우 인간은! 거대한 문화지식과 경험, 뛰어난 유사 상황 인식력을 십분 활용합니다. 하지만! 기계학습 기법은 일단 한 번 경험한 데이터만을 기반으로 법칙화 합니다. 그 조차도 제한된 방식 내에서만 수행됩니다.
사람의 성질은 갈대입니다. 그래서 기계가 어떻게 법칙화하기가 힘듭니다. 그래서 기계학습들은 과도한 일반화 경향을 보이게 됩니다.
소수 예제로 만들어진 법칙들의 정확도는 매우 낮습니다.
많은 기계학습 알고리즘은 새로운 정보가 나타날 때마다 계속 배우는 본질을 가집니다.
4.실제 예
아마존, 넷플릭스와 같은 사이트는 사람들이 구매, 임대한 물건들에 관한 정보를 사용합니다. 이 정보로 사람이나 물품이 다른 것과 유사한지를 결정하고 구매 이력을 이용해서 추천을 합니다.
판도라와 라스트에프엠과 같은 사이트는 여러 밴드와 음악에 대한 사람들의 평가 정보를 사용하여 고객들이 스스로 즐길 만한 라디오 방송국을 만들 수 있게 합니다.
예측 시장도 집단지성의 한 예입니다. 할리우드 주식거래소(http://hsx.com)의 예측치는 개별 전무가에 의한 예측보다 항상 더 정확하다고 합니다.
e하모니(http://eHarmony.com) 데이트 사이트.
5.기계학습의 다른 사례
생물공학, 금융사기 검출, 컴퓨터 비전, 제품 마케팅, 공급망 최적화, 주식시장 분석, 국가안보
댓글