본문 바로가기
728x90
반응형

분류 전체보기190

회귀분석 with python 0. Linear Regression 수치를 예측하는 방법 중 하나로 통계학에서는 회귀분석으로 잘 알려져 있다. 학습이 가능하기 때문에 머신러닝으로도 또한 잘 알려져 있다. 단순 선형 회귀와 같은 경우에는 독립변수 하나를 가지고 학습을 하며 이후에 새로운 독립변수들에 대해서 종속변수를 예측하게 된다. 단순 선형 회귀식은 일차 함수처럼 나타나게 된다. $ \hat{y} = \beta_{1} x + \beta_{0} $ 위의 식을 보면 단순한 일차 방정식처럼 보인다는 것을 알 수 있다. 여기서 우리가 구하려는 것은 이미 알고 있는 $x_{i}$ 들과 $y_{i}$들을 토대로 $\beta_{1}$과 $\beta_{0}$를 구하는 것이다. 쉽게 말해 기울기와 y 절편을 구한다고 생각하면 된다. Linear Re.. 2020. 3. 21.
히트맵 그리는 간단한 코드(matplotlib.pyplot) 데이터 전처리 하면서 변수들간의 상관관계를 자주 보게 되는데 그런 관계에는 역시 산점도나 히트맵인데 이럴때마다 매번 찾아다니는 것이 번거로워서 코드를 올려놓기로 한다. 사이킷런에 아이리스 데이터를 가지고 간단하게 히트맵을 그려볼 수 있다. from sklearn.datasets import load_iris iris = load_iris() iris=pd.DataFrame(iris['data']) iris.corr() matplotlib 라이브러리에서 pyplot을 임포트한다. 그리고 seaborn 패키지도 임포트한다. seaborn.heatmap으로 실행하며, data를 입력해주고, annot=True는 주석으로 숫자(상관계수)를 명시하겠다는 것이다. fmt는 수치의 형식과 소수점자릿수를 명시할 수 있.. 2020. 3. 11.
randomforest for regression 데이터 불러오기 ! 저자가 걸어둔 링크를 통해서 데이터를 바로 다운 받을 수 있다. https://drive.google.com/file/d/1pko9oRmCllAxipZoa3aoztGZfPAD2iwj/view?usp=sharing import pandas as pd features = pd.read_csv('temps.csv') #설명에 따르기 위해 필요한 컬럼만 가져온다. features = features[['year','month','day','week','temp_2','temp_1','average','actual','friend']] features[.. 2020. 3. 6.
A Hybrid Movie Recommender System Based on Neural Networks Abstract 하이브리드 시스템을 제안하며, MovieLens 데이터를 사용했다. 1. Introduction 영화, 시놉시스, 참여자(배우, 감독, 대본작가)와 다른 사용자들의 의견을 잘 고려한 하이브리드 시스템을 개발했다. 2. Related Work “A hybrid approach to making recommendations and its application to the movie domain” 는 요청시 등급 예측을 제공하는 하이브리드 시스템이다. 3.Content_Based and Collaborative Filtering Demographic filtering은 유사한 인구통계학적 특징을 가진 사용자에게 동일한 요소를 추천한다. 이 접근 방식은 너무 일반적이고 시간이 지나 변화하는 관심.. 2020. 2. 27.
게시판 페이징 level 1 문제 A씨는 게시판 프로그램을 작성하고 있다. A씨는 게시물의 총 건수와 한 페이지에 보여줄 게시물수를 입력으로 주었을 때 총 페이지수를 리턴하는 프로그램이 필요하다고 한다. A씨가 필요한 프로그램을 작성하시오. 우선 입력으로 받는 것이 게시물이 총 몇개 인지! 그런다음 페이지 별로 최대 몇 개씩 보여 줄건지! 인데, 단순하게 생각해서 나눗셈이라고 생각한다. 딱 나누어 떨어지면 몫이 곧 페이지 수가 되고, 나머지가 조금이라도 있으면 몫 + 1을 하면 된다. def page(): while True: m = int(input('총 게시물 수 ? , (m >=1) ')) if type(m) == type(1) and m >= 1: break else: print('다시 입력하세요.') continue whi.. 2020. 2. 26.
SVD 를 활용한 협업필터링 협업필터링은 메모리 기반과 모델 기반으로 나뉜다고 했다. 근데 여기서 모델기반 중 클러스터링 기법, 행렬 축소 기법, 딥러닝 기법이 있는데 이번 장에서는 행렬 축소 기법 중 하나인 SVD(특잇값 분해: Singular Vector Decomposition)에 대하여 간단히 알아보고, MovieLens데이터를 SVD를 활용하여 추천을 하는 코딩을 해보도록 하였다. https://drive.google.com/drive/folders/1EwDW7RMbJrKvvDdZCHWpFpQ2gbmpj1Y9?usp=sharing 위의 링크를 타면 사용중인 movielens 데이터를 txt형태로 받을 수 있따. 1. SVD란 SVD는 Latent Semantic Indexing의 부분으로써, 동의어나 다의어로부터 오는 문제.. 2020. 2. 22.
728x90
반응형