Matrix Factorization 실습
·
Machine Learning/Recommendation
Matrix Factorization 실습¶ KNN과 동일한 ratings 데이터에 모델 기반 협업필터링 방법 중 하나인 Matrix Factorization을 적용합니다. In [1]: import pandas as pd import numpy as np np.random.seed(2021) 1. Data¶ 1.1 Data Load¶ 유저-영화 평점 데이터를 이용해 유저가 아직 평가하지 않은 영화를 추천하겠습니다. 데이터에서 유저 고유 아이디를 나타내는 userId, 영화 고유 아이디를 나타내는 movieId, 유저가 영화를 평가한 점수 rating 컬럼을 이용합니다. In [2]: ratings = pd.read_csv("ratings_small.csv") ratings = ratings[["user..
KNN 협업 필터링 실습
·
Machine Learning/Recommendation
KNN 협업 필터링 실습¶ 유저-영화 평점 데이터를 이용해 유저가 아직 평가하지 않은 영화를 추천을 해보겠습니다. In [1]: import pandas as pd import numpy as np np.random.seed(2021) 1. Data¶ 1.1 Data Load¶ 데이터에서 유저 고유 아이디를 나타내는 userId, 영화 고유 아이디를 나타내는 movieId, 유저가 영화를 평가한 점수 rating 컬럼을 이용합니다. In [2]: ratings = pd.read_csv("ratings_small.csv") ratings = ratings[["userId", "movieId", "rating"]] In [3]: ratings.head() Out[3]: userId movieId rating..
TF-IDF 실습
·
Machine Learning/Recommendation
영화 메타 데이터와 TF-IDF 실습¶영화 줄거리 데이터에 TF-IDF를 적용해 영화별 유사도를 계산해보겠습니다. In [1]: import pandas as pd import numpy as np import matplotlib.pyplot as plt np.random.seed(2021) 1. Data¶ 1.1 Data Load¶데이터에서 영화 제목을 나타내는 title과 줄거리 overview 컬럼을 이용합니다. In [2]: df = pd.read_csv("movies_metadata.csv") C:\Users\sjy99\AppData\Local\Temp\ipykernel_18724\1650877637.py:1: DtypeWarning: Columns (10) have mixed types. Sp..
유사도 함수 실습
·
Machine Learning/Recommendation
샘플 데이터와 샘플링 기법¶ In [2]: pip install -U imbalanced-learn Collecting imbalanced-learn Downloading imbalanced_learn-0.11.0-py3-none-any.whl (235 kB) -------------------------------------- 235.6/235.6 kB 2.4 MB/s eta 0:00:00 Requirement already satisfied: numpy>=1.17.3 in c:\users\sjy99\appdata\local\programs\python\python311\lib\site-packages (from imbalanced-learn) (1.23.5) Requirement already sat..