Hayden's Archive

[AI/머신러닝] 코사인 유사도를 활용한 상품 기반 협업 필터링 코드 본문

Study/AI & Math

[AI/머신러닝] 코사인 유사도를 활용한 상품 기반 협업 필터링 코드

_hayden 2020. 7. 27. 13:17

 데이터 출처 : grouplens.org/datasets/movielens/

 

MovieLens

GroupLens Research has collected and made available rating data sets from the MovieLens web site ( The data sets were collected over various periods of time, depending on the size of the set. …

grouplens.org

 


1. DataLoading and Data PreProcessing

데이터를 가져와서 필요에 맞게 가공한다. 데이터 전처리 과정.

 

 


2. 영화와 영화들 간의 유사도 산출 - 코사인 유사도 활용

앞선 포스팅에서는 함수를 직접 구현했지만 여기서는 코사인 유사도 라이브러리(sklearn의 cosine_simularity) 사용.