03.27 (월)


추천 시스템 Basic

추천 시스템의 기본에 대해서 학습 했습니다.
Precision@K, Recall@K, AP@K, MAP@K, NDCG와 같은 여러 지표를 학습하였습니다.
추천 시스템을 공부하면서도 계속 사용될 개념이라 학습 정리를 블로그에 작성하기로 계획을 하였습니다.


03.28 (화)


생활코딩[이고잉]님의 Git특강

Github 사용하는 방법에 대한 특강이 있었습니다.
이 블로그를 만들 때에도 Github를 기반으로 데이터를 관리하기 때문에 예전 녹화 강의를 본적이 있는 데,
실시간 강의를 들을 수 있어서 좋았습니다.


03.29(수)


Collaborative Filtering

Aspect Description
정의 협업 필터링은 유사한 사용자의 행동을 분석하여 사용자의 선호도를 예측하는 기술
Types 사용자 기반 협업 필터링 및 항목 기반 협업 필터링
User-based CF 사용자와 유사한 다른 사용자의 선호도를 기반으로 사용자에게 항목을 추천
Item-based CF 과거에 평가한 항목의 유사성을 기반으로 사용자에게 항목을 추천
장점 개인화된 추천을 제공할 수 있으며, 신규 및 비인기 항목에 효과적이며 콘텐츠 정보가 필요하지 않다
단점 Cold-start problem, 희소성 및 확장성 문제
Data required 평가, 리뷰 및 구매 내역과 같은 사용자 항목 상호 작용 데이터
Algorithm 협업 필터링 알고리즘은 유사성 측정을 사용하여 유사한 사용자 또는 항목을 식별


03.30(목)


MBCF

측면 설명
정의 기계 학습 알고리즘을 사용하여 사용자-항목 상호 작용 모델을 학습하는 추천 기술
모델 유형 Matrix factorization, Bayesian personalized ranking, and neural networks.
장점 Sparsity / Scalability 문제 개선
크고 희소한 데이터 세트를 처리할 수 있고 제한된 사용자 데이터로도 정확한 예측을 할 수 있으며 암시적 및 명시적 피드백과 같은 다양한 유형의 데이터를 처리
이웃 기반 CF의 경우 공통의 유저/아이템을 많이 공유해야 유사도 값이 정확해지지만 이러한 Limited Coverage를 극복
단점 다른 협업 필터링 기술보다 더 많은 계산 리소스가 필요하며 적절한 모델을 선택하고 최적화하려면 전문 지식이 필요
  • Explicit feedback

평점, 별점 등 item에 대한 user의 선호도를 직접적으로 알수 있는 문제

  • Implict feedback

클릭 여부, 시청 여부 등 item에 대한 user 선호도를 간접적으로 알 수 있는 데이터

1(positive)을 원소로 가지는 행렬로 표현가능

Singular Value Decomposition(SVD)

Aspect Description
Definition 사용자 항목 등급 매트릭스를 3개의 매트릭스로 분해하기 위해 협업 필터링에 사용되는 매트릭스 분해 기술
Matrix decomposition U, S 및 V 행렬 여기서 U는 user factors, S는 singular values, V는 item factors을 나타냄
Prediction formula U, S 및 V 행렬의 내적을 통해 unknown ratings을 추정
장점 크고 sparse한 데이터 세트를 처리하는 데 효과적이며 누락된 등급을 처리하고 정확한 권장 사항을 제공할 수 있다.
단점 분해 하려는 행렬의 knowledge가 불완전할 때 정의 안됨
정확하지 않은 Imputation은 데이터를 왜곡 시키고 성능을 떨어뜨린다
행렬의 entry가 적을때 과적합 되기 쉬움
-> MF 등장

Matrix Factorization(MF)

  • 정의
    User-Item 행렬을 저차원의 User와 Item의 latent factor 행렬의 곱으로 분해
    SVD와 유사하지만 관측된 선호도(평점)만 모델링에 활용
\[Rating Matrix를 P와 Q로 분해하여 R과 최대한 유사하게 \hat{R}을 추론 \\ R \approx P * Q^T = \hat{R}\]

Alternative Least Square (ALS)

  • 정의
    Implict Feedback 데이터에 적합하도록 MF 기반 모델을 설계하여 성능을 향상

  • Basic Concept
    User와 Item 매트릭스를 번갈아 가면서 업데이트
    두 매트릭스 중 하나를 상수로 놓고 나머지 매트릭스를 업데이트
    p_u, q_i 가운데 하나를 고정하고 다른 하나로 least-square문제를 해결


03.31(금)


Item2Vec / ANN

Recommender Systerm with Deep Learning

DL / MLP / AE

댓글남기기