Boostcamp Week 04 [TIL]
03.27 (월)
추천 시스템 Basic
추천 시스템의 기본에 대해서 학습 했습니다.
Precision@K, Recall@K, AP@K, MAP@K, NDCG와 같은 여러 지표를 학습하였습니다.
추천 시스템을 공부하면서도 계속 사용될 개념이라 학습 정리를 블로그에 작성하기로 계획을 하였습니다.
03.28 (화)
생활코딩[이고잉]님의 Git특강
Github 사용하는 방법에 대한 특강이 있었습니다.
이 블로그를 만들 때에도 Github를 기반으로 데이터를 관리하기 때문에 예전 녹화 강의를 본적이 있는 데,
실시간 강의를 들을 수 있어서 좋았습니다.
03.29(수)
Collaborative Filtering
Aspect | Description |
---|---|
정의 | 협업 필터링은 유사한 사용자의 행동을 분석하여 사용자의 선호도를 예측하는 기술 |
Types | 사용자 기반 협업 필터링 및 항목 기반 협업 필터링 |
User-based CF | 사용자와 유사한 다른 사용자의 선호도를 기반으로 사용자에게 항목을 추천 |
Item-based CF | 과거에 평가한 항목의 유사성을 기반으로 사용자에게 항목을 추천 |
장점 | 개인화된 추천을 제공할 수 있으며, 신규 및 비인기 항목에 효과적이며 콘텐츠 정보가 필요하지 않다 |
단점 | Cold-start problem, 희소성 및 확장성 문제 |
Data required | 평가, 리뷰 및 구매 내역과 같은 사용자 항목 상호 작용 데이터 |
Algorithm | 협업 필터링 알고리즘은 유사성 측정을 사용하여 유사한 사용자 또는 항목을 식별 |
03.30(목)
MBCF
측면 | 설명 |
---|---|
정의 | 기계 학습 알고리즘을 사용하여 사용자-항목 상호 작용 모델을 학습하는 추천 기술 |
모델 유형 | Matrix factorization, Bayesian personalized ranking, and neural networks. |
장점 | Sparsity / Scalability 문제 개선 크고 희소한 데이터 세트를 처리할 수 있고 제한된 사용자 데이터로도 정확한 예측을 할 수 있으며 암시적 및 명시적 피드백과 같은 다양한 유형의 데이터를 처리 이웃 기반 CF의 경우 공통의 유저/아이템을 많이 공유해야 유사도 값이 정확해지지만 이러한 Limited Coverage를 극복 |
단점 | 다른 협업 필터링 기술보다 더 많은 계산 리소스가 필요하며 적절한 모델을 선택하고 최적화하려면 전문 지식이 필요 |
- Explicit feedback
평점, 별점 등 item에 대한 user의 선호도를 직접적으로 알수 있는 문제
- Implict feedback
클릭 여부, 시청 여부 등 item에 대한 user 선호도를 간접적으로 알 수 있는 데이터
1(positive)을 원소로 가지는 행렬로 표현가능
Singular Value Decomposition(SVD)
Aspect | Description |
---|---|
Definition | 사용자 항목 등급 매트릭스를 3개의 매트릭스로 분해하기 위해 협업 필터링에 사용되는 매트릭스 분해 기술 |
Matrix decomposition | U, S 및 V 행렬 여기서 U는 user factors, S는 singular values, V는 item factors을 나타냄 |
Prediction formula | U, S 및 V 행렬의 내적을 통해 unknown ratings을 추정 |
장점 | 크고 sparse한 데이터 세트를 처리하는 데 효과적이며 누락된 등급을 처리하고 정확한 권장 사항을 제공할 수 있다. |
단점 | 분해 하려는 행렬의 knowledge가 불완전할 때 정의 안됨 정확하지 않은 Imputation은 데이터를 왜곡 시키고 성능을 떨어뜨린다 행렬의 entry가 적을때 과적합 되기 쉬움 -> MF 등장 |
Matrix Factorization(MF)
- 정의
User-Item 행렬을 저차원의 User와 Item의 latent factor 행렬의 곱으로 분해
SVD와 유사하지만 관측된 선호도(평점)만 모델링에 활용
\[Rating Matrix를 P와 Q로 분해하여 R과 최대한 유사하게 \hat{R}을 추론 \\ R \approx P * Q^T = \hat{R}\]
Alternative Least Square (ALS)
-
정의
Implict Feedback 데이터에 적합하도록 MF 기반 모델을 설계하여 성능을 향상 -
Basic Concept
User와 Item 매트릭스를 번갈아 가면서 업데이트
두 매트릭스 중 하나를 상수로 놓고 나머지 매트릭스를 업데이트
p_u, q_i
가운데 하나를 고정하고 다른 하나로 least-square문제를 해결
03.31(금)
Item2Vec / ANN
Recommender Systerm with Deep Learning
DL / MLP / AE
댓글남기기