[Project] Books_Recommendation_Platform

2023-04-28 Friday

Week 06 ~ 07 [2023.04.10 ~ 2023.04.21] 동안 진행했던 네이버 커넥트재단 Book Rating Prediction 기초 대회에서 개발했던 머신러닝 예측 모델을 웹 서비스 서빙에 알맞은 모델로 새롭게 학습을 진행 한 후 모델 서빙 프로젝트를 진행하였습니다.

Books_Recommendation_Platform

Naver BoostCamp AI Tech 5th Recsys Product Serving by Streamlit

Books_Recommendation_Platform은 사용자 입력을 기반으로 책 추천을 제공하는 플랫폼입니다.
머신 러닝 알고리즘을 사용하여 사용자의 입력 기반으로 어떤 책을 선호할지 예측합니다.

GitHub - Books_Recommendation_Platform
Website - books-recommendation-platform

- Files

Books_Recommendation_Platform
├── Book_Rec
│   ├── app.py
│   ├── data
│   │   ├── idx2info.pkl
│   │   └── info2idx_convert_data.pkl
│   ├── model
│   │   ├── README.md
│   │   ├── catboost_model_IALLC.pkl
│   │   └── catboost_model_IALL_.pkl
│   └── src
│       ├── __init__.py
│       ├── data_loader.py
│       ├── info2idx.py
│       ├── model_loader.py
│       └── predict.py
├── README.md
├── poetry.lock
└── pyproject.toml

이 프로젝트에는 다음과 같은 파일이 포함되어 있습니다:

- app.py

Streamlit 어플리케이션을 실행하는 주 파일입니다. 사용자 입력을 처리하고 결과로 나오는 책 추천을 표시합니다.

상위 book list를 하위 묘듈을 통해 반환을 받은 후 info2idx.py의 info_data_load()를 통해 books data를 불러온 후 request를 통해 책의 이미지를 불러오고 로컬 데이터셋에서 이름, 작가, 출판 년도를 합쳐 Streamlit 화면에 출력합니다

- data 폴더

머신 러닝 모델에서 사용하는 데이터가 포함된 폴더입니다. idx2info.pkl과 info2idx_convert_data.pkl 두 개의 pickle 파일이 있습니다.

- model 폴더

책 추천에 사용되는 머신 러닝 모델이 포함된 폴더입니다. catboost_model_IALLC.pkl과 catboost_model_IALL_.pkl 두 개의 pickle 파일이 있습니다.

- src 폴더

머신 러닝 모델이 예측을 수행하는 데 사용하는 Python 모듈이 포함된 폴더입니다. data_loader.py, info2idx.py, model_loader.py, predict.py이 있습니다.

data_loader.py

idx2info.pkl의 isbn의 값을 기반으로 add.py에서 받은 데이터를 합쳐 예측을 위한 인풋 데이터셋을 구성합니다
info2idx.py

에측을 위해서 idx2info.pkl, info2idx_convert_data.pkl의 파일을 불러와서 add.py로 넘겨주는 파일입니다
model_loader.py

catboost_model_IALLC.pkl, catboost_model_IALL_.pkl category 사용 여부에 따라 예측 모델을 predict.py로 넘겨주는 파일입니다
predict.py

인풋 데이터셋을 받아 예측 모델을 통해 rating을 예측하고 app.py로 결과를 반환합니다

- README.md

현재 읽고 있는 파일입니다. 이 프로젝트의 개요와 사용 방법에 대한 설명을 제공합니다.

- poetry.lock 및 pyproject.toml

이 파일들은 Poetry를 사용하여 프로젝트 종속성을 관리하는 데 사용됩니다.

- Flow Chart

- Usage

책 추천 플랫폼을 사용하려면 다음 단계를 따르세요:

이 저장소를 로컬 컴퓨터에 복제합니다.
Poetry를 사용하여 필요한 종속성을 설치합니다. poetry install
app.py를 실행합니다. streamlit run app.py
웹 브라우저를 열고 http://localhost:[할당된 포드번호]로 이동합니다.
데이터를 입력하고 “Recommend Books”를 클릭합니다.
페이지에 표시되는 추천 책을 확인합니다.

- License

Python: PSF (Python Software Foundation) 라이선스
Streamlit: Apache-2.0 라이선스
Pandas: BSD-3-Clause 라이선스
NumPy: BSD-3-Clause 라이선스

회고

개선 해야 될점

대부분의 책 데이터가 영어 도서로 이루어져 있고, 2006년에 출판된 도서가 데이터 셋에서 가장 최신 도서이기 때문에 추천 되는 결과도 노후되어 있다
시리즈가 연속적으로 추천 되어 추천의 다양성이 떨어지는 경우가 있다
접속한 유저 데이터를 기록하지 않아 개인화와 로그 수집 및 추가적인 모델 학습이 어렵다

Twitter Facebook LinkedIn

Brother_Gyu

[Project] Books_Recommendation_Platform

Books_Recommendation_Platform

Naver BoostCamp AI Tech 5th Recsys Product Serving by Streamlit

- Files

- app.py

- data 폴더

- model 폴더

- src 폴더

- README.md

- poetry.lock 및 pyproject.toml

- Flow Chart

- Usage

- License

회고

개선 해야 될점

공유하기

댓글남기기

최근 포스트

[uv] uv 처음 설치하기

[Recommender Systems] test post

[Setting] cuda/cudnn 설치하기

[Util] 알면 편한 유틸리티들