지난 월요일에 부트캠프에서 진행하는 첫번째 개인 프로젝트가 끝났다.

첫 번째 개인 프로젝트는 4일 동안, 캐글(Kaggle)의 Video Game Sales 파일을 약간 변형한 파일을 가지고
다음 분기에 출시할 게임에 대한 제언을 목표로 분석을 진행하고
분석 결과에 대한 영상을 8분 안에 찍는 것이었다.

분석 과정에서 1) 연도별 게임 트렌드, 2) 지역별 선호 장르, 3) 출고량 높은 게임 분석 등을 포함하는 것이
개인 프로젝트의 목적이었는데..

결과를 정리하고,
주요 내용을 8분 안에 정리하려다보니
반드시 포함되어야 하는 분석의 내용은 모두 포함하였으나
추가로 실시한 K-Means Clustering 부분은 거의 설명도 못하고 발표를 마무리해야 했다.

분석 내용에서도 군집화를 하긴 했지만 변수가 많지 않다보니
군집화를 통해서 함의를 충분히 끌어내지 못한 점이 다소 아쉽다.

또, 분석에 활용한 비디오 게임 데이터는 2017년부터는 데이터가 불충분하고 모바일 게임에 대한 정보는 포함하고 있지 않다는 점도 아쉬웠다.

처음에 분석 계획을 세우고 데이터를 뜯어볼 때만 하더라도
시간이 그렇게 많이 걸릴 것 같지 않았는데,
전처리 과정이나 내용에 맞는 적절한 그래프를 만드는 과정이 생각보다 시간이 아주 많이 걸렸다.
(하지만 이번 경험이 쌓였으니 다음에는 더 빨라지겠지!!!)

결측치 처리도 크롤링 함수를 만들어서 시도했는데,
리스트 범위 오류가 생겨서 이런 저런 시도를 계속 하다가 결국은 활용하지 못했다.
크롤링과 함수를 결합하는 공부를 더 해야겠다고 생각했다.

하지만 그 과정 하나 하나가 재밌었고,
몰입해서 단계를 밟아나가는 경험도 좋았다.

정말이지 실제 현장의 데이터를 분석해보고 싶다!

덧붙이는 말

제가 이번 개인 프로젝트에서 작성한 코드 파일은 제 깃허브에 있습니다!

(추가) 과제 제출 후, 코치님으로부터 받은 코멘트는 다음과 같습니다.

첫 번째 과제 제출 후  받은 코멘트