List
데이터 프로젝트
데이터 분야로 취직하기 위해 새로운 지식을 배우는 것도 중요하지만, 배운 것들을 토대로 실제 프로젝트를 수행하는 것이 더욱 중요합니다. 특히 자신이 관심 있는 도메인에서 배운 지식을 활용한 프로젝트라면, 끝까지 재미있게 진행하며 마무리할 수 있습니다.
데이터 분야
데이터 분야는 크게 세 가지로 나눌 수 있습니다: 데이터 엔지니어링, 데이터 분석, 그리고 데이터 사이언스입니다. 각 분야의 특징은 다음과 같습니다.
1. 데이터 엔지니어링
데이터 엔지니어링은 데이터의 수집, 저장, 처리 및 관리를 담당하는 분야입니다. 대용량 데이터를 효율적으로 처리하기 위해 데이터 파이프라인을 설계하고 구축하며, 데이터베이스와 데이터 웨어하우스 등의 인프라를 관리합니다.
2. 데이터 분석
데이터 분석은 수집된 데이터를 해석하고 의미 있는 인사이트를 도출하는 분야입니다. 비즈니스 문제를 해결하거나 의사결정에 필요한 정보를 제공하기 위해 통계 기법과 데이터 시각화 도구를 활용합니다.
3. 데이터 사이언스
데이터 사이언스는 데이터 분석에 머신러닝과 인공지능 기법을 적용하여 예측 모델을 개발하고 복잡한 문제를 해결하는 분야입니다. 통계, 컴퓨터 과학, 도메인 지식 등을 융합하여 새로운 가치와 통찰을 창출합니다.
게임 데이터 프로젝트
다양한 도메인 중에서도 게임 도메인은 쉽게 접근할 수 있는 분야입니다. 살아오면서 다양한 게임을 해보며 관심을 가져왔을 수 있고, 게임 업계 자체가 취업 시장에서 큰 비중을 차지하기 때문에 많은 이들이 접근하는 분야입니다.
데이터 프로젝트를 수행할 때 가장 어려운 문제 중 하나는 데이터를 구하는 것입니다. 그래서 캐글이나 데이콘에 올라온 데이터셋을 열심히 검색하거나, 공공 데이터 포털에서 데이터를 찾습니다. 주제를 먼저 정하기보다는 관련된 데이터셋을 찾아서 분석 가능한 방향으로 주제를 정하는 경우가 많습니다.
하지만 게임 도메인으로 프로젝트를 진행할 때의 장점은 게임 회사에서 API를 통해 게임 데이터를 직접 제공하는 경우가 있다는 점입니다. 물론 제공되는 데이터가 원하는 방향과 다를 수 있지만, 다른 도메인보다 직접 데이터를 수집할 수 있기 때문에 주제를 설정하기가 더 수월합니다.
리그 오브 레전드(LOL)
저는 예전부터 게임을 좋아했고, 지금도 즐기는 게임 중 하나가 바로 리그 오브 레전드(LOL)입니다. LOL을 오래 플레이해왔다면, 게임에 대한 이해도가 높고, 어떤 데이터가 중요한지 판단할 수 있습니다. 또한 라이엇게임즈에서 제공하는 API도 있기 때문에 직접 데이터를 수집할 수도 있습니다.
그래서 LOL이라는 게임을 주제로 API를 이용하여 게임 데이터를 수집하고, 분석하고, 모델링하는 과정을 통해 데이터 엔지니어링 → 데이터 분석 → 데이터 사이언스로 이어지는 데이터 프로젝트를 진행하면서 LOL 데이터 프로젝트 A to Z 시리즈를 작성하려고 합니다.