안녕하세요 팀윙크에서 데이터를 담당하고 있는 최지현입니다. 저희 회사는 스타트업이어서 다양한 업무를 한 사람이 진행하게 되는데요, 데이터 과학자라는 직무를 담당하고 있지만 데이터 엔지니어링과 분석 또한 병행하고 있습니다. 주로 고객들의 신용흐름이나 자산 흐름을 토대로, 향후에는 어떤 금융 활동이 예상되는지를 파악하거나, 알고리즘을 적용하여 특정 업무에 맞는 모델을 작성하기도 합니다. 또한 서비스 현황을 파악하고 추적하기 위하여 WAU나 유저 활동지표 등의 서비스 인디케이터를 꾸준히 개발하고, 분석합니다. 더불어 오류가 발생하여 사용자들이 불편을 겪진 않았는지, 만일 오류가 발생했다면 이 오류는 어떻게 처리할 수 있는지 등을 파악하고, 개발팀에 시그널을 보냅니다.
| 필요한 역량
데이터와 관련한 업무를 수행하는데 있어서 중요한 역량은 다음과 같은 부문이라고 생각합니다.
SQL이나 python 등의 프로그래밍 스킬은 누구나 익힐 수 있습니다. 그러나 생각하는 방식과 문제해결 능력은 단기간에 상승시키기 어려운 부분입니다. 한 문제를 집요하게 파고들면서, 집중하고, 문제해결 방식을 체화할 수 있는 능력이 있다면 누구나 데이터 과학자가 될 수 있습니다.
| 장점
데이터 과학자의 가장 큰 장점은 서비스의 가장 깊은 곳에서 모든 방향으로 데이터를 바라볼 수 있다는 것입니다. 서비스가 진화할수록 다양한 데이터가 새롭게 쌓이고, 이를 토대로 더 나은 모델을 구성하거나, 구체적인 가설을 세워 실험을 진행해볼 수도 있습니다. 더불어 지속적으로 데이터를 추적하고, 여러가지 알고리즘과 추상적인 개념들을 유연하게 사용하기 위해서는 지속적으로 공부를 하기 때문에 자기계발을 즐기고, 스스로의 한계를 시험해보고 싶은 분들께는 매우 큰 장점으로 작용할 것이란 생각이 듭니다.. 저는 수학 또는 확률론을 공부하거나 소프트웨어 공학에 대하여 알아보는 것을 좋아해서 해당 부분을 공부하면서 서비스에 적용할 수 있는 이론들은 없는지 실험을 해보곤 합니다. 관심사가 비슷한 동료가 있다면 업무에 탄력이 붙어, 더 즐겁고 신나게 일할 수 있답니다.
| 단점
데이터 과학자로서 힘든 부분 중 하나는 공부할 것이 엄청나게 많다는 것과 일정 수준 이상의 집중력이 필요하다는 것입니다. 다양한 수학적 알고리즘들을 컴퓨터가 이해할 수 있도록 코드를 작성하고, 이 코드가 올바른 결과값을 주는지 파악할 수 있어야합니다. 그러려먼 컴퓨터가 연산을 하기 전에 실험을 진행하는 과학자가 어느정도의 결과의 특성들을 파악하고 있어야겠지요 ? 예를 들어 날짜를 구하는 프로그램을 작성했는데 string이 출력된다면 어딘가 잘못된 것입니다.