본문 바로가기
이것저것

연봉 1억 이상! 21세기가장 섹시한 직업AI 빅데이터전문가

by 성공한 사막여우 2021. 4. 13.

 

“10년 전 나는 대부분의 고등학생들이 그렇듯이 수능 점수에 맞추어서 학교와 학과를 고르던 중 적당해 보이는 컴퓨터 관련 학과에 진학했다. 잘 모르고 진학해서인지 C, C++ 프로그래밍 언어 수업과 컴퓨터구조, 전산학개론, 오퍼레이팅 시스템과 같은 전통적인 컴퓨터학과 수업이 내 적성에 전혀 맞지 않았다. 재미도 없었고 이해도 잘 안 되었다. 그래도 수학, 통계, 데이터 관련 수업은 재미있었기에 석사는 산업공학을 전공하게 되었고, 그러던 중 데이터 마이닝, 빅데이터에 대해서 더욱 심층적으로 공부하게 되었다. 이후에는 딥러닝에 대해서도 찾아서 공부했다.”“AI 빅데이터를 공부하면 할수록 더 깊게 하기 위해서 안간힘을 썼다. 일부러 빅데이터 분석을 전문으로 하는 중소기업으로 이직하기도 했으며 코세라와 같은 해외 대학 AI 빅데이터 강좌를 찾아서 들었다. 관련 자격증 공부도 해보았으며 SNS에서 광고하는 데이터 관련 오프라인 강의도 들어보았다. 나중에는 박사 과정에까지 진학하기도 했다.”

“21세기 대다수의 회사에는 데이터 과학자가 있다. 아마존은 2000년대 초 고객 구매 패턴을 분석한 ‘맞춤 추천 서비스’를 내놨다. 이러한 추천 서비스는 넷플릭스, 유튜브에서도 이미 널리 사용되고 있으며 국내의 크고 작은 쇼핑몰에도 적용되고 있다. 나도 국내 쇼핑몰 몇 군데에 추천 시스템을 제작해주었는데 실제로 이 시스템 적용 이후 쇼핑몰 매출액이 꽤 크게 상승했다. 구글은 빅데이터를 활용한 독감 예측 시스템, 지진 예측 시스템 등을 내놓고 있다. 이런 빅데이터를 능숙하게 다루는 데이터 과학자의 전망은 밝다.

현재 데이터 과학자를 원하는 기업은 많지만 공급은 부족하다. 신종 직업인 데다 1~2년 배워서 역량을 발휘하기 힘들다. 통계와 컴퓨터 공학에 능숙해야 할 뿐만 아니라 경영·경제·인문학 지식도 필요하다. 여기서 말하는 데이터 과학자는 곧 ‘AI 빅데이터 전문가’라고 말할 수 있다. 빅데이터를 가공하고 학습해 AI 모델을 만들 수 있기 때문이다. 앞으로 이 책에서는 AI 빅데이터 전문가라고 명명하겠다.”

 

 

 

이런저런 방향으로 공부를 하다가 느낀 점은 제대로 배울 수 있는 곳이 거의 없다는 것이었다. 우선 현재 대부분의 교수진이 1980~1990년대에 공부한 사람들이라 AI 빅데이터에 대해서 잘 몰랐다. ERP, 룰 베이스 시스템rule based system이 유행이었던 시대에 공부했기 때문에 최근 트렌드를 깊이 이해하지 못했다. 일부 AI 빅데이터 전문가들은 해외나 기업에 소속되어 있어서 직접 만나서 배울 수도 없었다. 그리고 일주일에 한 번, 세 시간씩 배운다고 배워지는 게 아니기 때문에 결국에는 혼자 공부하는 방법밖에 없다고 느꼈다.

나는 데이터 분석 관련 회사 대표이기 때문에 돈을 벌기 위해서 어쩔 수 없이 치열하게 공부할 수밖에 없었다. 학문 특성상 공부할 게 워낙 많기 때문에 최대한 효과적이고 빠르게 공부하기 위한 방법을 고민했고 나름대로 직접 실천해본 방법들을 이 책에 소개했다. 나는 사람들에게 많이 인용되거나 학자라면 누구나 잘 아는 논문을 쓰거나 하지는 않았다. 사실 사업을 하기 때문에 논문에 내 시간을 온전히 투자하기도 어려웠다. 하지만 AI 빅데이터 관련 다수의 프로젝트를 진행하면서 국내 기업들이 정말로 원하는 데이터 분석이 무엇인지 알 수 있었다. 그래서 그들이 원하는 데이터 분석 수준과, 그 정도 수준의 분석가가 되기 위해서는 어떠한 것을 공부해야 하는지 명확히 알게 되었다.

물론 상대적이지만 그렇게 어렵지 않다.

적당히 수학을 좋아하고, 적당히 컴퓨터 프로그래밍을 할 수 있는 사람이라면 누구든지 할 수 있다.

특별히 천재 수준의 두뇌가 필요하지 않다.

“나는 다수의 대학생, 취준생, 직장인 들에게 질문을 받는다. 주로 AI 빅데이터 공부를 하려고 하는데 대학원을 진학하거나 자격증을 공부하는 것이 도움이 되는지를 물었다. 물론 대학원이나 자격증도 하나의 공부 방법이 될 수 있다. 하지만 대학원이나 자격증을 통해서 배우는 수준은 너무 얕다. SNS에서 광고하는 학원에서 배우는 수준은 더더욱 얕다. 결국 자신이 스스로 공부해야 실력이 늘 수 있다. 그렇게 오래 걸리지도 않는다. 이 책에서 제시하는 가이드대로 공부하면 금방 국내에서 요구하는 AI 빅데이터 분석은 할 수 있다. 이 책에서는 단계별로 공부할 부분과 어느 책으로 공부하면 좋을지를 자세히 소개했다. 어느 정도 재능이 있는 사람이면 1년 안에 이 책에서 이야기하는 공부를 마칠 수 있다.

“시대의 흐름을 타라”라는 말이 있다. 4차 산업혁명 시대에 AI 빅데이터 전문가는 최고의 직업이다. 독자 여러분이 이 책을 따라서 빠르게 공부하고 최고의 직업군에 편승하기를 진심으로 바란다.”

 

“이러한 AI 빅데이터 전문가가 되기 위해서는 우선 가장 기본적으로 코드를 작성할 줄 알아야 하며 분석 결과를 이해관계자들이 모두 이해할 수 있도록 스토리텔링을 할 수 있는 능력도 필요하다. 또한 모델을 구축하기 위해서는 수학, 통계학적인 지식도 필요하다. 즉 컴퓨터, 경영학, 언어학, 수학 등 복합적인 학문을 두루 갖춘 융합 인재인 것이다. 이러한 융합 인재이기에 21세기에 가장 섹시한 직업으로 꼽히는 것이다.”

 

 

 

“AI 빅데이터 전문가는 구하기도 힘들고 고용하기도 어렵다. 과학적 지식, 컴퓨터공학적 스킬, 분석 능력을 두루 갖춘 사람은 매우 드물다. 따라서 이러한 인재에 대한 갈급함은 앞으로도 심화될 것이다. 물론 국내에서도 각종 컴퓨터 학원과 대학 기관에서 관련 학과를 개설하기 시작했지만 아직까지 AI 빅데이터 전문가가 쏟아져 나올 때까지는 꽤 많은 시간이 걸릴 것이 분명하다. 그리고 너무 우후죽순 교육 과정이 개설되다 보니 과정 이름은 AI 빅데이터 전문가를 양성한다고 하지만 실상은 일반 개발 과정이나 다를 바 없는 과정이 대부분이다. 그리고 단순히 컴퓨터 코딩 스킬을 알려주거나 코드를 복사해 붙여넣기 하는 식으로 속성으로 알려준다. AI 빅데이터 전문가는 복합적인 영역을 체계적으로 밟아가야 하는데 두서없이 속성으로 알려주는 교육 기관들을 보면 안타깝다.

 

 

AI 빅데이터 전문가는 컴퓨터만 있으면 어디든 일을 할 수 있기 때문에 한 곳에서 근무하는 것이 아닌 여러 곳에 걸쳐서 일을 할 수 있다.

실제로 AI 빅데이터 전문가로 활동하고 있는 나는 현재 대부분의 일을 집에서 하고 있지만 소속된 업체만 네 군데나 된다.

굳이 그 업체에 출근하지 않아도 재택근무를 하며 일을 하고 있다.

물론 네 곳 모두에서 월급 또는 수익을 창출하고 있다.

의사와 같은 직업은 현장에서 직접 환자를 보아야 하기 때문에 한 곳에서만 일을 할 수 있지만 AI 빅데이터 전문가는 굳이 한 곳에 소속될 이유가 없다.

 

 

우선 데이터에 대한 지식이 필요하기에 데이터베이스에 대한 사전 지식이 필요하다. 

과거 RDB뿐만 아니라 최근에 많이 쓰는 No-SQL까지 알아야 한다. 

또한 이와 관련해서 서버에 대한 지식도 어느 정도 필요하다. 

데이터베이스 및 데이터가 서버에 적재되어 있는 경우가 대다수고 분석도 데스크톱보다는 서버에서 이루어져야 효율이 높다. 

솔루션이나 API 제작 같은 경우도 다 서버에서 이루어진다. 

데이터 전처리 및 가공 능력은 당연히 필수적이다. 

또한 수학, 통계학적 지식이 있어야 이를 응용해 가공된 데이터로 모델을 만든다.

이러한 과정은 다 코딩으로 이루어지는데 파이썬Python, R, 스파크Spark와 같은 언어들이 주로 쓰인다. 

각 언어마다 각기 장단점이 있기에 한 가지 언어를 알기보다는 최소 두 개 이상은 구현하는 게 좋다. 

분석을 마친 이후에는 결과를 더 잘 알아보기 위해 시각화를 해야 한다. 

분석 결과를 보고서로 작성할 때에는 인문학적 언어 능력, 경영학적 능력도 필요하다. 

분석 결과를 자동화 솔루션으로 제작하기 위해서는 웹 개발 능력까지 필요하다. 

마지막으로 사람들 앞에서 결과를 전할 때에는 뛰어난 의사소통 능력까지 요구한다.

 

 

창업 시 개인 초기 자본이 필요 없다
창업할 때 가장 고민거리 중 하나는 바로 초기 자본이다.

회사를 그만두고 창업 또는 조그마한 가게라도 차리려면 초기 자본이 필요하다.

집 앞에 조그마한 편의점이나 카페, 치킨 집을 하려고 해도 기본 1억 원은 드는 세상이다.

월급 300~500만 원을 받아 차근차근 모아 1억 원을 만들기도 어렵고 설사 1억 원을 투자한다 하더라도 회사 다닐 때보다 많이 번다는 보장도 없다.

이러한 업종들은 매출의 대부분을 아르바이트생 월급, 월세로 나가기 때문이다.

사장이 가져가는 순이익이 월 200만 원이라도 되면 다행이다. 

“그나마 나이가 좀 있는 중장년층은 모아둔 돈으로 초기 자본을 갖출 수 있지만 20대 중후반~30대 초반 청년층들은 그마저도 어림없다.
하지만 만약 AI 빅데이터 전문가가 되어 창업을 한다면 어떨까? 우선 초기 자본이 전혀 들지 않는다. 나도 개인사업자 한 곳, 법인사업자 한 곳에서 대표와 이사를 맡고 있다. 초기 자본은 전혀 들지 않았다. 굳이 자본이 들었다고 한다면 성능 좋은 장비를 갖추기 위해 컴퓨터 CPU, 메모리, GPU 정도 구입한 게 전부다. 사무실 역시 굳이 필요하지 않다. 식당처럼 손님들이 앉아서 먹을 장소가 필요한 게 아니다. 그냥 컴퓨터가 있을 공간만 있으면 된다. 그래서 사무실도 그냥 내 집으로 했다.

그리고 정부에서 지원해준 사무실이 있어서 그것도 사무실로 두었다. 

임대료가 전혀 나가지 않는다. 

사업 유지 비용으로 나가는 것 중 하나가 서버 비용인데 아마존 AWS 서버로 월 얼마씩 나가는 게 전부다. 

그마저도 정부 지원 딥러닝 서버를 받은 게 있어 이걸로 꽤 많은 부분을 충당했다. 

결론적으로 말하면 인테리어 비용, 장비 및 재료 비용, 임대료, 권리금, 보증금 이런 것들이 거의 필요 없다.

더군다나 인건비도 상대가 안 된다. 요새는 최저임금이 너무 많이 올라 웬만한 소상공인은 인건비를 감당하지 못하고 있다. 치킨 체인점, 카페, 편의점, 식당 등 대부분 소상공인들은 인건비를 아끼고 싶어 사장이 직접 발로 뛰거나 가족이 참여한다. 하지만 그렇다고 직원을 한 명도 안 쓸 수 있는가? 불가능하다. 적어도 두세 명은 파트타임으로 두는 경우가 많다. 소상공인이 아닌 일반 제조업, 유통업 같은 경우도 마찬가지다. 정규직 직원을 두는 순간 엄청나게 많은 인건비가 발생한다. 각종 세금 및 주휴 수당까지 사장이 납부를 해야 해서 큰 부담이 된다.

하지만 AI 빅데이터 전문가가 창업할 때는 많은 수의 인력이 필요하지 않다. 

그리고 협력할 팀원이 필요하면 프리랜서로 쉽게 그때그때 구할 수 있다. 

굳이 직원으로 고용하며 각종 세금 및 주휴 수당까지 지불할 필요가 없다. 

프로젝트를 할 때마다 필요한 인력을 외주 또는 프리랜서로 해결할 수 있다. 외주 인력, 프리랜서를 구하는 방법은 너무나 쉽다. 크몽, 위시켓, 프리모아, 오투잡 등 인터넷 플랫폼을 이용하면 쉽게 구할 수 있다. 

이렇듯 초기 자본도 거의 안 들이고 고정 비용도 거의 없다 보니 여유가 생긴다. 실질적으로 개인 돈이 나가는 게 없기 때문에 절대 적자가 날 수가 없다.

흔히 회사원들이 회사 다니면서 일하는 게 너무 힘들어서 직접 창업하는 경우가 많다. 하지만 창업을 하는 순간 회사원보다 더 많이 일하는 경우가 많다. 인건비를 아끼기 위해 하루 열두 시간씩 직접 치킨을 튀기며 일을 하지만 겨우 200만 원 정도밖에 못 버는 치킨 집 사장님들이 수두룩하다.

하지만 AI 빅데이터 전문가가 창업하면 그럴 일이 없다.

일도 많이 할 필요가 없으며 나가는 돈도 거의 없어 순이익이 많다.

 

 

직장에 얽매일 필요가 없다
굳이 출퇴근하지 않아도 회사원 월급보다 많이 벌고 회사원보다 일은 적게 하는 최고의 직종이 있다면 믿어지는가? 

바로 AI 빅데이터 전문가가 그렇다. 내가 직접 체험하고 몸소 겪고 있다. 굳이 회사를 안 다녀도 된다. 현재 AI 빅데이터 전문가에 대한 수요가 너무나 많기 때문에 굳이 한 직장에 얽매일 필요가 없다.
앞 장에서 누누이 말했지만 전 세계, 특히 대한민국에서는 AI 빅데이터 전문가 인력이 너무나 부족하다. 대기업은 그나마 몇 안 되는 해외, 국내의 석박사급 인력을 겨우겨우 보충하거나 사내 교육으로 근근이 버티지만 중소〮중견 기업, 스타트업들은 절대적으로 인력을 구할 수가 없다. 우선 AI 빅데이터 고급 인력들이 중소기업이나 스타트업에 가려 하지도 않고 기업들도 그들의 눈높이에 맞는 연봉을 챙겨줄 수가 없기 때문이다. 그렇다고 AI 빅데이터를 회사 정책상 배제할 수도 없다. 정부 R&D 지원을 받거나 정부〮대기업 하청 과제를 받으려 해도 AI 빅데이터가 필수다. B2B, B2C 솔루션을 제작하려고 해도 AI 빅데이터가 무조건 키워드로 들어간 제품이어야 한다. 그렇다면 이들 기업은 외주밖에 답이 없다. 외주로 다른 회사에 맡기거나 프리랜서에게 맡기는 형식인 것이다. 중소기업이나 스타트업은 자금력이 부족하기 때문에 사실상 외주로 맡기게 되어도 업체보다는 프리랜서에게 맡기는 경우가 많다.

“AI 빅데이터 전문가 프리랜서는 현재 굉장히 적다. AI 빅데이터 인력 자체가 많지가 않고 그나마 있는 인력도 어떠한 단체에 소속되어 있는 경우가 많다. AI 빅데이터 전문가들은 대부분 석박사급 인력인데 이들 대다수가 대학원 랩실에 묶여 있다. 대학원에서 교수가 맡기는 프로젝트만 진행해도 바빠 개인적인 프로젝트를 받을 시간이 없다.

또한 석박사 졸업 이후에도 대기업, 정부 출연 연구소, 학교 등에 취업하기 때문에 개인적으로 프리랜서를 하는 사람은 거의 없다. 프리랜서 플랫폼인 크몽, 오투잡, 위시켓, 프리모아 등에 접속해 ‘AI 빅데이터 전문가’와 ‘웹 개발자’, ‘모바일 개발자’를 검색해보라. 아마 ‘웹 개발자’, ‘모바일 개발자’가 수십, 수백 명 나오는 데 비해서 ‘AI 빅데이터 전문가’는 열 명도 안 될 것이다. 정확히 말하면 다섯 명도 안 나올 것이다. 따라서 당신이 AI 빅데이터 프리랜서로 뛰어든다면 경쟁자가 거의 없다는 장점을 누릴 수 있다.

아무리 경제학을 모른다 하더라도 수요와 공급의 법칙 정도는 알 것이다. 수요에 비해 공급이 많으면 가격은 떨어지고 공급에 비해 수요가 많으면 가격이 올라간다. 현재 AI 빅데이터 시장은 수요가 폭발적으로 증가하는 데 비해 공급의 증가 속도가 매우 더디어 수요에 비해 공급이 매우 부족하다. 따라서 다른 IT 개발 프로젝트에 비해서 비교적 고액을 받고 프로젝트를 진행할 수가 있다. 또한 할 수 있는 사람도 얼마 없기 때문에 소수의 AI 빅데이터 전문가들이 다수의 프로젝트를 독점한다.

 

 

 

“① 출퇴근 시간 등 의미없는 시간을 줄인다
우선 출퇴근, 의미 없는 회의, 회식 같은 시간을 절약할 수 있어 온전히 일할 수 있는 시간을 최대한 확보할 수 있었다. 대한민국 평균적인 회사원을 예로 들어보면 출퇴근 시간으로 하루에 세 시간 정도 쓰고 기획회의, 팀 미팅, 프로젝트 미팅 등 쓸데없는 시간에 하루 한 시간 이상씩 낭비한다. 중간중간에 점심시간, 티타임, 담배 피는 시간 등으로 1시간 이상 낭비하고, 일 끝나고 회식에 시달리며 소중한 저녁시간을 낭비하기도 한다. 어림잡아도 하루에 네다섯 시간은 이렇게 의미 없이 시간을 보낸다. 하지만 프리랜서는 이런 일에 시간을 쓸 필요가 없기 때문에 네다섯 시간을 추가로 온전히 일하는 데 집중할 수 있다. 또한 출퇴근뿐 아니라 사람 상대하는 데 쓰는 에너지, 체력도 아낄 수 있어 집중력이 훨씬 증가될 것이다.”

“② 협업을 통해 전문적인 부분만 맡는다
다른 이유도 있다. 바로 AI 빅데이터 전문가는 직종 특성상 협업을 하는 프로젝트가 대다수다. 물론 AI 빅데이터 전문가가 전 분야에 걸쳐서 일을 다 할 수도 있지만 그런 경우는 드물고 나도 추천하지 않는다. AI 빅데이터 업무만 집중해서 하기에도 프로젝트가 넘쳐나기 때문이다. 예를 들어서 데이터 분석 알고리즘을 토대로 어떠한 솔루션을 만들 수 있다. 그때 프론트 웹 개발과 백엔드 서버 쪽은 다른 전문가가 담당하고 분석 알고리즘 부분만 AI 빅데이터 전문가에게 의뢰하는 것이다. 이렇게 되면 상당히 일이 편하다. 데이터를 받아서 모델을 만들어서 모델 결과를 그대로 전해주기만 하면 된다. 다른 일반 개발자들이 상당한 시간을 쓰는 화면설계서, 기능명세서, DB 요구사항 정의서 같은 일을 하는 경우가 없다. 데이터를 받고 적절히 전처리한 후 결과가 잘 나오는 모델을 만들면 끝이다. 초스피드로 일을 끝내고 단가는 고액으로 받을 수 있다. 모델 결과를 예쁘게 포장해서 보여주는 부분은 프론트 개발자들이 알아서 해줄 것이다.”

“③ 기존 알고리즘의 재사용이 가능하다
마지막으로 데이터 분석 알고리즘의 특성상 몇 가지 반복적으로 많이 쓰이는 알고리즘들이 있기 때문에 복사가 가능하다. 즉 A 프로젝트에서 수행한 코드를 조금만 바꾸어서 B 프로젝트에 적용해서 쓸 수 있다는 것이다. 데이터 마이닝 책을 보면 몇 가지 알고리즘이 공통적으로 보인다.”

“만약 컴퓨터사이언스, 수학 관련 SCI급 저널에 논문을 투고할 경우라면 이러한 알고리즘을 그대로 쓰면 안 된다. 독창적으로 변형, 수정해서 알고리즘을 새롭게 만들어야 할 것이다. 하지만 실무에서는 그럴 필요가 전혀 없다. 기업들도 뭔가 독창적인 알고리즘을 원하는 것이 아니다. 자신들이 원하는 결과만 빠르게 나오면 그걸로 만족한다. 자신이 예전에 짠 코드를 그대도 써도 되고, 구글링해서 나온 코드를 그대로 써도 되고, 그것도 싫으면 라이브러리의 함수를 그대로 쓰면 된다. 절대 도덕적으로 비윤리적이거나 범법 행위가 아니다. 그저 빠르고 쉽게 일을 처리할 수 있는 요령이다. 물론 프로젝트마다 데이터가 다르기 때문에 처음에 데이터 전처리 부분은 어쩔 수 없이 그때그때 해야 한다. 하지만 전처리 부분만 끝나면 그다음부터는 그냥 복사해서 붙여넣기만 하면 된다. 꽤 단련이 되다 보면 한 시간 정도 만에 일을 끝내고 프로젝트 한 개를 완수하는 경우도 종종 있다.