자세히 보기

사내 ‘데이터 과학’ 교육은 이렇게··· 전문가 4인의 조언

정보 자원을 활용할 수 있는 방법에 관해 알고 있는 기술 전문가(특히, 데이터 과학자)들에 대한 수요가 하늘을 찌르고 있다. 이에 일부 기업들은 직원들이 데이터 과학자가 되도록 새로운 기술을 가르치거나 교차 훈련시키는 데이터 과학 교육 프로그램을 구성하여 자체적으로 해결하고 있다.

데이터 과학은 많은 기업들에게 여전히 새로운 영역이며 이런 프로그램을 구성하고 유지하기란 쉽지 않다. 직원들에게 성공적으로 새로운 기술을 가르치는 방법에 관한 몇 가지 조언을 정리했다. 

데이터 과학 문화를 조성하라 누구든 잠재적으로 데이터 과학자가 될 수 있다고 생각하고,

이 전제가 중요하다는 것을 뒷받침하는 문화를 조성해야 한다. 브랜드 개발 및 마케팅 의사소통 대행사 히빙(Hiebing)의 수석 데이터 과학자 프랭크 밴더월은 “특정 전문가진을 확보하는 대신에 문화 전체를 데이터 지향적으로 바꿀 필요가 있는지 판단하는 것이 중요하다”라고 말했다.

밴더월은 “90년대 방식의 디지털 접근법을 사용해선 곤란하다 당시에는 조직 내에 디지털 팀이 있었다. 전문가 몇 명만 있으면 문제없었다. 지금은 모든 팀이 디지털화되어야 한다는 기대치가 있다. 일부 사람들에게 부담이 가중되는 대신 조직 전반에 걸쳐 전환이 필요하다”라고 말했다.

단, 데이터 과학의 전환 시점은 조직마다 다르다며 “아직 중대한 시점에 도달하지 않았지만 그 시기가 다가오고 있다”라고 그는 말했다.

문화의 변화에는 실질적으로 누구나 이해할 수 있는 언어의 사용이 수반된다. 밴더월은 “기본적인 것처럼 보이지만 간과하기 쉬우며, 특히 코치들의 경우는 더욱 그렇다. 우리는 언어에 대한 이해를 공유하는 것부터 시작해야 한다. 데이터 과학자는 특정 용어를 매우 쉽게 사용하지만 이런 것들을 보편적으로 이해할 수 있도록 풀어서 설명하지 않으면 다른 사람들이 위축될 수 있다”라고 말했다.

이것은 모두가 용어를 이해하도록 하는 것을 의미할 때가 있다. 용어를 접근성이 좀 더 좋은 언어로 대체하는 것을 의미할 때도 있다. 밴더월은 “학습자가 새로운 내용을 이해해야 하는 만큼 선생도 학생 입장을 이해해야 한다. 선생이 아니라 학생에게만 변화가 요구되는 경우가 너무 많다”라고 말했다.

또한 지식을 지속적으로 전달하는 것도 데이터 과학 문화 구축에 중요하다. 밴더월은 “데이터 과학자들이 아닌 다른 사람들이 스스로 데이터에서 가치를 창출할 수 있도록 돕는 것도 중요하다. 또한 교육을 받은 사람이 교육 내용을 확산시키도록 하는 것도 중요하다. 이 접근방식은 조직 전반에 걸쳐 지식과 스킬을 더욱 신속하게 그리고 더 높은 적용 수준으로 확산시킨다. 진정한 데이터 주도적 문화가 탄생하게 된다”라고 말했다.

그에 따르면 히빙은 우선 데이터에 관해 물을 적절한 질문을 파악하고 가능한 최선의 방법을 활용하여 결과를 적절히 해석할 마케팅 사이언스 팀을 구성했다.

밴더월은 “하지만 그 다음 문제는 그것을 조직의 나머지 부분으로 확산하는 것이었다. 왜냐하면 우리의 마케팅 사이언스 팀은 우리가 진행 중인 모든 프로젝트에 긴밀하게 참여할 수 없기 때문이다. 우리는 조직 내의 다른 사람들도 교육시켜 실제로 모든 프로젝트에 데이터 중심적인 인사이트를 일관되게 적용할 수 있도록 해야 했다”라고 말했다.

해당 기업은 (기술적인 속성을 갖는 경향이 있는) 시민 데이터 과학 온라인 과정 등의 공식적인 외부 교육과 더욱 맥락적인 내부 세미나를 결합하는 프레임워크를 구축하고 있다고 밴더월이 말했다. 이 프로그램은 현재 조직 전반에 걸쳐 제공되고 있다.

대학과 협력하라
많은 고등 교육 기관들이 최근 데이터 과학 프로그램을 출범했으며 이런 자원은 조직의 교육 프로그램을 마련하는 데 훌륭한 파트너가 될 수 있다.

제조 솔루션 제공 기업인 자빌(Jabil)은 현지 대학들과 협력하여 데이터 과학 교육 프로그램을 개발했다고 수석 부사장 겸 CIO 메이 얍이 말했다. 이 프로그램은 비즈니스 전문가들에게 통계 분석, 컴퓨팅 수학, 도메인별 데이터를 이용한 문제 해결 등의 새로운 기술을 가르친다.

얍은 “린(Lean)이나 식스시그마(Six Sigma) 등의 다른 방법론과 마찬가지로 이런 스킬을 모든 현업 부서에 보급해야 하며 이 기술적 스킬이 자빌의 목표와 비전을 더욱 발전시킬 것이라 기대한다”라고 말했다.

대학과의 파트너십은 이 프로그램의 핵심 구성요소이다. 하지만 이런 프로그램에 적합한 파트너를 신중하게 선택할 필요가 있다는 주문이다. 

얍은 “대학 파트너를 현명하게 선택하고 이미 데이터 과학 프로그램과 학과에 투자한 파트너를 찾으라. 또한 자신의 기업이 속한 산업과 개방적으로 협력하는 파트너를 선택해야 한다”라고 말했다.

공식적인 교육 파트너를 활용하는 것이 좋은 이유는 2가지라고 얍이 말했다. 우선, 기술에 대한 편견이 없으며, 따라서 분석 애플리케이션과 도구가 발전함에 따라 프로그램이 발전할 수 있도록 할 수 있다. 둘째, 기관들과 협력하면 조직의 인재 채용 풀이 형성된다.

자빌의 데이터 과학 프로그램을 통해 전 세계 약 200명의 직원들이 성공적으로 새로운 기술을 배웠고 해당 기업은 향상된 제조 속도, 제품 품질, 혁신을 통해 고객들에게 비용 절감과 더 큰 가치를 제공하는 예측 인사이트를 얻게 되었다. 자빌 직원들이 진행한 프로젝트 중에는 예측 공구 교체, 제조 폐기물 및 비용 감소, 최적화된 기계 부품 가격 등이 있다.

지속적인 개선에 집중하라
데이터 과학 교육 프로그램은 지속적인 개선과 인재 개발을 강조해야 한다. 그렇지 않으면 인재들이 떠날 가능성이 높아진다.

기업을 위한 상업용 데이터, 분석, 인사이트를 제공하는 D&B(Dun & Bradstreet)의 수석 데이터 과학자 앤써니 스크리피그나노는 “우수한 데이터 과학자를 교육하는 프로세스를 확보해야 한다. 그들은 권태를 느끼고 ‘신선함’을 유지하기 위해 다른 곳에서 대체 도전 과제를 찾는 경향이 있다”라고 말했다.

이를 설명하기 위해 스크리피그나노는 대대적인 IT 전환을 진행하고 있던 한 조직에서 근무하면서 경험한 일을 이야기했다. 해당 조직은 약 4시간 분량의 교육을 준비하여 전 세계 수천 명의 사람들에게 다양한 언어로 제공할 계획이었다.

스크리피그나노는 “한 고위 관리자가 전통적으로 업무를 수행하기 위해 컴퓨터 스킬을 사용할 필요가 없었던 직원 집단을 교육하는 것과 관련하여 문제를 제기했다”라고 말했다. 

그 관리자는 직원들이 새로운 영역의 기술을 배우게 되면 역량 강화로 인해 그들의 보상 및 계약에 문제가 발생할 수 있다는 우려를 표명했다. 또한 보유에 대한 우려도 있었다. ‘우리가 그들을 교육했는데 그들이 떠나면 어떻게 될까?’라는 반대 의견이 있었던 것이다. 

그러나 이 우려에 대한 답변은 선명했다. ‘그들을 교육시키지 않고 그들이 남아 있으면 어떻게 되는가?’라는 것이었다. 스크리피그나노는 “교육과 지속적인 개선은 기술 혁신 측면에서 [필수적이다]”라고 말했다. 

실질적인 비즈니스 문제와 과제를 활용하라
교육 프로그램의 일환으로 이론적인 예를 드는 것도 좋지만 학생들은 데이터 과학을 ‘혁신 속에서’ 실제로 적용하는 방법을 아는 것이 중요하다.

자빌의 프로그램은 교육에 대해 ‘시나리오 기반’ 접근방식을 취한다고 얍이 말했다. 그녀는 “직원들을 3~4명 규모의 그룹으로 구성하고 프로세스, 기법, 연습에 대한 교육을 받으면서 문제를 해결하기 위해 협력하도록 한다. 각 문제는 비즈니스 후원자가 있어야 하며, 최소 1명의 학생이 해당 비즈니스 문제의 핵심 비즈니스 영역에 대한 전문지식이 있어야 한다”라고 말했다.

해당 기업의 프로그램의 또 다른 중요한 부분은 학습 지원자 기능을 하는 조직의 기술 전문가들과 협력하는 것이다. 얍은 “이 학습 보조자의 역할은 검은띠 코치들이 조직 내에 파견되어 린 또는 식스시그마 이니셔티브를 지원하는 것과 매우 유사할 것이다”라고 말했다.

임원들을 교육하라
자빌은 또한 반나절부터 하루까지 진행되는 임원 데이터 과학 수업도 제공한다. 이것들은 임원들이 데이터 과학자들이 사용하는 데이터 과학 이론과 보편적인 용어를 이해하도록 도우면서 데이터 과학 프로젝트의 진가를 알아보고 이를 효과적으로 지원할 수 있는 방법에 관해 알려준다.

의료기업 GSK도 임원교육을 강조한다. GSK의 데이터 및 애널리틱스 가속 책임자 니키 워커는 “데이터 과학 능력은 데이터 과학자만을 위한 것이 아니다. 데이터 과학 분야에 대한 심층적인 전문지식을 쌓는 만큼 리더 및 관리자들이 데이터 과학을 익히고 익숙해지도록 하는 것도 중요하다”라고 말했다.

데이터 과학 능력을 가르치면 알고리즘에 대한 신뢰가 쌓여 관리자들이 분석에 기초한 자신감으로 의사를 결정할 수 있게 된다. 워커는 “데이터 과학이 제고하는 가치에 대한 스토리를 잘 전달하게 되면 더 많은 데이터 과학을 위한 풀이 만들어지고 이를 기업의 DNA에 통합하게 된다. 데이터 과학 프로그램의 중요한 구성요소이다. 우리의 데이터 과학 전문가들은 비즈니스 파트너들이 이해에 기초하여 답변할 때 가치와 보람을 느낀다”라고 말했다.

데이터 과학 전문지식이 반복적이라는 사실을 강조하라
데이터 과학 교육에 참여하는 학생들과 비즈니스 전문가들은 여러 단계를 거치게 될 것이라고 얍이 말했다. 여기에는 문제에 대한 이해, 데이터 이해, 데이터 준비, 모델링, 결과 평가가 포함된다.

얍은 “그들은 프로세스를 통해 비즈니스 문제를 다듬고 새 아이디어를 얻으며 이것들을 반복하여 인사이트나 기대하는 예측 인사이트를 유도하기 위해 해결해야 할 수 있는 다른 격차를 확인해야 한다”라고 말했다. 

이런 격차에는 데이터 변동, 데이터 액세스, 데이터 품질 그리고 경우에 따라 분석을 자동화하거나 대규모 데이터 세트를 관리하기 위해 필요한 누락된 기술이 포함될 가능성이 높다고 얍이 말했다. 

그녀는 “이상을 찾아내기 위해 인공지능/머신러닝 기술을 적용하거나 데이터와 이해를 개선하기 위해 사용할 분류 모델을 [구축하는] 것만큼 간단할 수 있다”라고 말했다. dl-ciokorea@foundryco.com