자세히 보기

‘도구에서 전략까지’ 데이터 애널리틱스 ABC

데이터 애널리틱스는 분명 기업들에게 상당한 경쟁 차별화 요소가 될 수 있다. 매출과 시장 점유율을 높이는 데 도움이 될 수 있는 인사이트를 제공

셀프 서비스 분석을 활용하라
셀프 서비스 분석을 통해 비즈니스 사용자는 IT의 지원을 거의 받지 않고 고급 분석 스킬 없이도 스스로 쿼리를 수행하고 보고서를 생성할 수 있다. 기본적인 분석 기능이 있는 사용이 간편한 BI 도구를 활용해서다.

셀프 서비스 분석 접근방식은 숙련된 데이터 분석가 부족으로 인한 공백을 메우는데 도움이 될 수 있다. 또 업무상 데이터 필요한 사용자에게 데이터를 직접 제공할 수 있다는 장점도 구현한다.

즉 현업 사용자는 데이터 사이언티스트(Data Scientist)나 기타 분석 전문가가 보고서를 생성할 때까지 기다리지 않고 데이터 분석을 기반으로 결정을 내릴 수 있다. 이는 시장 변화 또는 변화하는 고객 요구에 신속하게 대응하기 위해 움직여야 하는 기업들에게 큰 장점이 될 수 있다.

셀프 서비스 분석의 첫 번째 단계는 정보 요건과 필요한 도구를 포함해 사용자들의 현실을 전체적으로 이해하는 것이라고 IT 컨설팅 기업 CTG(Computer Task Group)의 수석 솔루션 설계자 존 월튼이 말했다.

월튼은 “정보 소비자와 임원 주주들은 데이터 사이언티스트와 요구하는 분석 도구 스위트가 전혀 다르다. 도구를 현업 요건에 맞추는 것이 매우 중요하다. 또한 셀프 서비스 분석은 깔끔한 데이터에 크게 좌우된다. 정보 이해관계자가 사용하고 있는 대시보드에 대한 신뢰를 잃을 경우 신뢰를 회복하기가 매우 어렵다. ‘도대체 내가 뭘 보고 있는지 모르겠다’고 말하고 사라질 것이다”라고 말했다.

또한 데이터 거버넌스 이니셔티브를 통해 정보 일관성을 수립하는 것도 좋은 생각이라고 월튼이 말했다. 그는 “이것이 마련되면 차원 데이터 아키텍처를 셀프 서비스 분석을 위한 ‘배관’으로 활용할 수 있다”라고 말했다.

이런 아키텍처에서 대시보드에 표시된 주요 성과 지표와 측정값은 승인된 비즈니스 규칙에 따라 사전에 계산된 것들이다. 또 적절한 비즈니스 필터 또는 분석의 차원과 관련되어 있고 데이터베이스에 저장된다. 분석 도구 사용자는 이 모든 힘든 작업을 할 필요가 없다고 월튼이 말했다.

머신러닝 역량을 배치하라
머신러닝(ML)은 데이터 분석 프로세스 개선에 중요한 역할을 할 수 있으며, 엄청난 양의 정보를 취급하는 조직의 경우에는 더욱 그렇다.

머신러닝에는 애널리틱스와 다른 아키텍처가 필요할 것이라고 월튼이 말했다. 그는 “데이터를 왜곡하고 잠재적으로 중요한 인사이트를 모호하게 만드는 사전에 계산된 지표를 적용하면 안 된다. ML은 그 역량을 가장 효과적으로 적용하기 위해 대부분은 관계형 데이터베이스 안에서 많은 양의 매우 세부적인 정보를 처리한다”라고 말했다.

예를 들어, 보험 부문의 기업은 엄청난 양의 청구 데이터, 환자 대응 데이터, 구조화된 메모와 비구조화 된 메모 등 많은 양의 데이터를 처리할 수도 있다.

머신러닝의 모범 사례는 올바른 목적을 위해 올바른 데이터 계층을 사용하는 것이라고 월튼이 말했다. 그는 “하단의 ‘수집’ 계층은 다양한 소스로부터 얻는 모든 데이터이며, 가장 덜 가공된 데이터가 ML에 이상적이다”라고 말했다.

미들 또는 ‘일치’(conformance) 레이어에서 데이터는 사전 수립된 데이터 거버넌스 규칙에 따라 표준에 맞추게 된다고 월튼이 말했다. 일련의 집중된 데이터 마트로 구성된 상위 레이어가 애널리틱스에 이상적이라고 그가 말했다.

데이터 E2E를 관리하라
많은 조직들이 다양한 소스로부터 얻은 엄청난 양의 데이터를 관리하느라 분투하고 있으며, 이로 인해 애널리틱스 이니셔티브가 좌초될 수 있다. 기업 전반의 데이터 관리를 돕기 위해 기술을 배치할 만한 이유다.

의료 공급 기업 폴 하트만 AG(Paul Hartmann AG)는 SAP의 데이터 허브(Data Hub)라는 중앙 관리 플랫폼을 사용하여 여러 내부 및 외부 소스로부터 얻은 데이터를 통합, 액세스, 분석한다. 목표는 데이터의 잠재력을 극대화하고 제조 및 공급망 최적화에 필요한 인사이트를 얻는 것이라고 CIO 겸 CDO 시나누딘 오메로직이 말했다.

오메로직은 “이런 발견사항에 접근할 수 있게 되면 고객들이 언제든지 필요한 제품을 확보할 수 있도록 도와 궁극적으로 환자의 생명을 살릴 수 있다”라고 말했다.

데이터 허브 기술을 활용함으로써 하트만은 고객, 공급자, 운영 데이터를 위한 ‘단일 정보원’을 수립하여 고객 문제를 더욱 잘 이해할 수 있도록 도울 수 있었다.

해당 기업은 현재 AI, IoT, 예측 분석 등의 기술을 더욱 잘 활용할 수 있다. 그리고 날씨와 전염병 등의 요소에 대한 새로운 데이터 소스를 활용하여 병원 및 약국에서의 수요를 더욱 잘 예측하고 필요한 용품을 적절한 시기에 적절한 양만큼 확보하도록 할 수 있다.

현업 사용자에게도 전체적인 데이터 전략을 교육하라
데이터 인사이트를 활용할 현업 사용자는 데이터 사이언스, AI, 머신러닝, 데이터 분석 전체에 대한 회사의 전략을 이해해야 한다. 이를 통해 현 상황을 이해할 가능성이 높아진다.

“발견 세션을 수행하여 비즈니스 및 운영 리더들이 AI와 ML의 이점을 이해할 수 있도록 하라”라고 조직들이 데이터를 활용하여 고객 경험을 높이도록 돕는 디지털 전환 컨설팅 기업 HGS 디지털(HGS Digital)의 글로벌 데이터 사이언스 및 분석 활동 책임자 베뉴 구티가 말했다.

구티는 “이는 특히 처음으로 데이터 사이언스 여정을 시작하는 조직에게 중요하다. [AI 및 ML을] 구현할 때 [HGS 디지털이] 직면한 가장 큰 장애물은 비즈니스 사용자에게 데이터 사이언스 프로젝트를 제공한 후 얻은 결과에 관해 교육하고 데이터 사이언스 프로젝트 제공에 대한 우리의 접근방식을 설명하는 것이었다”라고 말했다.

조직은 다양한 부서들이 협력하는 방법을 설명하는 데이터 전략이 있어야 한다고 구티가 말했다. 그는 “ML 이니셔티브는 (마케팅, IT, 운영 등) 여러 부서들과 협력해야 하기 때문에 이것이 필요하다”라고 말했다.

머신러닝에는 대용량 데이터 처리가 수반된다고 구티가 전했다. 예를 들어, 소매기업이 고객 이탈을 예측하기 위해 고객 인구 통계, 구매 이력, 고객이 구매한 제품 등 많은 데이터가 필요하다.

구티는 “이런 데이터는 일반적으로 이질적인 데이터 소스들로부터 얻게 되며 데이터를 수집하기 위한 통합된 소스가 아닐 수 있다. 따라서 팀은 다양한 부서들과 협력하여 데이터를 통합된 플랫폼에 적용해야 할 것이다. 데이터 전략과 데이터 거버넌스가 정의되어 있는 조직에서는 명확한 데이터 전략이 없는 조직보다 이 프로세스가 훨씬 원활하다”라고 말했다.

클라우드에서의 분석을 활용하라
IT 분야의 다른 것들과 마찬가지로 클라우드는 데이터 분석을 위한 비용 효율적인 옵션을 제공한다. 특히 엄청난 양의 데이터를 분석해야 하면서도 내부 역량이 부족한 조직에게 특히 유익하다.

클라우드를 통한 분석 수행 계획이 있는 기업은 우선 명확한 마이그레이션 전략을 정의해야 한다고 구티가 말했다. 그는 “대부분의 조직들은 처음으로 데이터를 클라우드로 이동할 것이다. 작게 시작하고 경험을 통해 배우며 필요에 따라 변경하는 것이 가장 좋다”라고 말했다.

또한 보안 정책을 통해 명확한 거버넌스 프레임워크를 정의해야 한다. 구티는 “클라우드로 이동한다는 것은 내부 및 외부 데이터와 사용자를 클라우드로 이동하는 것이다. 보안 및 프라이버시 정책을 명확하게 정의해야 하며, 각 섹션의 소유자를 명확히 정의해야 한다. 각 사용자에게 적절한 수준의 액세스가 제공되어야 한다”라고 말했다.

또 다른 좋은 사례는 가능한 많이 자동화하는 것이라고 구티가 말했다. 그는 “클라우드의 힘은 민첩성과 자동화이다. 수동 또는 일회성 부하 수행에 대한 요청이 많을 것이며 이런 일회성 요청이 쌓이면 한 걸음 물러서는 것이 낫다”라고 말했다.

애널리틱스 전문가 조직을 구성하라
조직은 CoE(Center of Excellence)를 구성하여 리더십을 제공하고 모범 사례를 공유하며 연구 개발하고 특정 영역에 대한 교육을 제공한다. 오늘날 데이터 분석의 전략적인 역할의 중요성을 고려할 때, CoE가 이런 노력에 집중하는 것이 합리적이다.

IDC는 2019년 미국 내 CIO 및 기타 고위 IT 임원을 대상으로 조사를 실시했다. IDC는 93%가 조직이 일정 형태의 CoE를 활용하여 AI와 데이터 사이언스 이니셔티브를 주도하고 있다고 말했다고 밝혔다. IDC의 IT 임원 프로그램 부사장 서지 파인들링은 “전문가 조직은 AI, BI, 분석 등 모든 것을 위한 중심 허브이다. 중앙 및 분산된 리소스가 잇는 조직으로서 전사적인 조율에 집중하고 있다”라고 말했다.

글로벌 컨설팅 기업 케이루스(Keyrus)는 초고의 투자수익을 얻고 데이터에서 최고의 가치를 얻기 위해서 조직은 분석 CoE를 수립해야 한다고 지적했다. CoE는 조직 내의 분석 노력을 간소화할 수 있다는 설명이다.

케이루스는 “조직에 관해 잘 알고 데이터 소스에 능통한 전문가팀이 있다고 생각해 보라. 이 팀은 모든 노력을 올바른 방향으로 집중하기 위해 데이터를 재량껏 활용할 수 있는 스킬과 역량을 갖추고 있다”라고 밝혔다.

케이루스는 사용할 도구를 선택하고 어떤 KPI가 필요한지 결정하는 것 등 분석 CoE가 담당할 업무가 다양하고 전했다. 전체적으로는 조직의 애널리틱스 비전을 정의하고, 기술 청사진을 구축하고, 데이터 소스를 공유하는 방법 등의 영역에 대한 기준을 수립하고, 프로그램을 관리해야 한다. 또 재정지원을 관리하고, 사용자 스킬을 개발하며, 방법론 리더십을 조직화하는 등의 기능을 제공할 수 있다.

케이루스는 CoE는 저마다 다르며 그룹의 구조화 방식은 기업의 규모, 산업, 목표, 기타 요소에 따라 달라질 수 있다고 지적했다. CoE는 조직의 구체적인 비즈니스 목표와 조직의 구조에 맞춰야 한다고 그는 덧붙였다. 

* 뉴욕에 거주하는 Bob Violino는 CIO, 컴퓨터월드, 인사이더 프로, CSO, 인포월드에 정기적으로 기고하는 전문 저술가다.

dl-ciokorea@foundryco.com