자세히 보기

By Kim Jin Cheol

김진철의 How-to-Big Data | CPS와 Digital Transformation

소위 GAFA(Google, Amazon, Facebook, Apple)로 불리는 플랫폼 기업들의 성공을 벤치마크하고 기업 경영에 접목시켜 성장

컬럼비아 대학교 비즈니스 스쿨의 데이빗 로저스 교수는 자신의 책 “디지털 전환 지침서(The Digital Transformation Playbook)”에서 디지털 전환을 크게 다섯 가지 차원(dimension)에서 보도록 조언하고 있다[2-3]. 이 다섯 가지 차원(dimension)은 고객, 경쟁, 데이터, 혁신, 가치인데, 여기서 데이터는 나머지 네 가지 차원에서 일어나는 디지털 전환 활동의 연료가 된다는 점에서 중요하다.

이렇게 다섯 가지 차원에서 일어나는 디지털 전환의 연료인 데이터를 생산, 가공하고 소비하는 기술로서 빅데이터 기술, 사이버 물리 시스템 기술과 체계는 디지털 전환의 신경계로서 역할을 하게 된다. 이런 사례 중 대표격인 버버리와 제너럴 일렉트릭의 디지털 전환 사례를 지난 마흔 여덟 번째 글에서 같이 살펴보면서 이 사례들이 주는 교훈에 대해서 생각해 보았다.

위 다섯 가지 차원과 함께 디지털 전환을 이끄는 중요한 요소로서 필자는 이번 글에서 “예측 분석(Predictive Analytics)”과 “미래 연구(Future Forecasting)”에 대해서 살펴보려고 한다. 
 


데이터를 이용한 과학적인 의사 결정을 적극적으로 수용하고, 이를 사이버 물리 시스템과 인프라로 자동화하여 비즈니스의 기민성과 확장성(scalability)을 높이는 디지털 전환이 되기 위해서는, 디지털 전환의 신경계가 적시, 적소에 배치되고 동작할 수 있도록 하는 기민하고 효과적인 의사 결정, 계획 과정이 필요하게 된다. 예측 분석과 미래 연구는 이렇게 사이버 물리 시스템 기반 지능형 서비스 비즈니스의 기민성과 확장성을 안정적으로 얻기 위한 의사 결정, 계획을 위해 필요한 요소이다. 

그럼 이제 사이버 물리 시스템을 이용한 지능형 서비스 비즈니스에서 이런 예측 분석과 미래 연구가 왜 필요한지에 대해 좀더 구체적으로 생각해보자.

첫번째로, 사이버 물리 시스템을 통해 정교하게 수집되어 비즈니스 대상과 환경에 대해 의미 있는 정보로 가공된 빅데이터를 이용해 적절하게 수행된 예측 분석은 비즈니스 성공에 영향을 줄 수 있는 위험 요소들과 불확실성을 줄여준다. 빅데이터를 이용한 예측 분석을 통해 기업은 이런 위험 요소들과 비즈니스와 관련된 시장의 불확실성에 대응할 수 있는 전략을 좀더 구체적으로 고민할 수 있고, 이런 전략을 준비하고 실행할 수 있는 시간을 벌 수 있다.

이렇게 빅데이터를 이용한 예측 분석을 이용해 비즈니스 위험 요소를 관리하고 불확실성에 대응하여 얻은 여유는 기업과 비즈니스를 좀더 안정적으로 만들 수 있고, 비즈니스의 예측 가능성을 높여 기업의 자원을 더 효과적으로 활용하고 낭비를 줄일 수 있게 한다. 

위와 같이 전사적 전략 수준의 예측 분석과 미래 연구의 효용도 분명하지만, 비즈니스 각 개별 요소에 적용되는 예측 분석들도 사이버 물리 시스템 기반의 지능형 서비스에서 중요한 역할을 한다. 예를 들어, 자율주행 배달 로봇을 이용한 음식 배달과 같은 사이버 물리 시스템 기반의 지능형 서비스 비즈니스를 한번 생각해보자. 

비즈니스가 어느 정도 성장하는 과정에서 각 자율주행 배달 로봇이 수집한 배달 경로와 주행 환경에 대한 데이터, 그리고 각 지역별로 수집된 배달 패턴과 배달 음식의 종류, 고객의 취향에 대한 데이터를 이용하여 이 데이터들이 보이는 패턴과 날씨, 인구 유동, 하루 중 시간대, 계절과의 관계를 분석하여 어느 정도 의미 있는 패턴을 찾아냈다고 가정해 보자.

이렇게 자율주행 배달 로봇과 배달 주문 시스템을 통해서 수집된 음식 배달 패턴과 고객 선호도에 대한 빅데이터를 이용해 하루 중 시간대별로 배달 로봇을 어느 정도 투입해서 운영해야 할지, 배달 시간을 최소한으로 하기 위해 하루 중 시간대별로 어떤 경로를 주 이동 경로로 해서 배달 로봇을 이동시켜야 할지, 계절과 날씨에 따라 어떤 음식이 많이 주문되는지에 관해 분석을 통해 예측 분석을 해볼 수 있을 것이다.

수집된 데이터를 기초로 한 예측 분석을 이용해 특정한 날씨와 계절에 따라 특정 시간대에 예상되는 음식 배달 주문의 수요를 예측하고 이를 기초로 해서 배달 로봇의 투입량과 경로를 계획할 수 있다면 배달 로봇을 운영하는데 드는 비용과 노력을 줄여 비즈니스 운영을 더 효율화할 수 있을 것이다. 이렇게 효율화된 자율주행 배달 로봇 운영과 음식 배달 서비스 때문에 음식 배달 시간과 배달 품질을 더 향상할 수 있게 되면 이는 서비스에 대한 고객 경험 향상과 비즈니스 성장의 가속으로 이어지게 될 것이다.

앞서 살펴본 자율주행 배달 로봇을 이용한 음식 배달 서비스와 같은 경우에서 간단하게 살펴보았듯이, 전사적, 거시적 비즈니스 예측 분석 모델도 중요하지만, 비즈니스를 구성하는 각 요소, 앞서 든 예에서는 자율주행 배달 로봇의 경로 계획 및 투입량 산정과 같은 개별 요소에서도, 예측 분석 모델은 사이버 물리 시스템의 해당 개별 사이버 요소의 두뇌로서 동작하여 비즈니스 지능화에 기여하게 된다.

두 번째로, 예측 분석과 미래 연구는 새로운 비즈니스를 설계, 계획하고 실행하거나, 이미 수행하고 있는 비즈니스를 확장하는 데에도 중요한 역할을 한다. 

빅데이터 비즈니스 조직을 꾸리는데 중요한 것중의 하나가, 자원 계획을 효과적으로 수립하고 투입을 신속하게 실행할 수 있는 조직 체계를 갖추는 것이라고 스물 두번째 글에서 CERN의 LHC 실험 운영 거버넌스 체계를 살펴보면서 말한 바 있다[2]. 

빅데이터 비즈니스 조직에서 이런 자원 계획과 실행에 효과적인 거버넌스 체계를 갖추는 것이 중요한 이유는 빅데이터 비즈니스를 위해서는 경우에 따라 많은 자원이 투입되어야 할 수 있고, 이런 자원 투입이 적절하게 되지 않으면 비즈니스의 성공이 위협받을 수 있기 때문이라고 설명하였다[4].

예측 분석과 미래 연구가 사이버 물리 시스템 기반의 지능형 서비스 비즈니스에서 중요한 이유도 이런 비즈니스 자원 계획 수립 및 실행에 밀접한 연관이 있다. 비즈니스 모델을 설계, 기획하는 단계에서 빅데이터 기반의 예측 분석과 미래 연구가 중요하기도 하지만, 비즈니스 모델이 이미 어느 정도 실행되고 있는 과정에서 앞으로의 비즈니스 성장과 확대, 비즈니스 모델 전환과 출구 전략 수립, 실행을 위해서도 예측 분석과 미래 연구는 중요하다.

5G를 비롯한 무선 통신으로 통합된 사이버 물리 시스템은 그 스케일이 일반 사무실 규모부터 지리적으로 광범위한 영역에 걸친 전국, 또는 전 지구적 스케일의 글로벌 서비스에 이르기까지 서비스의 특성과 요구되는 비즈니스 확장성의 규모에 따라 투입되는 자원과 시간, 비용이 크게 차이가 나게 된다. 

예를 들어 자율주행 로봇 택시 서비스가 만약 지금의 버스, 택시와 같은 지역 중심의 비즈니스 수행 기업에 의해 실행되는 경우와, 우버(Uber)와 같은 글로벌 비즈니스를 추구하는 기업에 의해 실행되는 경우는 비즈니스 실행을 위해 필요한 자원 투입의 규모와 실행 난이도에 큰 차이가 있다.

우버(Uber)와 같은 글로벌 기업이 다국적 법인을 설립하여 글로벌 비즈니스로서 로봇 택시 서비스를 운영하고, 이런 로봇 택시 서비스가 각 국가별로 구축된 데이터 센터와 지역 무선 통신 사업자를 통한 통신 인프라를 아울러 통합하면서 글로벌 비즈니스 운영, 관리를 위한 본사 데이터센터의 사이버 물리 시스템과 통합하여 운영해야 하는 수준이라면, 아주 작은 위험요소나 낭비요소 하나로 인해 수백억, 수천 억원의 예산을 연간 더 쓰거나 낭비할 수도 있다.

이렇게 다양한 계층의 ICT 인프라와 서비스를 통합하고, 여기에 글로벌 스케일의 비즈니스 로직과 시스템을 구현한 사이버 물리 시스템과 비즈니스 정보 시스템을 이용한 지능형 비즈니스에서는 가능하면 위험요소와 시장의 불확실성을 최대한 줄이고 없애는 것이 기업 운영의 효율성과 성장을 위해서 중요하다. 

우리나라 전국을 대상으로 하거나, 전 세계를 상대로 사이버 물리 시스템을 이용한 글로벌 비즈니스를 계획하고 실행해야 하는 경우라면 가능한 위험요소와 불확실성에 대한 무지를 최소한으로 줄이고 대응 전략을 수립하는데 예측 분석, 시뮬레이션, 시나리오 플래닝과 같은 미래 연구를 적극적으로 활용할 필요가 있다. 이런 측면에서 빅데이터, 사이버 물리 시스템을 이용한 예측 분석과 미래 연구는 디지털 전환에서 중요한 한 요소가 되어야 한다.

세 번째로, 새롭게 기획하여 실행에 옮기려고 하는 비즈니스 모델과 이를 위한 실행 계획이 적절한 수준으로 계획되었는지 실행전에 점검하고 평가하기 위한 방법으로 예측 분석과 미래 연구를 적극적으로 활용할 필요가 있다.

디지털 전환의 성공적이고 대표적인 사례로 꼽히는 아디다스의 스피드팩토리(SpeedFactory) 자동화 공장은 지난 2020년 4월을 기점으로 운영을 종료하였다[5-8]. 2016년에 독일 안스바흐와 미국 애틀란타의 두 곳에 구축되어 운영되었던 스피드팩토리는, 약 160여명의 소수 인원으로 일부 공정을 제외하고는 로봇을 이용한 완전 자동화를 통해 제조 시간을 단축하고 고객의 필요(needs)에 맞는 신발을 적시에 만들어 납품하려 하였다. 

이와 함께 지금까지 아시아의 저렴한 노동력을 이용해 신발을 생산한 후 선박과 비행기로 소비자에 전달하는 과정에서 생겼던 물류 비용을 소비자에 가까운 분산된 공장에서 제조하는 방식으로 줄여 제조 공정과 물류 프로세스를 혁신하려 하였다.

이렇게 완전 자동화와 분산 생산 방식을 통해 생산, 물류 비용을 절감하고 소비자의 기호에 맞는 더 나은 신발을 생산하려던 아디다스의 시도는 2020년 4월을 기점으로 일단 끝나게 되었다. 그렇지만, 이 시도를 통해 아디다스는 많은 값진 교훈을 얻었다.

첫 번째로, 신발과 옷과 같이 트렌드에 민감한 패션 상품들은 수시로 바뀌는 트렌드에 대응하여 신속하게 디자인을 수정하고 트렌드가 유효한 시점에 적절한 양의 제품을 신속하게 납품해야 하는데, 이 과정에서 제조비용을 절감하는 것은 단순히 인건비만을 낮춘다고 해결되는 것이 아니었다. 신발 제조 프로세스의 단계가 많고 복잡할수록 신발의 디자인을 변경하고 반영하는 과정이 오래 걸리고 복잡해져 비용이 상승한다는 것을 아디다스에서 미처 파악하지 못한 것이다.

산업용 로봇과 컴퓨터 비전 기술을 이용해 자동화되었던 스피드팩토리는 아시아의 노동력이 손으로 만드는 신발 제조 공정에 비해 단계가 많고 디자인 변경에 따른 재구성(reconfiguration)과 프로세스 변경이 어려웠다. 

트렌드에 따라 바뀌는 고객의 취향에 대응하여 변경된 디자인을 반영한 신발을 생산하기 위해 모든 제조 과정에 있는 컴퓨터 비전 소프트웨어와 로봇의 파라미터들을 새롭게 조정하고 설정해서 제조 프로세스를 재조정하는 것이 필요했다. 이런 재조정 과정이 생각보다 쉽지 않고 시간이 걸려 비용 절감과 제조 시간 단축의 효과가 생각보다 크지 않았던 것으로 알려졌다[7-8].

반면 아시아에 있는 신발 제조 공장에서는 신발을 만드는 숙련된 생산 인력들이 바뀐 디자인에 맞게 다시 만들기만 하면 되어 제조 공정이 로봇으로 자동화된 공장에 비해 매우 단순했기 때문에 디자인 변경에 따른 비용과 시간이 크게 들지 않았다. 바로 이 점 때문에 로봇으로 완전 자동화된 공장이 신발이나 옷과 같은 패션에 민감한 상품 생산에는 적절치 않았던 것이다[7-8].

두 번째로, 지구 온난화로 인해 환경운동가들과 소비자들이 기업들의 탄소 배출에 민감해지기 시작하면서, 아디다스가 스피드팩토리를 통해 소비자에 가까운 곳에서 분산된 방식으로 신발을 생산하려던 생각이 앞으로 제조업 분야 기업들에게 맞는 방식임이 확인된 것이다.

현재 제조 기업들이 공장 운영에서 배출하는 이산화탄소는 전체 배출량의 약 8% 정도지만, 공장에서 만든 제품을 소비자에게 전달하기 위해 운반하는 물류 과정에서 배출되는 이산화탄소는 전체 배출량의 약 14% 정도로 제조 과정에서 배출되는 이산화탄소에 비해 크게 높다. 이 물류 과정에서 배출되는 이산화탄소중 상당 부분이 비행기를 통해 운송되는 물류 과정에서 나온다고 한다[7].

이 때문에 잘 알려진 패션 브랜드인 “휴고 보스(Hugo Boss)”와 “파타고니아(Patagonia)”는 비행기로 운송하던 제품들을 상당 부분 배나 기차로 운송하는 방식으로 바꾸겠다고 최근 밝힌 바 있다[7]. 이런 물류 방법의 변경 때문에 당분간은 상품의 배송 기간이 길어져 물류 비용이 증가하고 소비자들을 떠나게 하여 단기 실적은 낮아지고 손해를 볼 수 있지만, 장기적으로 환경 운동 활동가들과 지구 온난화 이슈에 민감해지는 소비자들의 지지를 얻어 회사에 이익이 될 것임은 점점 분명해지고 있다. 

이렇게 민감해지는 지구 온난화 트렌드를 반영하여 인도 정부는 자국내에서 소비되는 제품을 인도내에 공장을 세우고 생산하는 다국적 기업의 경우 세금을 17%까지 인하해주겠다고 발표한 바 있다[7]. 이렇게 앞으로 점점 중요한 이슈가 되어 가고 있는 지구 온난화와 탄소 배출권 문제로 각국 정부가 자국 내 공장에서 제품을 생산하도록 하여 탄소 배출량을 줄이도록 유도하는 정책을 펴게 되면 아디다스가 소비자와 가까운 곳에서 분산된 방식으로 제품을 생산하려던 스피드팩토리 실험의 의도가 적절한 전략임이 증명된다.

소비자와 가까운 곳에서 제품을 소품종, 다양화된 제품을 분산된 방식으로 생산해서 물류 비용과 탄소 배출을 줄이는 것은 미래를 내다본 아디다스의 적절한 전략임이 분명하다. 그러나, 트렌드가 자주 바뀌어 제품의 디자인 변경이 잦은 신발과 같은 상품에 대해서는 로봇과 장비들을 변경된 디자인에 맞게 재조정하고 변경하는 작업에 많은 비용이 들 수 있기 때문에 로봇과 인공지능 기술을 이용한 신발 제조 공정의 자동화가 맞지 않을 수 있음은 아디다스가 미처 생각하지 못한 점이다.

위와 같은 제품 디자인 변경에 따른 자동화 공정 변경 비용의 증가는 사실 디자인 변경에 따른 프로세스 변경을 시뮬레이션해보면 어느 정도 파악할 수 있는 문제였다. 최근 프로세스 최적화 및 관리 분야의 지식과 연구도 많이 진보하였고, 근래 급격하게 향상된 컴퓨터의 연산 능력을 이용하면 스피드팩토리 수준의 프로세스를 컴퓨터로 모의 시뮬레이션하고, 디자인 변경에 따른 프로세스 재조정과 변경 과정에 드는 비용을 추정하지 못할 정도는 아니다. 

이와 함께 스피드팩토리 공장 건설 당시 자동화에 사용할 인공지능 기술과 이를 통해 자동화된 프로세스의 수준이 당시 인공지능 기술과 자동화된 프로세스가 실제로 할 수 있는 수준에 비해 높게 평가되었을 가능성이 높다.

아마 스피드팩토리 건설 초기에는 변경된 제품 디자인을 “컴퓨터 지원 설계(Computer-Aided Design; CAD)” 표준 형식으로 디지털 자료화하여 자동화된 공정에 넣어만 주면 자동화 단계의 각 기계에 탑재된 소프트웨어가 이렇게 디지털 자료로 전달된 디자인 파일을 읽어 쉽게 디자인 변경이 가능할 것이고, 생산 프로세스 변경에 드는 노력도 소프트웨어의 파라미터 변경 정도로 간단할 것이라고 생각했던 것 같다. 하지만, 실제 변경된 파라미터를 이용해 프로세스 전체의 통합을 조율하고 재조정하는 작업에 생각보다 많은 수작업과 시행착오가 발생했을 것이다.

아디다스의 스마트팩토리 실험은 기업 경영에 지구 온난화와 환경 정책이 미치는 영향이 커질 것을 미리 내다보고 소비자에 가까운 지역에 공장을 분산 건설하여 소품종, 맞춤형 제품 생산을 통해 성장의 기회를 만들어보려던 미래를 내다본 탁월한 혜안이었다. 

그렇지만 프로세스 시뮬레이션과 자동화 기술 수준에 대한 냉정한 평가가 있었다면 겪지 않았을 수 있었던 시행착오를 겪은 것은 다소 아쉽다. 이렇게 전략적인 선택이 적절하고 실현 가능성이 있는지, 그리고 전략의 구체적인 실행 과정에서 예상치 못한 다른 문제가 발생할 가능성이 없는지와 같은 문제들을 예측 분석과 미래 연구를 통해서 분석해서 그 위험과 파급 효과를 한층 경감시킬 수 있다.

성공하는 디지털 전환(DT)을 위한 예측 분석과 미래 연구
제너럴 일렉트릭의 사례에서 본 것처럼, 예측 분석을 이용한 예측 유지보수(predictive maintenance) 기법은 최근 중장비나 기계, 인프라 분야에서 장비와 인프라의 수명을 늘이고, 안전을 높이기 위한 기법으로 많은 관심을 받고 있다. 이렇게 예측 분석의 응용 분야가 확산되면서 예측 분석의 효용은 더 높아질 것이다.

그럼 일반 기업이 디지털 전환을 성공적으로 달성하기 위해서 이런 예측 분석과 미래 연구, 미래 예측에 사용할 수 있는 방법들이 어떤 것들이 있고, 어떻게 활용하는 것이 좋을까?

요즘 독자분들은 “예측 분석”이라는 말을 들으면 아마 기계 학습과 딥러닝을 가장 많이 떠올릴 것 같다. 예측 분석의 대상이 되는 시스템이 모든 변수를 완전하게 찾아낼 수 있을 만큼 잘 연구, 이해되지 않은 시스템이거나, 대상 시스템에 영향을 주는 변수가 워낙 많아 이 변수들을 모두 계산할 수 없을 경우에는 기계 학습 모델이 적절할 수 있지만, 사실 통계적 기계 학습 기반의 예측 분석 모델이나 딥러닝 기반의 예측 분석 모델은 분석용으로는 그렇게 적합하지 않은 예측 분석 방법론이다.

통계적 기계 학습을 위해 가정하는 통계적, 확률론적 모델들은 대상이 되는 시스템의 모든 변수를 고려하는 것이 아니라 대상 시스템의 행동(behavior)에 가장 크고 주된 영향을 주는 파라미터를 중심으로 확률 모델을 이용해 그 행동을 기술하고, 다른 변수의 영향이나 미처 고려할 수 없었던 외부 환경의 영향을 특정한 통계적, 확률론적 특성을 만족하는 잡음(noise)으로 취급하여 모델링하는 것이다. 

사실 이런 통계적, 확률론적 모델들은 대상에 대한 지식과 이해도가 낮지만 대상의 행동에 큰 영향을 주는 요인이나 변수를 어렴풋이 알 경우에 사용하는 근사적인 방법으로, 대상의 행동을 면밀하게 분석하고 살피기에는 많이 부족하다.

기본적으로 예측 분석에 가장 많이 사용되어 왔고 역사가 오래된 방법론은 “결정론적 모델(deterministic model)”을 사용하는 것이다. 이런 “결정론적 모델(deterministic model)”의 대표적인 것이 바로 물리학과 공학에서 많이 쓰이는 상미분 방정식(ordinary differential equation)과 편미분 방정식(partial differential equation)을 이용한 수치 모델들이다.

이런 “결정론적 모델(deterministic model)”들은 예측 분석의 대상이 되는 시스템의 행동을 기술하기 위해 뉴턴 역학의 철학적인 배경을 많이 채용하고 있다. 뉴턴 역학은 기술하려는 대상의 초기 상태와, 이 대상의 운동, 또는 변화 양상을 기술하는 방정식, 그리고 이 방정식의 해를 특징지어주는 경계 조건(boundary condition)만 주어진다면 이를 이용해 앞으로 대상이 어떤 식으로 움직이고 변화해갈지 모두 계산해낼 수 있다는 것이 핵심이다.

17세기 과학 혁명과 수학, 물리학의 발전 이래 자연과 사회의 주요 대상을 기술하기 위해 가장 많이 쓰여온 방법론이 바로 이 “결정론적 모델(deterministic model)”이다. “결정론적 모델(deterministic model)”은 예측 분석에 이용하기도 가장 용이하고, 역사가 오래된 만큼 이런 “결정론적 모델(deterministic model)”로 기술되는 자연계, 공학 시스템에 대한 지식도 많이 축적되어 왔기 때문에 그 만큼 많이 활용되고 있다.

이 “결정론적 모델(deterministic model)”에 미분 방정식이 많이 쓰이기는 하지만, 꼭 미분 방정식으로만 표현될 수 있는 것은 아니다. 미분 방정식이든, 대수 방정식이든, 그 해를 계산할 때 같은 조건에서 같은 답으로 귀결되는 모델이기 때문에 예측 분석과 해석에 매우 용이한 모델이기도 하다.

이 “결정론적 모델(deterministic model)”의 단점은 분석과 모델링의 대상이 되는 시스템을 정확하게 기술하는 요인(factor)과 변수(variable)을 찾아내고 확인하는데 많은 시간과 시행 착오, 노력이 필요하다는 것이다. 

과학적, 공학적으로 가장 잘 알려진 방정식이면서 전자기장(electromagnetic field) 시스템의 행동을 예측하는데 많이 사용되는 “맥스웰의 방정식(Maxwell’s Equation)” 같은 경우, 이 방정식의 주요 변수인 “전기장(Electric Field)”, “자기장(Magnetic Field)”의 실재를 확인하고 검증하는데 많은 시간이 걸렸다. 이 뿐만 아니라, 전자기장의 행동이 수학적으로 정리되어 맥스웰의 방정식으로 기술되고, 이 방정식의 해들이 발견되기까지 또 많은 시행 착오와 많은 사람들의 연구가 필요했다.

이와 같이 “결정론적 모델(deterministic model)”은 시스템을 구성하고 영향을 주는 요인들과 변수들, 이들 사이의 관계를 수학적으로 정리한 방정식을 실험을 통해 확인해 알고 있고, 이를 푸는 방법을 알고 있다면 예측을 정확하게 할 수 있다는 장점이 있다. 

하지만 이렇게 정확한 모델로 만들기까지 많은 시행 착오와 실험, 확인이 필요하기 때문에, 비즈니스 영역과 같이 대상의 행동에 영향을 주는 모든 변수를 파악하고 있지 못하거나, 알고 있다고 하더라도 이들 변수들 사이의 상호 관계를 모두 파악하지 못했거나 정확하게 알고 있지 못할 때에는 정확한 예측을 할 수 없다는 단점이 있다.

비즈니스에서 다루어야 하는 많은 문제들이 “결정론적 모델(deterministic model)”로 기술되고 예측되기에는 너무 복잡하고 잘 이해되지 않은 시스템이 많다. 이런 이유 때문에 실제 비즈니스를 위한 데이터 과학에서는 보기 힘든 예측 분석 방법론이기도 하다.

“결정론적 모델(deterministic model)”과 함께 데이터 과학에서 예측 분석에 많이 쓰이는 모델은 “확률 모델(probabilistic model)”과 “확률 과정 모델(stochastic model)”이다. 요즘 관심이 많은 기계 학습 모델과 딥러닝 모델은 이 “확률 모델(probabilistic model)”의 특별한 경우에 해당한다. 

“확률 모델(probabilistic model)”은 예측의 대상이 되는 시스템의 모든 상태가 특정한 확률 값을 가지는 “확률 변수(random variable)”로서 기술된다. 우리가 관심 있어 하는 예측 대상 변수 또한 확률 변수(random variable)로서 기술이 되며, 이 예측 대상 변수는 대상 시스템에서 다른 확률 변수들과의 관계, 대상 시스템에서 나타나는 잡음의 특성, 그리고 시스템의 동작 특성에 의존해서 결정되는 확률 분포에 따라 그 상태가 특정한 확률로써 나타나는 시스템으로 묘사된다.

“결정론적 모델(deterministic model)”에 비해 비즈니스와 복잡한 시장 예측 모델에 적용하기 쉽고, 미처 고려하지 못한 변수들의 영향은 잡음(noise)의 형태로 모델에 포함시켜 모든 변수들의 영향을 명시적으로 고려하지 않고도 대상 시스템을 모델링하고 예측 분석을 수행할 수 있다. 이 때문에 이 확률 모델과 확률 과정 모델은 비즈니스 모델링에 많이 쓰인다.

이 확률 모델의 확률 변수가 따르는 확률 분포를 결정하기 위해, 측정된 데이터를 이용해 대상 시스템이 따를 것이라고 가정한 확률 분포의 파라미터를 추정(estimate)하게 되는데, 최근 많이 알려진 기계 학습이나 딥러닝 모델의 학습과정도 바로 이 확률 분포의 파라미터 추정으로서 기술되게 된다. 

이처럼 대상에 대한 정확한 지식 없이, 대상에 영향을 미치는 요인과 변수가 어떤 것인지만 알 수 있고, 대상에 영향을 주는 변수들 사이의 관계를 모두 정확하게 알고 있지 못할 때 확률 모델과 확률 과정 모델이 유용하게 사용될 수 있다.

측정한 데이터를 가장 잘 설명하는 확률 분포를 만드는 확률 분포 파라미터들을 추정해서 확률 모델을 만들어내면, 이 확률 모델을 이용해 측정된 상황이 아닌 다른 상황에서의 대상의 행동을 확률 모델을 이용해 예측해볼 수 있다.

이 확률 모델을 이용해 예측 분석의 대상이 되는 확률 변수의 값을, 몬테카를로 시뮬레이션과 같은 난수를 이용한 시뮬레이션을 통해서 얻게 되면 이것이 대상 시스템에 대한 예측이 되며, 이 모델에서 얻은 예측 데이터를 추가로 가공하거나 분석하여 예측 분석을 수행하게 된다.

확률 모델을 만족하는 확률 변수들이 특정한 수학적인 관계를 만족하면서 시간에 따라 변하는 상황을 기술하는 모델이 확률 과정 모델이 된다. 역시 이 확률 과정 모델 또한 비즈니스와 경제 시스템, 사회 시스템과 같은 복잡한 현상의 이해와 모델링에 용이하기 때문에 광범위한 영역에서 많이 활용되고 있다. 비즈니스를 위한 데이터 과학에서 예측 분석을 수행한다고 하면 대부분의 경우 이런 확률 모델과 확률 과정 모델을 활용하게 된다.

기계 학습이 예측 분석을 위한 고급 데이터 분석에 많이 활용되게 된 것은, 학습하는 기계를 위한 기계 학습의 이론을 주창한 초기 인공지능 기술 연구자들이 이런 기계의 학습 과정을 통계적 파라미터 추정(parameter estimation)의 과정을 빌어 형식화하여 이론으로 정립한 이유도 있다.

이와 같이 예측 분석의 대상이 되는 시스템이, 그것이 기계 부품이 되었건, 비즈니스 지표가 되었건, 아니면 복잡계로서 복잡한 행동을 보이는 변수의 영향을 크게 받는 경제 시스템, 시장, 주가 지표(stock market index)와 같이 비즈니스에 밀접한 시스템이 되었건 결정론적 모델이나 확률 모델, 확률 과정 모델로 근사하여 모델링할 수 있다. 이렇게 모델링된 대상을 앞으로의 행동과 예상되는 다양한 상황을 예측하고, 이에 대한 후속 분석을 다시 수행하는 방식으로 예측 분석을 수행하게 된다.

하나의 결정론적 모델이나 확률 모델, 확률 과정 모델로서 현재 당면한 비즈니스 문제에 대한 예측 분석이 온전하게 수행될 수 있다면 참 다행스러운 경우일 것이다. 그렇지만, 비즈니스 수행 과정에서 맞닥뜨리는 문제들 대부분이 이렇게 하나의 모델로서 분석될 수 있는 경우는 사실 많지 않다.

이뿐만 아니라 요즘 경제와 시장은 과거의 경제, 시장보다 그 움직임이 더 역동적이고 변화 무쌍하여 예측하기 어렵다. 시장만 그런 것이 아니라, 제조 기업이 만들어 공급하는 상품들도 과거의 상품에 비하면 훨씬 더 복잡한 제품으로 만들어진다. 

제품의 상태와 고장이나 장애를 선제적으로 예측해 예방할 목적으로 제품 자체에 대한 예측 분석을 수행하는 경우에도 이런 제품이 하나의 모델로서 이해되기 보다는 다양한 관점과 수준에서 여러 개의 모델을 같이 활용해 모델링하여 이해되는 경우가 많다.

자동차와 항공기와 같은 복잡한 기계들은 제품의 각 구성 요소와 통합 수준별로 다양한 수학적 모델에 의존해서 기술(describe)된다. 이런 복잡한 제조 상품들의 행동을 예측해서 불량이나 오작동, 장애를 예측하고 예방하기 위해서는 서로 엮인(coupled) 많은 수의 수학 모델과 상태 변수들을 동시에 풀어내어 전체 시스템의 행동을 예측해야 할 필요가 있다.

이런 의미에서 예측 분석을 위한 모델을 만드는 좁은 의미의 모델링뿐만 아니라, 시뮬레이션 기술과 인프라의 중요성이 디지털 전환에서 점점 더 높아지고 있다. 특히, 최근 전자장비와 임베디드 컴퓨터의 비중이 높아지고, 이들 전자 장비와 임베디드 컴퓨터에서 운영되는 수치 모델의 비중이 높아져가고 있는 제조업 상품들의 경우 이런 상품들의 행동을 흉내 내어 시뮬레이션하기 위해 많은 수의 모델을 서로 연관(couple) 지어 동시에 풀어내는 시뮬레이션 시스템이 필요하게 된다.

이렇게 제품 하나의 행동을 예측하기 위해 제품의 행동을 기술하는 다양한 수학 모델들을 다양한 수준과 관점에서 동시에 계산하여 풀어내어, 특정한 환경과 조건에서 제품의 행동과 상태를 정밀하게 재현하고 예측할 수 있도록 하는 고성능 시뮬레이션 기술이 점점 더 중요해지고 있다. 이런 고성능 시뮬레이션을 수행하기 위해서는 시뮬레이션에 들어가는 많은 데이터와, 시뮬레이션의 해를 구하기 위해 필요한 많은 양의 연산을 소화하기 위해 보통 고성능 병렬 컴퓨터를 사용하게 된다.

제품의 다양한 부품과 구성 요소들, 그리고 이런 구성 요소들이 통합된 완제품의 행동을 기술하는 수학 모델을 포함한 다양한 모델들이 실제 상황에서 대상 제품이 보여줄 수 있는 행동과 상태를 최대한 정밀하게 흉내내기 위해 슈퍼 컴퓨터 급의 계산을 동원하는 멀티 스케일(multi-scale), 멀티 물리(multi-physics) 시뮬레이션의 필요성이 점점 더 높아지고 있다. 이렇게 컴퓨터 상에서 시뮬레이션의 대상이 되는 제품이나 시스템의 상태를 목표로 하는 조건과 상황에서 최대한 정밀하게 계산하여 얻은 데이터를 이용해 다양한 예측 분석을 수행하게 된다.

이런 종류의 멀티 스케일(multi-scale), 멀티 물리(multi-physics) 시뮬레이션을 많이 활용하는 제조품들은 자동차와 항공기와 같이 오작동이 일어날 경우 인명 손실이 일어날 수 있는 미션-크리티컬한 기계나 장비 제품들이다. 

사고 상황과 비슷한 상황을 인위적으로 실험실에서 만들어서 제품이 받는 영향과 행동을 실험을 통해 분석하기도 하지만, 대개의 경우 사고 상황과 같은 돌발적이고 예외적인 상황에서 제품이 받는 영향과 제품의 행동을 정확하게 분석하는 것은 매우 어렵다.

이 때문에 제품이 제대로 동작할 수 없거나 심지어는 고장, 파괴될 수 있는 극단적인 상황에서도 인명을 보호하고 제품의 고장을 최소화할 수 있는 방법을 찾을 수 있도록 최근 정밀한 대규모 시뮬레이션 기술이 점점 더 중요해지고 있다.

이런 시뮬레이션에 쓰이는 개별 수치 모델, 확률 모델과, 이들 개별 모델들을 결합(couple)하여 복잡한 모델을 만들고, 이런 복잡한 모델을 이용해 제품을 시스템 수준으로 기술하는 정밀한 멀티스케일(multi-scale), 멀티물리(multi-physics) 시뮬레이션을 이용해 컴퓨터 상에서 제품의 상태를 정밀하게 재연하고 형상화할 수 있다. 이렇게 실제 제품의 상태를 컴퓨터 상에서 수학 모델을 이용해 정밀하게 재현하여 제품의 분석과 제어, 운영에 활용하는 것을 “디지털 트윈(Digital Twin)”이라고 한다.

이 “디지털 트윈(Digital Twin)”이라는 말을 처음 사용하기 시작한 것은 앞서 마흔 여덟번째 글에서 소개한 제너럴 일렉트릭이다. 

항공기 엔진이나 부품, 발전소의 터빈과 같은 미션-크리티컬한 부품과 산업용 장비를 생산하는 제너럴 일렉트릭이 이들 복잡한 장치들의 고장과 장애를 줄이고 시스템을 정밀하게 분석하기 위해 복잡한 대규모 시뮬레이션을 적극적으로 활용해 제품 동작의 예측 분석과 예측 유지보수(predictive maintenance)에 활용했는데, 자신들의 이런 프로세스와 시스템을 설명하는 용어로서 “디지털 트윈(Digital Twin)”이라는 용어를 고안해 사용하기 시작했다.
 


이 “디지털 트윈(Digital Twin)”을 이용한 예측 분석이 앞으로 제조업의 새로운 중흥을 이끌 예측 분석 방법론의 중요한 한 축이 될 것으로 필자는 보고 있다.

“디지털 트윈(Digital Twin)”을 구축하는 고성능 시뮬레이션 컴퓨팅 기술, 오랜 기간에 걸쳐 쌓인 제품과 생산 공정에 대한 지식과 경험을 다양한 수준에서 많은 수의 수학적 모델을 결합(couple)하여 복잡한 대형 시뮬레이션 모델로 만들어낼 수 있는 전문지식과 경험, 수학적 모델링 능력, 이런 “디지털 트윈(Digital Twin)”과 대형 시뮬레이션 모델이 실제 제품과 차이가 없도록 하기 위해 필요한 제품의 실제 행동 정보를 담은 데이터를 수집, 가공, 관리하는 시스템을 구축하고 제품과 통합할 수 있는 기술력은 보통의 기업이 쉽게 흉내낼 수 없는 제조 기업들의 새로운 경쟁력으로 자리잡게 될 것이다.

이런 “디지털 트윈(Digital Twin)”을 이용하면, 실제 상황에서는 사람이 통제할 수 없는 복잡하고 예외적인 상황에서 제품이 보일 수 있는 행동이나 반응도, 시뮬레이션 모델에서는 관련되는 모델링 파라미터와 변수들을 완벽하게 통제하여 컴퓨터 상에서 재현하여 분석해볼 수 있어 제품의 안전성과 성능을 체계적으로 높일 수 있게 된다.

이뿐만 아니라, 전자 장비와 임베디드 컴퓨터내의 수치 모델이 해당 구성 요소나 부품의 제어에 바로 쓰이게 되는 사이버 물리 시스템의 경우, “디지털 트윈(Digital Twin)”에 쓰이는 수치 모델을 컴퓨터로 풀어내는 소프트웨어 기술의 수준과 성능이 또한 사이버 물리 시스템의 성능과 품질도 좌우할 수 있게 된다.

사이버 요소의 비중이 높아지는 사이버 물리 시스템의 경우, 임베디드 컴퓨터와 소프트웨어 기술의 발전으로 “디지털 트윈(Digital Twin)”에 쓰이는 수학 모델이 사이버 물리 시스템의 제어와 운용에도 같이 적용되어 쓰일 수 있게 된다. 

이와 함께 모델링의 수준과 제품에 대한 이해도가 높아지면서, “디지털 트윈(Digital Twin)”이 만들어내는 데이터가 사이버 물리 시스템이 만들어내는 실제 데이터와 큰 차이가 나지 않거나, 차이가 나더라도 분석과 데이터 가공을 통해 실제 데이터와의 관계를 명료하게 분석할 수 있는 시점이 곧 오리라고 생각한다. 

사이버 물리 시스템을 위한 “디지털 트윈(Digital Twin)” 기술은 사이버 물리 시스템 기반의 지능형 서비스의 장애와 결함을 예방하고, 안전성과 신뢰성을 높이는 데에도 이용할 수 있지만, “디지털 트윈(Digital Twin)”이 사이버 물리 시스템과 사람사이의 고급 상호 작용의 매개가 되거나, 고급 사람-기계 인터페이스(Human-Machine Interface; HMI)를 위한 사이버 요소로서도 활용될 수 있다.

이런 예의 하나가 5G V2X 통신의 대표적인 응용 분야로 꼽히는 원격 운전(remote driving)이다. 원격 운전의 경우, 차량의 센서가 인지하는 주행 환경 정보를 원거리에 위치한 원격 운전 HMI에 전송하여 원격에서 차량을 운전하는 운전자가 실제 차량을 운전하는 것과 같이 주행 환경 정보를 접할 수 있도록 원격 운전 HMI를 작동시켜야 한다. 

이와 함께 차량이 인지하는 주행 환경과 원격 운전 HMI에서 보는 주행 환경 사이와의 차이 때문에 원격 운전자의 실수나 사고가 일어나지 않게끔, 원격 운전 HMI에 달린 조향 장치와 가속 페달, 감속 페달과 같은 액추에이터(actuator)들이 실제 차량을 움직이는 것과 같은 느낌을 가지고 조작할 수 있도록 만들 필요가 있다.

이를 위해서 원격 운전 HMI의 사이버 요소에는 실제 차량의 제어 모델 및 컴퓨팅 모델과 같은 모델이 탑재되어 원격 운전자의 액추에이터 반응이 차량의 제어 장치에 원격 운전자가 의도한대로 안전하게 전달될 수 있도록 할 필요가 있다. 이를 위해서 차량의 디지털 트윈 모델이 원격 운전 HMI의 사이버 요소로서 동작하여 원격 운전자가 원격 운전 HMI의 운전 환경과 차량의 운전 환경과의 차이를 크게 느끼지 않고 안전하게 운전할 수 있도록 하는 데에 필요하게 된다.

지금까지 설명한 것과 같이, 비즈니스에 실질적인 임팩트를 줄 수 있는 예측 분석의 방법으로서 대규모 시뮬레이션 기술과 이를 기초로 한 디지털 트윈 기술은 예측 분석의 수단으로서 효과적이기도 하지만, 그 자체로 사이버 물리 시스템의 사이버 요소로도 쓰일 수 있고, 사이버 물리 시스템과 이를 사용하는 사람과의 고급 사람-기계 인터페이스(HMI)로도 사용할 수 있다.

이로 인해 앞으로 시뮬레이션을 위한 고성능 컴퓨팅 기술과 디지털 트윈 및 대규모 시뮬레이션을 위한 고급 수치 모델링 기술, 초저지연, 초실감(hyper-real) 컴퓨터 그래픽과 렌더링 기술, 몰입형(immersive) 고급 사람-기계 인터페이스 기술이 제조업과 사이버 물리 시스템 기반의 지능형 서비스에서 중요한 역할을 하게 될 것이다.
 


마지막으로, 디지털 전환의 중요한 요소의 하나로 미래 예측 역량을 들고 싶다. 

위에서 설명한 예측 분석을 위한 데이터 과학 모델링과 대규모 시뮬레이션을 이용한 디지털 트윈 기술들도 결국 예측 분석을 위한 도구들이다. 이런 예측 분석의 도구들은 정밀한 수학적 모델을 기반으로 상향(bottom-up) 예측 분석을 하기 위한 것들이다. 이런 상향 예측 분석과 함께, 디지털 전환에 성공하고자 하는 기업이 반드시 갖추어야 하는 역량은 미래 연구와 예측의 역량이다.

앞서 소개한 아디다스의 스피드팩토리 실험의 핵심은 지구 온난화와 같은 환경 이슈로 인해 탄소 배출량이 높은 항공 물류의 비중이 높을 경우 기업 경영의 또 다른 위험 요소가 될 수 있겠다는 전망을 바탕으로 한다. 이런 위험 요소를 해결하기 위해 물류 비용을 줄이고 소비자의 니즈에 더 민감하게 대처하는 방법으로서 소비자에 가까운 지역에 완전 자동화된 공장을 건설하고 이를 분산된 방식으로 운영하겠다는 것이 아디다스의 스피드팩토리 실험의 핵심이다.

아디다스의 스피드팩토리 실험을 지금까지 빅데이터 붐이 일었던 양상과 같이 단순히 이를 다루었던 자동화 소프트웨어 기술과 인공지능 기술에만 초점을 맞춘다면 진정한 의미와 교훈을 찾기 어려울 것이다. 

아디다스의 스피드팩토리 실험에 쓰였던 기술들이 의미 있는 방식으로 통합되어 혁신의 상징으로 보일 수 있었던 것은, 바로 앞서 얘기한 것과 같이 환경 이슈로 다가오는 글로벌 물류 문제가 기업 경영에 미칠 수 있는 문제를 해결하기 위해 탄소 배출량을 줄일 수 있는 물류를 위한 소비자와 가까운 지역에 공장 건설, 소비자에 가까운 지역에서 소비자의 니즈에 민감하게 대응하는 상품을 적시에 생산하기 위한 분산된 공장 운영, 고도로 분산된 공장의 운영과 생산 효율을 높이기 위한 생산 프로세스 자동화 기술의 전면 도입과 같은 미래 예측에 근거한 경영 전략이 스피드팩토리 실험에서 일관된 방식으로 맥락을 제공했기 때문이다.

지난 마흔 여덟 번째 글에서 소개했던 버버리의 디지털 전환 사례, 제너럴 일렉트릭의 빅데이터와 예측 분석을 이용한 구독형 제조 비즈니스 모델 사례, 그리고 아디다스의 스피드팩토리 사례에 이르기까지, 디지털 전환을 위한 역량을 결집하고 일관된 방식으로 빅데이터, 인공지능, 사물인터넷과 사이버 물리 시스템과 같은 기술들을 기업 경영과 연계시키는 것은, 미래 예측과 분석에 따른 경영진의 하향식(top-down) 전략 수립과 실행이 일관된 방식으로 진행되었기 때문이다.

디지털 전환은 전사적으로 많은 역량이 결집되어야 성공할 수 있다. 이 다양한 역량이 결집되어 비즈니스 성과를 내기 위해서는 CEO를 비롯한 경영진의 디지털 전환에 대한 의지와 꾸준한 실행이 전제되어야 한다.

경영진이 전사적인 경영 자원을 일관된 방식으로 꾸준히 투입하고 변화시키기 위해서는, 경영진에게 이런 대규모 경영 자원의 투입과 전사적 규모의 변화가 정말 의미 있고 꼭 필요한 것이라는 확신을 주는 일관된 스토리와 전략이 있어야 한다. 이런 스토리와 전략을 제공해주는 것이 미래 연구와 예측이다.

미래 연구와 예측을 통해 일관된 스토리와 전략을 제공하는 것이 디지털 전환에 왜 중요한가? 그 이유는 디지털 전환이 의미 있는 성과로 나타나기까지 꽤 많은 시간이 걸리기 때문이다. 전사적인 자원이 동원되어 새롭게 변화된 경영 방향으로 통합되어 가면서 생기는 커뮤니케이션 비용도 만만치 않을 뿐만 아니라, 디지털 자원과 역량을 결집하여 기존과는 다른 방식의 비즈니스 모델을 실험하고 지속가능한 성장과 성과를 만들어내는 경영 시스템으로 만들어내야 하기 때문이다.

디지털 전환이 의미 있는 성과로 나타나기까지 꽤 많은 시간이 걸리기 때문에 현재 디지털 전환을 성공적으로 실행할 만큼 역량이 있는지 정확한 진단과 판단이 선행되어야 할 것이다. 이런 진단 후에 만약 역량이 부족하다는 결론에 이르렀다면, 이 부족한 역량을 파악하고 갖추는데 시간이 또 걸릴 것이다. 어떤 역량을 어느 정도 갖출 것인지 계획을 수립하고 실행하기 위해서는 어떤 모습의 디지털 전환이 기업에 필요한지 청사진을 그리는 작업이 필요할 것이며, 이런 청사진이 실제로 실현될 때까지 또 다시 시간이 걸리게 된다.

이뿐만 아니라 이렇게 그린 디지털 전환의 청사진이 실제로 실현되었을 시점에서 이 청사진이 이렇게 시간이 흐른 후에도 여전히 시장에서 의미 있고 지속가능한 비즈니스 모델을 제공할 것인지, 그리고 그 시점에서 전사적으로 갖춘 디지털 자원 활용 역량이 충분히 성숙할 것인지 체계적으로 분석하고 의사 결정할 필요가 있다.

이렇게 디지털 전환에 전사적인 자원이 동원되고 의미 있는 성과를 내기까지 꽤 많은 시간이 걸리기 때문에, 디지털 전환의 실행이 가시적인 성과를 내면서 성공적으로 궤도에 오를 것이라 예상되는 시점까지 예상되는 위험과 불확실성에 최대한 대응하여 성공 가능성을 높이기 위해 체계적인 미래 연구와 분석이 경영 전략 수립 과정에서 반드시 같이 이루어져야 하는 것이다.

디지털 전환을 위한 경영 현안 진단과 전략 수립을 위한 도구로서 앞서 언급한 비즈니스 분석과 예측을 위한 다양한 방법들과 기술들이 정교하고 구체적인 전략 수립을 지원하는 도구로서 미래 연구와 분석의 곳곳에서 같이 활용되게 된다. 

빅데이터를 이용한 전사적 비즈니스 지원 시스템(Business Support System; BSS)과 운영 지원 시스템(Operation Support System; OSS)을 적절하게 갖춘 기업이라면 디지털 전환 전략 수립과 미래 연구를 위한 데이터와 경영 진단 자료를 얻고 활용하기가 훨씬 수월할 것이다.

지금까지 디지털 전환의 또 하나의 중요한 요소로서 예측 분석과 미래 연구가 어떤 역할을 하고 왜 중요한지 살펴보았다. 디지털 전환에 전사적인 수준의 자원이 동원되어 새로운 방향으로 통합되어야 하고, 이런 전사적인 역량 결집과 통합, 변화의 과정에 꽤 오랜 시간이 걸릴 수밖에 없다. 이 때문에, 디지털 전환의 성공 가능성을 높이고 위험 요소에 효과적으로 대응하면서 실패 확률을 낮추기 위해서는 체계적인 예측 분석과 미래 연구를 실행하는 것이 중요하다.

체계적인 예측 분석과 미래 연구에 대해 구체적인 방법론 측면에서 더 언급하고 싶은 것들이 많다. 시나리오 플래닝(scenario planning), 확산-수렴 사고법(divergent-convergent thinking)과 같은 구체적인 미래 연구 방법론과, 이를 이용해 디지털 전환의 방향과 전략을 수립하는 방법과 같은 중요한 내용이 많지만, 지면이 제한된 관계로 여기서는 더 언급하지 않겠다. 

남은 지면에서는 위에서 언급했던 수학적 모델 기반의 예측 분석, 디지털 트윈과 대규모 시뮬레이션을 디지털 전환을 위해 활용할 때 기업들이 간과하기 쉬운 점들에 대해서 좀더 짚고 넘어가고자 한다.

예측 분석의 또 다른 기술 이슈 – 시뮬레이션 빅데이터 관리 및 실측 데이터와의 통합 분석 체계
앞서 디지털 트윈을 이용한 대규모 시뮬레이션을 이용해 예측 분석을 수행하게 되면 이 대규모 시뮬레이션에서 많은 양의 빅데이터가 생산된다고 언급한 바 있다. 사실 경우에 따라서는 사이버 물리 시스템이 사물 인터넷과 센서를 통해 실세계로부터 수집한 데이터보다 시뮬레이션을 통해 생성한 데이터가 더 큰 경우도 많다.

실제로 핵융합 플라즈마 분야의 경우 핵융합 실험로에서 수집되는 실험 데이터보다, 이 실험 데이터를 분석하기 위해 계산하는 시뮬레이션 데이터의 양이 훨씬 더 크고 많다. 그리고 대개의 경우 시뮬레이션은 분석을 목표로 하는 조건을 탐색하면서 다양한 가능성을 확인하고, 통계적으로 유의미한 데이터 분석을 하기 위해 다양한 영역의 시뮬레이션 파라미터에 대해서 많은 횟수에 걸쳐 시뮬레이션을 수행하고 그 데이터를 저장한다. 

이런 이유로 시뮬레이션 결과의 정밀도, 정확도를 높이기 위해 사용하는 격자점의 수를 늘이고 시뮬레이션에서 현상을 보려고 하는 해상도(resolution)을 높이게 되면 시뮬레이션을 하는 차원에 비례해서 기하급수적으로 데이터의 양이 늘어나게 된다.

지난 2018년 3월 23일에 게재했던 열다섯 번째 글에서 소개했던 것과 같이CERN의 LHC 실험에서도 검출기 영상 결과 분석의 시행 착오를 줄이기 위해서 몬테카를로 시뮬레이션 방법을 이용한 이벤트 시뮬레이터를 이용해 검출기 영상을 흉내 낸 이벤트 데이터를 먼저 생성한다. 이 이벤트 시뮬레이션 데이터를 대량으로 축적한 후 실제 실험에서 얻은 검출기 영상 데이터와 비교해서 LHC 실험을 시작한지 4년만에 힉스 입자의 존재를 확인할 수 있었다.

대규모 시뮬레이션을 이용한 디지털 트윈과 빅데이터를 이용한 예측 분석이 이렇게 의도한 효용과 가치를 기업의 디지털 전환에 제공하기 위해서는 경우에 따라서 실제 수집되는 것보다 훨씬 큰 양의 데이터를 생성하고 분석해야 하는 경우가 많다.  

이런 이유로 사이버 물리 시스템에서 수집되고 생산된 데이터를 적시에 처리, 가공하고 적절하게 관리하는 것도 중요하지만, 디지털 트윈을 비롯한 예측 분석, 시뮬레이션 시스템에서 생산된 데이터를 신속하게 처리, 가공하고 이를 실측된 데이터와 비교, 분석하여 원하는 분석을 수행할 수 있게 하는 데이터 분석, 처리 파이프라인을 잘 갖추는 것도 중요하다는 것을 디지털 트윈을 활용한 예측 분석을 수행하는 기업은 반드시 염두에 두는 것이 좋다.

마지막으로 디지털 트윈과 대규모 시뮬레이션을 이용한 예측 분석과 관련해서 필자가 한가지 더 언급하고 싶은 것은 시뮬레이션 모델이 만든 데이터와 실제 데이터와의 차이를 고려해서 예측 분석을 수행할 필요가 있다는 것이다.

디지털 트윈을 아무리 정교하게 만든다고 해도, 디지털 트윈을 만들 때 사용하는 수학 모델들은 그저 모델일 뿐이다. 실제 물리적 대상을 기술하는 수학적 모델들은 이 모델이 실험 결과를 잘 설명할 수 있고 모델링의 결과가 유효하기 위한 가정을 품고 있으며, 이를 위한 조건과 변수 값의 특정한 영역이 있다. 

또한 실세계의 현상과 대상을 수학적으로 모델링하는 과정에서 관심이 있는 특정한 현상이나 양상을 집중해서 보거나 강조해서 기술하기 위해서 이런 수학적 모델들은 대개의 경우 현상을 완벽하게 기술하는 모델인 경우보다도 몇 가지 가정을 통해 특정한 요인이나 변수가 미치는 영향을 강조하거나 두드러져 보이게끔 만들어지는 경우도 많다.

즉 우리가 디지털 트윈을 만들기 위해 사용하는 수학적 모델 각각은 그 모델이 유효하기 위해 필요한 가정과 한계를 내포하고 있는 경우가 많으며, 이런 가정과 한계를 잘 이해하고 모델이 생성한 데이터를 예측 분석에 활용해야 한다는 것이다.

한 가지 모델이나 방정식을 이용해, 단순히 선형 회귀식을 외삽하여 예측 분석하는 경우와 같이, 예측 분석을 하는 경우에는 이런 문제가 다소 크게 두드러지지 않는다. 하지만, 디지털 트윈을 만들기 위해 경우에 따라서 몇십개에서 몇백개에 이르는 미분 방정식을 결합해서 분석 대상을 모델링하는 경우에는 이렇게 많은 수의 미분 방정식이 유효한 파라미터 영역을 찾고 탐색하는 것만도 만만치 않은 계산과 시행 착오를 겪어야 할 수 있다.

디지털 트윈이 가능한 모든 가능성을 컴퓨터상에서 흉내내기 위해 되도록 많은 모델들을 서로 결합하여 정교하게 분석 대상을 모델링한다고 해도, 이 모델들은 우리가 지금까지 대상에 대해서 알고 있는 만큼만 분석 대상을 흉내낼 수 있을 뿐이다. 

우리가 분석 대상에 대해서, 그것이 핵융합 플라즈마와 같은 자연 현상이 되었건, 항공기와 제조 공장의 자동화 시스템과 같이 인간에 의해 인공적으로 디자인되고 만들어진 기계가 되었건, 그 대상에 대해 우리가 가진 지식만큼만 컴퓨터 속에서 디지털 트윈으로 흉내 내고 모델링할 수 있으며, 그런 한계 안에서만 예측 분석이 가능하다는 것을 항상 잊어서는 안 된다.

비즈니스 분석과 주식 시장 모델링에 많이 사용되는 마코프 체인이나 몬테 카를로 시뮬레이션과 같은 확률 과정 모델들의 경우, 모델의 정확도를 높이기 위해서는 시뮬레이션에 사용되는 데이터의 양을 크게 늘여야 한다. 

비즈니스 예측 분석을 위한 모델의 정확도에 대해 적절한 기준을 가지고 있다면 요구되는 정확도에 맞는 시뮬레이션의 정밀도와 데이터의 양을 어느 정도 통제할 수 있을지 모르겠지만, 복잡계인 경제 시스템과 시장의 행동 양식을 모델링하는 경우 어느 정도 정확도가 비즈니스 예측 분석에 적당한지 가늠하기 어려운 경우가 더 많다.

이런 경우에는 어쩔 수 없이 시행착오를 겪을 수밖에 없는데, 시행착오를 아예 없애는 것은 불가능 하기 때문에 시행착오를 최대한 줄일 수 있는 예측 분석 전략과 방법을 새롭게 고민해야 할 수 있다.

예측 분석에서 사용되는 수학 모델들이 분석 대상을 완벽하게 기술하는 모델들이 아니고, 우리의 분석 대상에 대한 지식 또한 완전하지 않기 때문에, 디지털 트윈에 사용되는 수학적 모델들을 통해 생성된 데이터는 분명히 실제 측정된 데이터와 다른 특성을 가지고 있다. 이런 점도 예측 분석시에 감안해서 예측 분석의 결과를 해석해야 한다.

이런 시뮬레이션 데이터와 실제 측정 데이터의 차이로 인해 올 수 있는 문제를 살펴볼 수 있는 사례가 바로 자율주행 자동차의 영상 인식 인공지능 기술의 학습과 같은 경우다.

시뮬레이션을 위한 렌더링과 고급 그래픽 기술이 많이 발전해서 시뮬레이션 영상이 실제 주행 환경에서 일어나는 역광이나 노면 반사, 그림자 효과, 눈, 비로 인한 카메라 렌즈 오염 때문에 생기는 영상 왜곡 현상까지 시뮬레이션을 통해 흉내낼 수 있을 정도로 많이 발전하기는 했지만, 주행 시뮬레이션 영상을 사람이 보게 되면 여전히 어색하고 이질적인 특성을 가지고 있다.

사고 상황에서 일어날 수 있는 주행 상황 인지를 위한 영상 인식 모델을 만들 때, 일반적인 주행 상황에 대한 데이터는 쉽게 모을 수 있지만, 사고 상황이나 돌발 상황에 대한 학습용 영상 데이터는 쉽게 얻기가 어렵기 때문에 이런 상황에 대해서는 시뮬레이션 영상을 활용하는 아이디어가 지금 많이 검토되고 있다.

시뮬레이션 영상을 이용해서 영상 인식 모델을 학습시켰더라도 실제 카메라 영상에서 어느 정도 인지가 되기는 하지만, 시뮬레이션 영상은 분명히 실세계 주행 영상과는 다른 특성을 가지고 있다. 이렇게 실제 영상과 다른 시뮬레이션 영상의 통계적 특성과 실세계의 모든 물리적 요소가 반영되어 모델링 되지 못한 이유로 주행 시뮬레이션에 미처 반영되지 않은 잡음 효과가 분명히 영상 인식 모델의 성능에 영향을 미치게 된다. 

하지만 이렇게 시뮬레이션 영상으로 학습된 영상 인식 모델이 실제 영상에 적용되었을 때 어떤 정도의 차이가 어느 정도로 나타나고 영상 인식 성능에 영향을 미치는지는 아직도 많은 연구와 분석이 이루어지고 있다.

이와 같이 디지털 트윈을 아무리 정교하게 만든다고 해도 실세계의 모든 물리적인 요소들을 담기에는 우리의 지식이 아직 많이 부족함을 염두에 두고, 시뮬레이션 데이터와 실제 데이터를 이용한 예측 분석 결과를 비교하거나 시뮬레이션 데이터와 실제 데이터를 같이 활용해서 예측 분석을 수행할 경우 시뮬레이션 데이터가 가질 수 있는 통계적 특성의 차이를 고려해서 예측 분석 결과를 해석할 필요가 있음을 반드시 염두에 두어야 한다.

지금까지 수학적 모델과 대규모 시뮬레이션을 이용한 디지털 트윈을 예측 분석에 활용할 때 데이터 과학자들이 염두에 두어야할 점 두 가지를 더 살펴보았다.

첫 번째로 시뮬레이션과 디지털 트윈이 만드는 데이터가 실제 분석 대상으로부터 측정되어 수집된 데이터보다 훨씬 더 큰 빅데이터가 될 수 있다는 것이다.

이와 함께 시뮬레이션과 이를 이용한 디지털 트윈이 생성한 빅데이터를 효과적으로 이용하기 위해 이를 위한 별도의 빅데이터 가공, 분석 파이프라인을 설계해야 할 필요가 있을 수 있고, 이런 시뮬레이션과 디지털 트윈 빅데이터 가공, 분석 파이프라인이 활용 목적에 맞는 예측 분석을 지원할 수 있도록 실제 측정된 데이터와 연계되어 활용될 수 있도록 하는 빅데이터 연계 및 분석 파이프라인과 시스템을 설계, 구축할 필요가 있다는 것이다.

두 번째로, 시뮬레이션을 통해 생성된 데이터는 실제 물리적인 대상에 대한 데이터를 수집한 조건, 환경과 완전히 똑같지 않기 때문에 실제 데이터와 다른 통계적 특성을 가질 수 있다.

시뮬레이션 데이터와 실제 측정한 데이터를 같이 활용해서 예측 분석을 수행할 경우에는 이렇게 시뮬레이션 데이터가 가진 고유한 특성과 차이점을 같이 고려해서 예측 분석을 수행해야 결과를 잘못 해석하거나 잘못된 분석 결과를 얻지 않을 수 있다는 것이다.

컴퓨팅 기술이 발전하고, 네트워크 기술과 메모리, 저장 장치 기술의 발전에 힘입은 고성능 컴퓨팅 기술의 발전으로 인해서 디지털 트윈과 대규모 시뮬레이션 기술이 상품 개발과 비즈니스 전략 수립에 더하는 가치가 점점 더 커지고 있다.

특히 제조업에서 디지털 트윈과 시뮬레이션을 이용한 예측 분석의 가치는 앞으로 더 높아질 것으로 보이며, 데이터 과학자들도 이런 경향을 염두에 두고 경력 개발에 활용해야 할 것으로 보인다.

디지털 전환을 성공적으로 실행하기 위해, 전사적인 여러 역량과 요즘 주목받는 빅데이터, 인공지능, 클라우드 컴퓨팅, 사물 인터넷, 5G 및 차세대 무선 통신 기술과 이를 기반으로 한 사이버 물리 시스템이 디지털 전환을 성공적으로 지원하기 위해서는, 전사적인 관점에서 이들 역량과 기술을 통합하는 방향을 제시하는 디지털 전환의 청사진을 체계적으로 그릴 수 있도록 미래 연구와 분석을 체계적으로 활용하는 것이 중요하다.

디지털 전환이 전사적인 역량을 동원하고 새롭게 통합하여 기업의 체질을 근본적으로 변화시키는 작업이고, 디지털 전환이 가시적인 성과를 얻기까지 많은 시간이 필요하기 때문에, 이런 디지털 전환의 성공 가능성을 높이기 위해서는 체계적인 미래 연구와 분석을 통해 얻은 디지털 전환의 전략과 스토리가 조직 전반에 지속적이고 일관되게 심겨질 필요가 있다.

이렇게 미래 연구와 분석을 위한 기초 자료와 근거를 제공하기 위해서도 사이버 물리 시스템과 빅데이터 역량은 반드시 필요하다. 데이터 과학자들의 주된 역할과 역량중 하나인 예측 분석이 기업들이 미래 연구와 분석을 통해 디지털 전환 전략을 수립하는 과정에서 꼭 필요하게 될 것이다.

이렇게 예측 분석과 미래 연구, 분석 역량이 점점 더 부각되는 디지털 전환의 트렌드를 잘 이해하고, 이제 막 시작되고 있는 기업들의 디지털 전환 여정을 안내하고 선도하는 엘리트로서 데이터 과학자의 역할에 맞는 역량과 전문성을 미리 준비한다면 앞으로 성공적인 데이터 과학자로서 경력 계발에 많은 도움이 될 것이다.

[참고문헌]
[1] 김진철, “LHC에서 배우는 빅데이터와 machine learning 활용 방안”, 2016년 9월 28일, A CIO Conversation for Technology Leadership – Breakfast Roundtable 발표 자료
[2] David Rogers, The Digital Transformation Playbook: Rethink Your Business for the Digital Age, Columbia Business School Publishing, 2016.
[3] 데이비드 로저스, 디지털 트랜스포메이션 생존 전략 – 빠르게 변하는 비즈니스 세계에서 살아남기, 에이콘출판, 2018년. 
[4] 김진철, “김진철의 How-to-Big Data | 빅데이터 조직과 시스템 (1)”, CIO Korea, 2018년 10월 26일자. (https://www.ciokorea.com/column/39986
[5] Herzogenaurach, “ADIDAS DEPLOYS SPEEDFACTORY TECHNOLOGY AT ASIAN SUPPLIERS BY END OF 2019”, Adidas Media Blog, November 11, 2019. (https://www.adidas-group.com/en/media/news-archive/press-releases/2019/adidas-deploys-speedfactory-technology-at-asian-suppliers-by-end-2019/)
[6] Jon Porter, “Adidas to end robotic shoe production in Germany and the US – Automated factories were seen as an alternative to overseas labor”, The Verge, November 13, 2019. (https://www.theverge.com/2019/11/13/20962688/adidas-robotic-speedfactories-ansbach-germany-atlanta-usa-athletic-shoes
[7] Adrián Hernández, “Learning from Adidas’ Speedfactory blunder”, SupplyChain Dive, Feb. 4, 2020. (https://www.supplychaindive.com/news/adidas-speedfactory-blunder-distributed-operations/571678/
[8] Devin Coldewey, “Adidas backpedals on robotic shoe production with Speedfactory closures”, TechCrunch, November 12, 2019. (https://techcrunch.com/2019/11/11/adidas-backpedals-on-robotic-factories/)
[9] Chris MacDonald, Bernard Dion, Mohammad Davoudabadi, “Creating a ‘Digital Twin’ for a pump”, Ansys Advantage Volume 11, Iss. 1, 2017. (https://www.ansys.com/ko-kr/about-ansys/advantage-magazine/volume-xi-issue-1-2017/creating-a-digital-twin-for-a-pump
[10] Andrew Williams, “Simulate to fabricate: vehicle plants keep VR and AR in their sights”, Automotive Manufacturing Solutions, 09 March 2020. (https://www.automotivemanufacturingsolutions.com/systems/simulate-to-fabricate-vehicle-plants-keep-vr-and-ar-in-their-sights/40302.article
[11] Siemens, “Why digital twins will be the backbone of industry in the future”. (https://youtu.be/ObGhB9CCHP8
[12] Digital Transformation – Wikipedia. (https://en.wikipedia.org/wiki/Digital_transformation
[13] 김진영, 김형택, 이승준, 디지털 트랜스포메이션, 어떻게 할 것인가?, e비즈북스, 2017년.
[14] George Westerman, Didier Bonnet, Andrew McAfee, Leading Digital: Turning Technology into Business Transformation, Harvard Business Review Press, 2014.
[15] 조지 웨스터먼, 디디에 보네, 앤드루 맥아피, 디지털 트랜스포메이션, e비즈북스, 2017년.


김진철 박사는 1997년 한국과학기술원에서 물리학 학사, 1999년 포항공과대학교에서 인공신경망에 대한 연구로 석사 학위를, 2005년 레이저-플라즈마 가속기에 대한 연구로 박사 학위를 받았다. 2005년부터 유럽입자물리학연구소(CERN)의 LHC 데이터 그리드 구축, 개발에 참여, LHC 빅데이터 인프라를 위한 미들웨어 및 데이터 분석 기술을 연구했다. 이후 한국과학기술정보연구원(KISTI), 포항공과대학교, 삼성SDS를 거쳐 2013년부터 SK텔레콤에서 클라우드 컴퓨팅과 인공지능 기술을 연구하고 있다. 빅데이터와 인공지능 기술의 기업 활용 방안에 대해 최근 다수의 초청 강연 및 컨설팅을 수행했다. dl-ciokorea@foundryco.com