수요 계획 담당자가 기계 학습을 채택하지 않는 이유는 무엇입니까?

Olga는 대규모 소매 고객을 위한 신제품 판매 예측 경험이 있는 예측가입니다. 그녀는 현재 HAVI에서 북미 예측 부문 수석 관리자로 근무하고 있습니다. 그녀의 전문 분야는 상품, 미디어, 디지털 광고, 가격 전략 및 소비자 선호도 등 프로모션을 성공적으로 만드는 요소에 대한 연구입니다. 그녀는 우크라이나 국립기술대학교에서 경제학 학사 학위를, 캐나다 오타와의 칼턴 대학교에서 금융경제학 석사 학위를 취득했습니다.

우리 모두는 기계 학습(ML)과 AI가 분석 및 데이터 과학 커뮤니티를 흥분시킨다는 것을 알고 있습니다. 모든 자존심 있는 예측 부서는 누가 클릭하고, 구매하고, 거짓말을 하고, 죽을지 예측하기 위해 ML 알고리즘을 개발하고 있습니다(이 주제에 대한 Eric Siegel의 주요 작업 제목을 빌리자면). 모든 분석 컨퍼런스와 출판물은 AI 유행어로 가득 차 있습니다.

그러나 실제 구현에 관해서는 대부분의 수요 예측가가 기계 학습 구현에 대해 다소 신중합니다. 왜 그런 겁니까? 말 그대로 예측가의 업무인 예측이 머신러닝의 전부가 아닌가요? 예측에 머신러닝을 적용할 때의 기회와 함정을 살펴보겠습니다.

예측과 ML이 '예측'을 정의하는 방식에는 미묘한 차이가 있습니다. 예측가가 말하는 '예측'은 미래에 대한 예측을 의미합니다. 전통적인 예측 예측 방법에는 시계열 모델링, 대수 방정식 및 정성적 판단 호출이 포함됩니다. 결과적으로 전통적인 예측은 다소 수동적이고 시간 소모적이며 인간의 판단에 따라 달라질 수 있습니다. 그러나 출력은 쉽게 해석되며 민첩한 프로세스입니다. 예측자는 수치의 출처를 알고 필요에 따라 쉽게 수정할 수 있습니다. 또한 전통적인 예측은 제한된 데이터를 사용하여 수행될 수 있습니다.

기계학습이나 통계모델 '예측'은 과거를 예측하는 것을 말한다. 이는 다소 반직관적으로 들리지만, 아이디어는 모델 '예측'을 현실과 비교하고 차이 또는 오류를 측정하는 것입니다. 이러한 오류는 미래를 예측하기 위해 모델을 미세 조정하는 데 사용됩니다. 결과적으로, 모델 예측은 과거 성능에 크게 좌우되며 미세 조정이 거의 불가능합니다. 또한 모델의 해석 가능성은 매우 제한적입니다. 고려해야 할 또 다른 요소는 ML에는 설계상 많은 데이터가 필요하다는 것입니다. 좋은 점은 머신러닝이 빠르고 자동화되고 객관적이며 인간의 판단에서 자유롭다는 것입니다.

기계 학습 및 AI 알고리즘은 고객 클릭, 구매 및 검색 데이터에 대한 데이터가 거의 무제한인 디지털 세계를 위해 만들어졌습니다. 우리가 알고 있듯이 이러한 알고리즘은 우리가 반복 구매를 하고, 무료 품목을 구매하고, 로열티 프로그램에 가입하도록 유도하는 데 탁월한 역할을 합니다. 예측 오류(매출 손실)로 인한 매몰비용은 상대적으로 낮습니다. 또한 모든 오류는 머신러닝 알고리즘이 스스로를 개선할 수 있는 기회입니다.

그러나 실제 시장은 디지털 시장과 상당히 다릅니다. 여기에 있는 데이터는 금전 등록기 판매, 우대 프로그램 데이터 또는 배송 데이터로 제한될 수 있습니다. 레스토랑과 소매업체가 대량으로 조달하기 때문에 예측 오류로 인한 매몰 비용이 상당히 높을 수 있습니다. 또한 자동 피드백 루프가 없기 때문에 예측은 스스로 향상될 수 없습니다. 이러한 이유로 많은 오프라인 소매업체와 공급업체는 여전히 전통적인 예측 방법에 의존하고 있습니다. 이는 기계 학습이 예측 개선의 기회를 제공할 수 없다는 의미는 아니지만 기계 학습을 시작하기 전에 해결해야 할 몇 가지 고려 사항이 있습니다.

모든 기계 학습 알고리즘에는 많은 양의 데이터가 필요합니다. 데이터가 많다는 것은 날짜나 변수를 의미하는 것이 아닙니다. 기계 학습 모델은 정의된 관찰 수준(고객, 매장 등)에서 실행됩니다. 기계 학습이 작동하려면 최소한 수천 개가 필요합니다. 샘플이 10개 매장으로 제한되는 경우 기계 학습을 자제하고 대신 시계열 기술을 사용하는 것이 더 나을 것입니다. 고려해야 할 또 다른 요소는 데이터 유지 비용입니다. 쉽게 사용할 수 있나요? 아니면 수동으로 입력해야 하나요? 데이터를 엔지니어링해야 합니까? 이는 일회성 작업입니까, 아니면 인력 및 컴퓨팅 리소스가 필요한 지속적인 프로세스입니까? 수년간 데이터를 저장하는 데 드는 비용은 얼마입니까?