우리 회사에는 사장님의 총애를 받는 핵심인재 10명이 있는데, 어느날 그 중 몇 명이 회사를 떠날 것 같다는 소문이 돌았다. 노발대발한 사장님은 인사팀에게 그 인재들이 나가지 않게 책임지고 잘 관리하라는 특명을 내렸다. 어떻게 해야 할까? 다년간의 경험으로 다져진 인사이트를 발휘해서 예측한다? 그것도 방법이겠지만, 그에 앞서 해볼 수 있는 접근법이 있다. 이직, 즉 회사를 떠나는 직원들의 패턴을 찾아보는 것이다.
이를 위해, 지금까지 우리 회사를 거쳐간 모든 직원들의 정보, 즉 직원인사기록을 모두 모았다. 나이, 성별, 결혼상태, 전공, 부서, 직무, 연봉, 업무평가, 직무만족도 등등의 인사정보 등등 기록해뒀던 모든 정보를 다 모았고, 마지막으로 현재 회사를 떠난 직원은 이직이라고 표시하고, 아직 남아 있는 직원은 남아 있다고 표시했다. 이 데이터를 분석하면, 어떤 요소들이 이직에 크게 영향을 끼치는지 확인할 수 있을 것이고, 결국 어떤 직원이 회사를 떠날 확률이 높은지 예측하는 모델도 만들 수 있을 것이다.
—〈데이터 분석 실습 1. 이직할 직원을 찾아라_인사데이터 분석 중〉
분석할 인사데이터를 올린 후 GPT에게 어떤 데이터인지 살펴보고 무슨 분석이 가능하겠는지 알려달라고 해보자.
You: 우리 회사 과거현재 전 직원들 인사데이터야. 한 번 살펴보고 어떤 분석을 할 수 있겠는지 제안해줄래?
GPT: 이 데이터는 직원들의 다양한 인사 정보를 담고 있는 것으로 보입니다. 예를 들어 나이, 이직 여부(Attrition), 출장 빈도(Business Travel), 일일 급여(Daily Rate), 부서(Department), 직원과 집의 거리(Distance From Home), 교육 수준(Education), 교육 분야(Education Field) 등의 정보가 포함되어 있습니다.
이 데이터를 기반으로 할 수 있는 분석들은 다음과 같습니다:
1. 이직률 분석: 직원들의 이직 여부를 분석하여, 어떤 요인들이 이직률에 영향을 미지치는지 파악할 수 있습니다. 예를 들어, 부서별, 연령대별, 교육수준별 이직률을 비교 분석할 수 있습니다.
2. 직원 만족도 및 근속 연수 분석: 직원들의 근속 연수, 최근 승진 이후 경과 기간, 현재 매니저와의 근무 기간 등을 분석하여, 직원들의 만족도 및 충성도에 대한 통찰을 얻을 수 있습니다.
3. 부서별 및 직무별 분석: 부서별, 직무별로 직원들의 분포, 평균 근속 연수, 평균 급여 등을 분석하여 조직 내 각 부문의 특성을 이해할 수 있습니다.
4. 출장 빈도와 직원 성과의 관계 분석: 출장이 직원들의 업무 성과나 만족도에 어떤 영향을 미치는지 분석할 수 있습니다.
5. 연령대별 및 교육수준별 직원 분포: 다양한 연령대와 교육 수준의 직원들이 회사 내에서 어떻게 분포되어 있는지를 분석할 수 있습니다.
—〈데이터 분석 실습 1. 이직할 직원을 찾아라_인사데이터 분석 중〉
You: 학습시킨 이직예측 모델 3개를 통해 이 10명의 이직확률을 각각 계산해서, 제일 이직할 위험이 큰 직원들이 누구인지 알려줄래?
GPT: 로지스틱 리그레션, 랜덤포레스트, 그래디언트 부스팅 3개 모델로 예측한 결과를 이직 확률이 높은 순서대로 정렬한 결과를 보여드립니다.
9번 직원. 평균 이직 확률 71.5%
9번 직원. 평균 이직 확률 60.1%
9번 직원. 평균 이직 확률 54.2%
…….
-〉 이제 사장님이 얘기한 10명의 핵심인재들 중 이직할 확률이 가장 높은 순서대로 정렬한 데이터가 확보되었다. 이 결과는 우리 회사를 거쳐간 전현직 직원들의 데이터를 분석해서 예측한 값이라는 걸 염두에 두고, 이제 여기에 나의 개인적 지식과 경험, 통찰을 보태서 대응하면 된다. 필자라면 저 순서대로 직원들 정보도 찾아보고 면담도 해볼 것이다.
—〈데이터 분석 실습 1. 이직할 직원을 찾아라_인사데이터 분석 중〉
You: 고객세분화 진행해줘.
GPT: 고객 세분화 분석을 진행하겠습니다. 이를 위해 RFM(Recency, Frequency, Monetary) 분석을 수행할 예정입니다. RFM 분석은 고객의 최근 구매일(Recency), 구매 빈도(Frequency), 구매 금액(Monetary)을 기준으로 고객을 세분화하는 방법입니다.
RFM 점수를 기반으로 고객을 다양한 세그먼트로 분류할 수 있습니다. 예를 들어, 다음과 같은 방식으로 세그먼트를 구분할 수 있습니다:
최고 가치 고객 (Best Customers): R, F, M 점수가 모두 높음 (예: RFM 점수 합계가 낮은 고객)
개발이 필요한 고객 (Customers Needing Attention): 최근 구매가 있었으나 구매 빈도나 금액이 낮음
잠재력 있는 고객 (Promising Customers): 구매 빈도가 낮지만 최근 구매한 고객
위험에 처한 고객 (At Risk Customers): 한때 자주 구매하던 고객이지만 최근 구매가 없음
고객 세그먼트별 분류 결과는 다음과 같습니다:
최고 가치 고객 (Best Customers): 600명
개발이 필요한 고객 (Customers Needing Attention): 1,818명
잠재력 있는 고객 (Promising Customers): 53명
위험에 처한 고객 (At Risk Customers): 1,631명
Others: 120명
이러한 분류는 마케팅 전략 수립에 유용하게 사용될 수 있습니다. 예를 들어, '최고 가치 고객'에게는 보상 프로그램을 제공하고, '위험에 처한 고객'을 대상으로 재참여 캠페인을 실시할 수 있습니다. '개발이 필요한 고객'과 '잠재력 있는 고객'에게는 추가 구매를 유도할 수 있는 프로모션을 제공할 수 있습니다.
—〈데이터 분석 실습 3. 고객세분화를 하고 맞춤형 마케팅전략을 도출하라_판매데이터 분석
〉
You: 니가 구분한 고객그룹별로 마케팅전략 조금 더 아이디어를 내서 상세하게 설명해줄래? 우리는 종합화장품회사야.
GPT: 클러스터별로 맞춤화된 마케팅 전략 아이디어입니다.
클러스터 0 - 저소득 중년 고객층
전략: 이 그룹은 낮은 소비 점수를 가지고 있어 가성비를 중시하는 경향이 있을 수 있습니다. 품질 좋고 가격 대비 성능이 뛰어난 제품을 중심으로 마케팅을 진행하면 좋습니다.
제품: 일상적인 스킨케어 제품, 기초 화장품 세트 등을 추천합니다.
커뮤니케이션: 가격 대비 가치와 제품의 효과성을 강조하는 메시지를 사용합니다. 할인 행사나 묶음 판매를 통해 가격 인센티브를 제공할 수 있습니다.
클러스터 1 - 젊고 소비력이 높은 고객층
전략: 이 그룹은 소비 점수가 높고 연령대가 낮으며, 새로운 트렌드나 프리미엄 제품에 대한 관심이 높을 것으로 예상됩니다.
제품: 최신 트렌드를 반영한 화장품, 고급 스킨케어 라인, 화장품 기기 등을 소개합니다.
커뮤니케이션: 소셜 미디어 마케팅을 강화하고, 인플루언서와의 협업을 통해 브랜드 인지도를 높이는 캠페인을 진행합니다.
클러스터 2 - 고소득 중년 고객층
전략: 이 그룹은 높은 수입에도 불구하고 소비 점수가 낮은 경향이 있어, 투자 가치가 있는 고급 제품에 관심이 많을 수 있습니다.
제품: 안티에이징이나 특수 피부 고민에 대응하는 고급 스킨케어 제품을 제안합니다.
커뮤니케이션: 개인 맞춤형 상담, 체험 이벤트, 전문가 리뷰 등을 통해 신뢰성을 강조합니다.
클러스터 3 - 평균적인 중년 고객층
전략: 중간 수준의 소득과 소비 점수를 가진 이 그룹은 실용적인 구매를 선호할 가능성이 있습니다.
제품: 다기능성 제품, 제품 패키지, 시즌별 스킨케어 제품 등을 소개합니다.
커뮤니케이션: 제품의 실용성과 장기적인 피부 건강 혜택을 강조합니다. 리뷰와 사용 후기를 중심으로 신뢰를 쌓는 캠페인을 진행합니다.
클러스터 4 - 젊고 활동적인 저소득 고객층
전략: 이 그룹은 낮은 수입에도 불구하고 소비 점수가 높아, 스타일리시하고 경제적인 제품을 찾을 것입니다.
제품: 젊은 층을 겨냥한 컬러 화장품, 트렌디한 포장의 스킨케어 제품 등을 제안합니다.
커뮤니케이션: SNS를 통한 마케팅, 한정판 출시 이벤트, 젊은 층이 좋아할 만한 디자인과 패키징에 집중합니다.
각 클러스터의 고객 특성을 고려한 이러한 마케팅 전략은 고객의 관심을 끌고, 브랜드 충성도를 높이며, 최종적으로는 매출 증대로 이어질 수 있습니다.
—〈데이터 분석 실습 3. 고객세분화를 하고 맞춤형 마케팅전략을 도출하라_판매데이터 분석
〉
You: 이 100명의 고객을 대상으로 개인이 좋아할 상품을 추천해주는 시스템을 만들고 싶은데 가능할까?
GPT: 추천 시스템을 만들 때 사용할 수 있는 여러 가지 방법이 있습니다. 여기 몇 가지를 소개하겠습니다:
1. 연관 규칙 분석 (Association Rule Mining)
Apriori, FP-Growth: 고객의 구매 패턴을 분석하여 상품 간의 연관성을 찾아냅니다.
2. 협업 필터링 (Collaborative Filtering)
User-User: 유사한 고객을 찾아 해당 고객이 좋아하는 상품을 추천합니다.
Item-Item: 특정 상품을 구매한 고객이 구매한 다른 상품을 찾아 추천합니다.
3. 콘텐츠 기반 필터링 (Content-Based Filtering)
상품의 특성(예: 카테고리, 브랜드, 가격 범위 등)을 분석하여 유사한 상품을 추천합니다.
4. 행렬 인수분해 (Matrix Factorization)
SVD, NMF: 고객-상품 행렬을 분해하여 누락된 값을 예측합니다. 이 값을 기반으로 상품을 추천합니다.
5. 딥러닝 기반 추천
AutoEncoders, RNN, LSTM: 복잡한 패턴을 학습할 수 있는 딥러닝 모델을 사용하여 추천을 수행합니다.
어떤 방법을 적용해보시겠습니까?
—〈데이터 분석 실습 4. 고객맞춤 추천시스템을 구축하라_판매데이터 분석〉
You: 고객 ID 18102.0가 가장 살 확률이 높은 상품 5개만 추천해줄래?
GPT: 고객 ID 18102.0가 구매할 확률이 가장 높은 상품 5개와 각각의 추천점수는 다음과 같습니다.
고객 ID 18102.0
토끼 야간 조명 (추천점수: 7.75)
리젠시 케이크 스탠드 3단 (추천점수: 6.59)
현관문 매트: 차분하게 들어오세요 (추천점수: 5.72)
파티 깃발 (추천점수: 5.26)
상자에 담긴 빨간 하모니카 (추천점수: 4.46)
You: 이 고객에게 마케팅 이메일을 보내고 싶은데, 좀 써줄래?
GPT: 고객 ID 18102.0을 위한 특별한 선택, 이번 주 인기 상품들!
안녕하세요, 고객님!
최근에 고객님과 비슷한 취향을 가진 고객들 사이에서 큰 인기를 끌고 있는 몇 가지 특별한 제품들을 소개드리고자 합니다. 이 제품들은 고객님의 일상에 특별함을 더해줄 것입니다!
토끼 야간 조명: 아름다운 밤을 위한 완벽한 선택! 우아한 디자인의 이 래빗 나이트 라이트는 당신의 침실에 따뜻함과 고급스러운 분위기를 더해줄 것입니다. 이미 많은 고객님들이 사랑하고 계세요.
리젠시 케이크 스탠드 3단: 모임이나 파티에 완벽한 추가 아이템! 이 케이크 스탠드는 당신의 테이블을 더욱 빛나게 할 것입니다. 당신의 케이크와 디저트를 더욱 맛있게 보이게 해줄 거에요.
현관문 매트: 차분하게 들어오세요: 집안의 첫인상을 담당하는 매력적인 도어매트! 이 도어매트는 당신의 집을 방문하는 모든 이들에게 따뜻한 환영의 메시지를 전달합니다.
파티 깃발: 파티를 더욱 즐겁고 화려하게 만들어줄 장식입니다. 이 컬러풀한 장식으로 당신의 파티를 더욱 기억에 남는 순간으로 만들어보세요.
상자에 담긴 빨간 하모니카: 음악을 사랑하는 당신을 위한 세련된 선택! 이 하모니카는 당신의 음악적 감각을 빛내줄 것입니다.
지금 바로 이 특별한 제품들을 확인해보세요. 당신의 선택이 당신의 일상에 즐거움을 더할 것입니다.
감사합니다.
—〈데이터 분석 실습 4. 고객맞춤 추천시스템을 구축하라_판매데이터 분석〉
데이터 기반 접근(Data-driven Approach)은 비즈니스의 새 상식이다. 데이터를 기반으로 의사결정을 하지 않는 기업, 팀, 실무자는 살아남는 게 기적이다. 과거에는 데이터 분석이 너무 접근하기 어려운 분야였지만, 이제는 ChatGPT를 위시한 초거대언어모델들 덕분에 정말정말 쉬워졌으니, 이제부터라도 꼭 데이터를 자신만의 새 무기로 장착하고 큰 생산성 혁신을 이루어주시길 부탁한다.
실무자들이 성장하면 기업의 경쟁력이 강해지고, 그렇게 기업이 더 좋은 상품/서비스를 생산해내면 결국 모든 국민들이 혜택을 보기 때문이다.