RFM Analizi ile Müşteri Segmentasyonu…

Neden müşterilerimizi segmentasyona sokuyoruz?

Züleyha Çakır
4 min readOct 1, 2021

Diyelim ki çok fazla müşterimiz var ancak çalışan sayımız az. Müşterilerimizle ilgilenmemiz gerekiyor ve biliyoruz ki yeni müşteri bulmak var olan müşterimizle ilgilenmekten daha maliyetli bir duruma sebep oluyor. Burada hangi müşteriyle ilgilenirsek bize kazanç sağlayacaktır buna ulaşmaya çalışırız, potansiyeli olan müşterilerle ilgilenmeyi amaçlarız.

RFM nedir?

RFM analizi müşteri segmentasyonu için kullanılan bir tekniktir. Müşterilerin satınalma alışkanlıkları üzerinden gruplara ayrılması ve bu gruplar özelinde stratejiler geliştirilebilmesini sağlar.

Recency (Yenilik): Bize müşterinin alışverişinin ne kadar yakında/uzakta olduğunu ifade eder diyebiliriz. Bir müşteri 1 gün önce alışveriş yaptıysa, farklı bir müşteri 100 gün önce alışveriş yaptıysa bu durumda 1 gün önce alışveriş yapan müşteriyi daha değerli olarak sayabiliriz.

Frequency (Sıklık): Müşterinin satın alma sıklığını ifade eder. Bir müşterinin 1000 tane, diğer bir müşterinin 10 tane ürün aldığını düşünürsek, 1000 tane ürün alan müşteri daha değerli olacaktır diyebiliriz.

Monetary (Parasal Değer): Müşterinin alışveriş için harcadığı parayı ifade eder. Daha fazla alışveriş yapan müşteri, daha fazla parası olan müşteridir diyebiliriz.

https://www.retailreco.com/blog/rfm-analysis-for-customer-segmentation-in-ecommerce/

Müşterilerimizin geçmiş verilerini kıyaslayarak her bir müşteri bazında recency, frequency ve monetary değerlerini kıyaslayacağımızdan burada bir ölçeklendirme problemimiz oluşuyor. Tüm değerleri 1–5 arasında skora çevirmemiz bu problemi çözmemizi, büyüklük-küçüklük algısını takip etmemizi sağlar.

RFM analizi yapabilmek için geçmiş alışveriş bilgilerini içeren veritabanına ihtiyacımız olacaktır. Projede inceleyeceğimiz veriye buradan ulaşabilirsiniz.

O zaman veri setini incelemeye başlayalım;

İnceleyeceğimiz veri seti “online_retail_II” isimli veri setidir. Online Retail II isimli veri seti İngiltere merkezli online bir satış mağazasının 01/12/2009–09/12/2011 tarihleri arasındaki satışlarını içermektedir. Şirketin ürün kataloğunda hediyelik eşyalar yer almaktadır ve müşterilerin büyük kısmı kurumsal müşterilerdir.

Değişkenlerimiz:

  • InvoiceNo: Fatura Numarası. Eğer bu kod C ile başlıyorsa işlemin iptal edildiğini ifade eder.
  • StockCode: Ürün kodu- Her bir ürün için eşsiz numara.
  • Description: Ürün ismi
  • Quantity: Ürün adedi. Faturalardaki ürünlerden kaçar tane satıldığını ifade etmektedir.
  • InvoiceDate : Fatura tarihi
  • UnitPrice : Fatura fiyatı (Sterlin)
  • CustomerID : Eşsiz müşteri numarası
  • Country: Ülke ismi

Excelde 2 sheet bulunmaktadır. Ben “Year 2010–2011” olan 2. sheeti kullanacağım. Haydi başlayalım!

Öncelikle gerekli kütüphaneleri import ediyoruz ve düzenlemeleri yapıp, veriyi okutuyoruz.

Veri setine ait değişkenleri inceliyoruz.

Betimsel istatistiklerini incelediğimizde Quantity’ de negatif değerler bulunuyor. Bunun nedeni iade işlemlerinden kaynaklı iptal fatura işlemleridir. Bu iptal faturaları veriden çıkarmamız gerekiyor.

Veride C (iptal olan faturalar) barındıranlar için“~” diyerek C’ lerin haricindekileri (dolu olanları) getirdik.

Şimdi gerekli düzenlemeler sonrası RFM metriklerini hesaplamak için analize başlayacağız. Ancak dikkat etmemiz gereken bir durum var, bu analizi 2021 yılında yapıyoruz ve veri setimizdeki tarihler daha farklı. Bu nedenle bir analiz tarihi belirlememiz gerekiyor.

Bu veri setinin maximum tarihini buluyoruz ve Recency için hesaplama yaparken gün olarak farkını aldığımızda problem yaşamamak için 2 gün sonrasını analiz tarihimiz olarak belirliyoruz.
Customer ID’ lere baktığımızda anlıyoruz ki bir müşterinin birden fazla faturası var ve bu işlemler sonucunda o müşteriye ait eşsiz fatura sayısını saydırmış oluyoruz.

RFM Skorlarının Hesaplanması:

Yukarıda elde ettiğimiz çıktıdaki metriklerin karşılaştırılabilirliği yoktur. Örneğin; recency değerlerinde küçük olan değer bize en iyi değeri verecek, frequency ve monetary için de tam tersi olarak büyük olan değer bize en iyi değeri verecek. Burada büyük küçük ayrımını yapabilmek için değerleri 1–5 arasında skora çeviricez.

RFM_SCORE değerini hesaplarken recency ve frequency değerlerini alıyoruz.

RFM Segmentlerinin Oluşturulması ve Analizi:

F:frequency, R: recency değerlerinin skorlarını 1–5 aralığında ifade eder. Tabloda x ve y de yer alan skorlara göre müşterimizin hangi segmentte olduğunu analiz edip, buna göre aksiyonlar geliştirebiliriz.

Kısaca birkaç örnek ile açıklamak gerekirse;

  • can’ t loose them (F:5, R:1) : alışveriş sıklığı fazla olan ancak en son alışverişi üzerinden uzun süre geçen müşterilerdir. İlgilenmezsek R ve F değerleri azalacağından dolayı riskli gruba kayıp kaybedebileceğimiz müşterilerdir.
  • new customers (F:1, R:5) : alışveriş sıklığı az olan ancak yakın zamanda alışveriş yapmış müşterilerdir. İlgilenildiği takdirde potansiyel sadık müşteri veya şampiyon müşteri olabilirler.
Segmentleri betimleyip, analizini gerçekleştirdik.

Sonuç olarak; sadık müşterilerimize bakacak olursak alışveriş sıklığı ortalaması 6.48, kaybedemeyeceğimiz müşterilerin alışveriş sıklığı ortalaması 8.38. Yani; sadık müşterilerimizin ortalamasından daha yüksek. Alışveriş sıklığı açısından değerlendirdiğimizde kaybetmemiz gerek ve alışveriş için harcadağı paraya baktığımızda da daha potansiyeli yüksek müşteri olarak kabul edebiliriz. Müşteriye kampanyalar sunabilir, indirim kuponu fırsatlarını değerlendirmesi için bilgilendirme amaçlı mesajlar gönderebiliriz.

Risk grubu müşterilerimiz, kaybetmek üzere olduğumuz müşterilerimizdir. Varolanı elimizde tutmak yeni müşteri kazanmaktan daha az maliyetli olduğundan müşteriyi elimizde tutmaya çalışmalıyız. Telefon ya da mail yoluyla ankete katılımlarını sağlayarak olumlu, olumsuz dönüşlerine göre bu segmentte yer alan müşteriler ile ilgili farklı bir yol izlenebilir. Ürünlerimizin indirim/kampanya gibi fırsatlarını sürece dahil edebiliriz.

Bir sonraki yazıda görüşmek üzere!

Proje kodlarının tamamına github hesabımdan ulaşabilirsiniz.

Kaynak: Veri Bilimi Okulu — Veriye Dair Her Şey

--

--