3A Superstore Data Analitiği Projesi¶
3A Superstore Analytics, perakende işlem verisi üzerinde ekipçe hazırlanmış bir veri analitiği projesidir. Projede satışları, enflasyona göre düzeltilmiş gelir performansını, müşteri davranışını, kategori trendlerini, bölgesel yoğunlaşmayı ve retention (müşteriyi elde tutma) fırsatlarını analiz etmek için BigQuery, dbt, Python notebookları ve Power BI kullanıldı.
Proje çıkarımı
Veri seti Türkiye'de yüksek enflasyon yaşanan bir dönemdeki perakende satışlarını kapsadığı için nominal satışlar yanıltıcı olabilir. Proje, nominal ve reel geliri karşılaştırmak için işlem verisini TCMB EVDS TÜFE verisiyle birleştirir; ardından sonucu sipariş, müşteri, ürün adedi ve ürün fiyatı sinyalleriyle kontrol eder.
Analiz Portföyü¶
Her ekip üyesi farklı bir iş sorusuna odaklanıp analizini onun üzerine kurmuştur.
-
Gelir Performansı ve Enflasyon Analizi
Nominal ve reel gelir, TÜFE düzeltmesi, ürün fiyatı doğrulaması ve enflasyon duyarlı KPI'lar.
Yazar: Doruk Alkan
-
Satış trendleri, sipariş hacmi, coğrafi gelir örüntüleri ve gelir tahmini.
Yazar: Ebubekir Tilbaç
-
Çapraz satış fırsatları, churn sinyalleri, sepet çeşitliliği ve yüksek değerli müşteriler.
Yazar: Ebubekir Tilbaç
-
Müşteri değer segmentasyonu, sağlık aşamaları, coğrafi değer yoğunlaşması ve retention öncelikleri.
Yazar: Yasemen Dündar
-
Müşteri Elde Tutma ve RFM Analizi
RFM segmentasyonu, aktif müşteri oranı, risk altındaki gelir ve retention stratejisi.
Yazar: Yasemen Dündar
-
Bölgesel gelir yoğunlaşması ve kategori katkısının coğrafyaya göre değişimi.
Yazar: Eda Bilgin
-
Kategori geliri, satış adedi, sipariş aktivitesi ve kategori karışımının zaman içindeki istikrarı.
Yazar: Eda Bilgin
Teknik Uygulama¶
dbt projesi katmanlı bir model yapısıyla düzenlendi:
- Staging modelleri siparişler, sipariş detayları, müşteriler, şubeler, kategoriler ve TÜFE için ham BigQuery tablolarını temizler.
- Intermediate modelleri sipariş geliri, şube boyutları, aylık TÜFE metrikleri ve ürün-ay fiyatlaması gibi yeniden kullanılabilir analitik mantıkları oluşturur.
- Mart modelleri gelir trendleri, KPI kartları, ürün fiyat trendleri, kategori fiyat hareketleri, şube geliri, müşteri 360 ve RFM analizi için dashboard'a hazır tablolar üretir.
- Özel dbt testleri grain, TÜFE matematiği, dönem pencereleri ve dashboard KPI hesaplamalarını doğrular.
Mevcut dbt grafiği parse edildikten sonra 26 model, 1 seed ve 189 test içerir.
flowchart LR
raw[Ham BigQuery tabloları] --> stg[dbt staging]
stg --> int[Intermediate modeller]
cpi[TCMB EVDS TÜFE seed'i] --> int
int --> marts[Analitik martlar]
marts --> powerbi[Power BI dashboardları]
marts --> notebooks[Modelleme notebookları]
Kullanılan Araçlar¶
| Araç | Rol |
|---|---|
| BigQuery | Veri ambarı, SQL keşfi, ham tablo saklama ve analitik çıktılar. |
| dbt | Dönüşüm modellemesi, dokümantasyon ve otomatik veri testleri. |
| Python, Jupyter, Google Colab | Keşifsel analiz, doğrulama ve tahmin denemeleri. |
| Power BI | Final dashboardları ve iş odaklı görsel analiz. |
| Zensical | Herkese açık proje sitesi ve portföy dokümantasyonu. |
Proje Bağlantıları¶
-
Kaynak veri seti, ham tablo özeti, Kaggle atfı ve TÜFE ek verisi notları.
-
Ekip üyeleri ve proje odakları.
-
Kaynak kod, dbt modelleri, notebooklar, SQL sorgu arşivi ve Zensical site dosyaları.
