Data Science di Industri Telekomunikasi

image description


Sebagai salah seorang yang pernah berkecimpung di dunia vendor telekomunikasi selama 6 tahun lebih khususnya bagian charging dan billing dan memiliki sedikit pengetahuan tentang bagaimana mengolah datanya sejak bergabung di perusahaan konsultasi Stream Intelligence, saya ingin mengupas apa saja sih yang bisa dilakukan oleh perusahaan telekomunikasi terhadap data yang mereka punya. 

Sebelum masuk ke situ, mari kita telaah dulu datanya. Mereka memiliki beberapa macam data sebagai berikut. 

1. Call Data Records. Biasanya datanya berupa data transaksional, di mana ada kolom timestamp, A Party (nomor yang melakukan transaksi), B Party (nomor yang dituju), jenis transaksi (bisa call, SMS, Data, USSD, dll.), Account Balance, Durasi, Kode Lokasi Area, Charge Amount, dll.  

2. Recharge Records. Istilah bahasa Indonesianya adalah Data rekaman isi ulang pulsa. Data ini berisi kolom-kolom seperti kapan seorang subscriber melakukan transaksi recharge (timestamp), nomor MSISDN, dan jumlah isi ulang. Biasanya mereka juga telah melakukan agregasi misalkan dalam sebulan, jadi sudah ada data yang unique untuk masing-masing MSISDN, dengan average recharge, dan frequency recharge. 

3. Browsing History, berupa data yang memuat kolom seperti jumlah visit terhadap website atau app yang diakses, durasi, dan timestamp.  

4. Customer Demographic, seperti umur, jenis kelamin, pekerjaan, dll. Sayangnya, validitasnya diragukan untuk yang kartu prepaid, karena Indonesia tidak memiliki kemampuan verifikasi Nomor KTP. Tidak seperti di negara maju, misalkan Singapura, yang mewajibkan setiap store yang menjual kartu perdana untuk menge-map nomor hp tersebut adalah milik siapa berdasarkan ID atau Paspor yang dimiliki. Untuk yang postpaid, saya yakin data nya lebih valid hanya saja, jumlahnya hanya 1% dari total populasi. 

5. Network Data, seperti di BTS ini memiliki uptime 99%, adakah blankspot, dll. 

6. Data tambahan, bisa jadi mereka punya lagi sumber data yang lain, seperti kapan terakhir menghubungi Customer Service, ada keluhan atau pertanyaan, dsb. 





Apa saja hal-hal yang menarik yang dapat kita olah berdasarkan data yang ada di atas? 

1. Pemberian layanan yang lebih personal. Kita bisa melakukan segmentasi terhadap customer tertentu. Bisa berdasarkan Recency, Frequency, dan Monetary (RFM), bisa berdasarkan Lifestyle, Demografi, dsb. Jika demografi data dirasa tidak valid, kita bisa membuat model untuk memprediksi demografi, seperti yang tahun lalu pernah dijadikan kontes di Kaggle, di mana kasusnya terjadi pada China Mobile, untuk memprediksi umur dan jenis kelamin. 

2. Optimisasi Network, sesederhana kita gunakan Tableau dan ambil data sumber dari BTS dan MSC.

3. Media Sosial dan Analisis sentimen. Untuk data ini, ranahnya sudah lebih eksternal, jadi kita mesti mempelajari API-API untuk masing-masing social media. Kita bisa me-mapping apakah customer tersebut menggunakan network operator pada saat browsing atau tidak. 

4. Inisiatif berdasarkan Lokasi. Dari sini kita bisa mengetahui lokasi tertentu itu disesaki oleh segmen apa pada rentang waktu tertentu. Misalkan di daerah Sudirman, sudah pasti banyak pekerja profesional yang berusia dari 21-50 sedang bekerja pada jam 8 pagi -5 sore. Untuk itu, mungkin operator dapat menge-treat mereka secara berbeda, dengan memberikan tailor sms.  

5. Pencegahan Churn (Pindah Operator). Kita dapat memahami pola kira-kira kapan seseorang akan pindah jaringan operator. Misalkan seorang pelanggan dinyatakan churn jika sudah 1 bulan tidak melakukan transaksi telekomunikasi sama sekali. Naaah, ini bisa dimodelkan, kira-kira apa sih pola yang sebelumnya dia alami. Apakah lokasinya berada di daerah yang sinyalnya buruk? Ataukah kebanyakan berada di gedung yang tidak terjangkau sinyal 4G, sehingga dia pindah ke operator lain? 

Sebenarnya masih banyak lagi hal-hal yang bisa kita olah berdasarkan data telco yang super besar ini. Saya katakan super besar, karena bisa kita bayangkan, untuk sebuah perusahaan telekomunikasi yang memiliki 30 juta pelanggan aktif saja. Asumsikn ada 10 transaksi per hari. Berarti sudah ada 300juta baris per hari di Call data record. Kalau 1 bulan? tinggal kalikan saja dengan 30, berarti ada 9 miliar baris CDR. 1 tahun sudah ada 108 miliar baris CDR. Begitu besar dan memang telco salah satu industri yang memiliki big data. 

Latest articles

OUR TOP 5 CONTRIBUTOR

image description

Fajar Muharandy

-

-

image description

Fajar Jaman

-

-

image description

Bernardus Ari Kuncoro

-

-

image description

Rasyid Ridha

image description

Data Science Indonesia

data scientist

@datascience