Data Mining Untuk Permasalahan Bisnis dan Keuangan

image description

Dewasa ini para pelaku bisnis dituntut untuk memiliki suatu ide berinovasi dalam mengatasi persaingan antar pelaku bisnis yang semakin kompetitif untuk memasuki dan mempertahankan pasar. Sudah sewajarnya dalam pelaku bisnis akan mengalami tumbuh dan berkembang, namun adapula yang gulung tikar. Karena itu dibutuhkan suatu keputusan bisnis yang implementasinya berupa perencanaan strategis dan sistematis yang bertujuan untuk membentuk dan menyempurnakan usaha yang dilakukan dalam melaksanakan kegiatan bisnis.  Selain itu, ledakan eksponensial dalam data baik dari segi kuantitas maupun penggunaanya telah terjadi dalam kurun waktu 20-30 tahun terakhir dalam berbagai bidang khususnya dalam bidang bisnis. Ledakan pertumbuhan data ini diimbangi oleh kemajuan teknologi komputer  dan perkembangan teknologi internet. Andil dari internet tidak hanya dalamakumulasi data saja tetapi memungkinkan bagi kita dengan mudah mendapatkan datasecara cepat dan akurat. Metodologi tradisional tidak dapat menangani data dalam jumlah besar untuk menganalisis, meringkas dan mengekstraksi pengetahuan. Data mining merupakan respon untuk permasalahan ini. Data mining merujuk pada analisis data dalam jumlah besar yang tersimpan di komputer. Data mining yang mencakup analisis kecerdasan buatan dan/atau analisis statistik mengandung semangat knowledge discovery. Dalam hal ini penemuan pengetahuan direpresentasikan dalam perangkat grafis dan identifikasi pola-pola yang tidakdiduga sebelumnya.  Data dapat terpublikasi dan dibagi atau hanya kalangan tertentu yang dapat mengakses data tersebut. Banyak perdebatan yang terjadi seperti data personal yang bisa dikases oleh social media seperti percakapan antar orang dan privasi tersebut dapat digunakan oleh komersial.

Perencaanaan strategis tak lepas dengan konsep statistika yang merupakan ilmu atau metodologi yang memiliki filosofi berpikir berkaitan dengan analisis, interpretasi, dan penyajian data sebagai bahan pengambilan keputusan. Dalam kegiatan bisnis, penerapan statistical thinking atau berpikir secara statistik menjadi sangat penting bagi pengambil keputusan (Decision Maker) termasuk bagi pelaku manajemen untuk dapat mengevaluasi sistem yang berjalan, dan dapat menyarankan atau merekomendasikan kepada manajemen untuk melakukan perubahan maupun perbaikan sistem secara berkelanjutan. Denganstatistical thinking dapat melihat gejala dan variasi yang terjadi pada setiap proses dalam operasional bisnis dengan berdasarkan fakta yakni adalah objek atau pengamatan yang ada dilapangan. Terdapat banyak sekali tools yang bisa digunakan yang bersifat robust atau memiliki error yang sangat kecil dan memiliki kemudahan dan efisien dalam  interpretasi dan analisis salah satunya adalah machine learning dan Data Mining.

 Perkembangan Penggunaan Machine Learning dan Data Mining

Banyak peneliti Indonesia yang mengembangkan konsep machine learning dalam banyak kasus, salah satunya adalah bisnis dan ekonomi. Sebagai penerapannya adalah menggunakan beberapa teknik dalam melakukan analisis keuangan seperti pemodelan inflasi , kurs rupiah dan lainnya. Saat ini masing-masing individu dan organisasi – bisnis, atau lembaga dapat mengakses sejumlah besar data dan informasi tentang dirinya sendiri dan lingkungannya. Data ini memiliki potensi untuk memprediksi evolusi variabel yang menarik atau tren di lingkungan luar, tapi sejauh ini potensi yang belum sepenuhnya dieksplorasi. Hal ini terutama berlaku di bidang bisnis. Ada dua masalah utama. Informasi tersebar dalam arsip yang berbeda sistem yang tidak terhubung dengan satu sama lain, dan menghasilkan sebuah informasi yang tidak efisien dari data. Ada kurangnya kesadaran tentang alat statistik dan keguaan tersebut potensial untuk elaborasi informasi mengganggu produksi dan distribusi informasi dari data yang relevan sintesis. Dua perkembangan bisa membantu mengatasi masalah ini. Pertama, perangkat lunak dan hardware terus menawarkan lebih banyak kekuatan dengan biaya lebih rendah, memungkinkan organisasi untuk  mengumpulkan dan mengatur data dalam struktur yang memberikan akses yang lebih mudah dan transfer. Kedua,penelitian metodologis, khususnya di bidang komputasi dan statistik, baru-baru ini memiliki pengembangan prosedur yang fleksibel dan scalable yang dapat digunakan untuk menganalisis big data. Dua perkembangan ini berarti data yang digali (mining) dengan cepat menyebar melalui banyak bisnis sebagai intelijen penting alat untuk back up keputusan bisnis. Untuk memahami istilah ‘data mining’ hal ini berguna untuk melihat terjemahan harfiah kata: pengertian dari kata “tambang/galian” dalam bahasa Inggris berarti untuk mengekstrak. Kata kerja biasanya mengacu pada pertambangan operasi yang ekstrak dari Bumi tersembunyi, sumber daya yang berharga. Asosiasi kata ini dengan menunjukkan pencarian mendalam untuk menemukan tambahan Informasi yang sebelumnya  dalam massa data yang tersedia.

Machine learning (sumber:deusm)

Dari sudut pandang penelitian ilmiah, data mining adalah disiplin yang relatif baru yang telah dikembangkan terutama dari studi yang dilakukan dalam disiplin lain seperti komputasi, pemasaran, dan statistik. Banyak metodologi yang digunakan dalam data mining berasal dari dua cabang penelitian, yang dikembangkan dalam pembelajaran machine learning dan lainnya yang berkembang di masyarakat statistik, khususnya di multivariat dan statistik komputasi. Machine learning terhubung ke ilmu komputer dan kecerdasan buatan dan berkaitan dengan menemukan hubungan dan keteraturan dalam data yang dapat diterjemahkan menjadi kebenaran umum. Tujuan dari machine learning adalah reproduksi, proses data menghasilkan dan memungkinkan analis untuk menggeneralisasi dari data diamati baru atau kasus teramati. Rosenblatt (1962) memperkenalkan model pertama dalam machine learning yang disebut perceptron. Jaringan saraf (neural network) dikembangkan di paruh kedua tahun 1980-an. Selama periode yang sama, beberapa peneliti menyempurnakan teori pohon keputusan (decision tree) yang digunakan terutama untuk menangani masalah klasifikasi. Applikasi statistik selalu tentang membuat model untuk menganalisis data,dan sekarang ada kemungkinan menggunakan komputer untuk melakukannya. Pada tahun 1980-an, mengingat pentingnya peningkatan metode komputasi sebagai dasar untuk analisis statistik, ada juga pembangunan paralel dari statistik metode untuk menganalisis aplikasi real multivariate. Pada 1990-an statistik mulai menunjukkan minat dalam metode machine learning juga, yang menyebabkan penting perkembangan dalam metodologi.

“Data mining is the process of selection, exploration, and modelling of large quantities of data to discover regularities or relations that are at first unknown with the aim of obtaining clear and useful results for the owner of the database” – (Guidici,2003)

Implementasi  dari Metode

Data mining dapat dijadikan priortias utama dalam analisis. Effort utama adalah mengumpulkan data,membersihkan (cleaning) dan organize dengan banyak teknik dan malukan intepretasi dan mendapatkan informasi yang terkandung. Banyak sekali teknik yang dapat digunakan seperti decision tree sebuah teknik dalam data mining untuk klasifikasi, regresi untuk mengukur dan mengetahui hubungan antara variabel atau masalah, klaster untuk mengelompokkan data yang memiliki karakteristik yang sama,association rule mining atau juga disebut basket analysis yang digunakan pada industry retail untuk melihat asosiasi dari data dan paling utama adalah melakukan visualisasi dari data untuk melihat kesimpulan dri permasalahan. Banyak sekali ribuan kemungkinan yang mampu digunakan pada data mining dan melakukan analisis prediktif. Seperti

  1. Fraud detection : Fraud detection selalu sigunakan dalam aspek industry keuangan. Namun tidak sampai hanya disana. Ide awal dari deteksi aktifitas fraud adalah terlaku banyak transaksi yang terjadi dengan menggunakan metode dari analisis prediktif tersebut. Selain itu mampu melakukan dteksi error dari model yang memiliki permasalahan yang normal maupun fraud dan menggunakan model tersebut pada transaksi yang baru untuk melihat apakah fraud tersebut terjadi di segmen yang berbeda
  2. Churn Prevention: Asumsi pada industry asuransi keuangan memiliki kontrak polis terhadap konsumen baru. Industry asuransi berharap bisa menjalin hubungan yang lama dengan pemegang polis.. namun, beberapa pemegan polis memiliki banyak alasan untuk melakukan pemutusan kontrak tersebut. Oleh karena itu data mining mampu digunkana sebagai toolsagar pada konsumen selanjutnya tidak terjadi dan mampu melakukan evaluasi dari produk asuransi. Ide dasar dari churn prevention adalah melakukan prediktif model berdasarkan  banyak kemungkinan yang terjadi. Selain bidanng industry keuangan. Churn prevention juga bisa diterapkan pada industry retail, e-commerece atau telekomunikasi
  3. Sentiment Analisis : sentiment analisis tidak semuanya selalu berhubungan terhadap industry keuangan. Sentimentanalisis dapat digunakan untuk telekomunikasi, kesehatan dan masih banyak lagi. Ide sederhana dari teknik ini adalah menghubungkan jutaan online sources dari website, mengumpulkan komentar dari sebuah produk atau brand perusahaan. Melakukan analisis dengan konsep text mining dn melakukan evaluasi apakah konsumen menyukai produk tersebut atau tidak.
  4. Trading analytics : apabila seorang trader , melakukan investasi pada portofolio atau kebijakan atau kesepakatan bisnis. Untuk menghitung tingkat kesuksesan pada keputusan yang akan dambil dapat menggunakan analisis prediktif. Pada umumnya, diharapkan mampu menganalisis permasalahan yang potensial dengan melihat pasar atau aspek pasar tersebut dengan melihat kejadian pasar. Banyak analisis melakukan kombinasi metode tradisional time serirs dengan algoritma hybrid atau juga sentiment analysis
  5. Risk management : contoh lainnya pada industry keuangan dan dapat dilakukan di banyak industry. Khususnya pada supply chain management. Sebagai contoh analisis manufaktur atau logistic transportasi. Data miing dan analisis prediktif dapat digunakan untuk menyelesaikan banyak masalah yang berhubungan kepada risk management . termasuk deteksi error dan quantitas untuk review atau internal audit. Melakukan deteksi fraud, identifikasi supplier dengan banyak kemungkinan gagal, perhitungan pembayaran, dan credit scoring.
  6. Quality assurance : Applikasi lainnya pada prediksi kualitas dari sebuah process sebelum proses tersebut selesai. Model yang prediktif digunakan untuk mendeskripsikan model yang digunakan pada proses dan melakukan kombinasi terhadap sensor data untuk mendeskripsikan status terbaru dari sebuah produk yang diproduksi berhubungan kepada deteksi anomaly dan kenapa sebuah produk yang diproduksi secara sama memiliki kualitas yang berbeda.

Dalam konteks utilitas bisnis dari hasil dari sebuah analisis dapat diapplikasikan dengan baik. Oleh karena itu yang membedakan data mining dari analisis statistik tidak begitu banyak jumlah data yang kita gunakan dalam menganalisis atau metode yang kita gunakan tetapi kita bahwa mengintegrasikan apa yang kita ketahui tentang database, sarana analisis dan pengetahuan bisnis. Untuk menerapkan metodologi data mining berarti menyusul terpadu proses metodologis yang melibatkan menerjemahkan kebutuhan bisnis ke dalam masalah yang harus dianalisis, mengambil database yang diperlukan untuk melaksanakan analisis, dan menerapkan teknik statistik diimplementasikan dalam algoritma komputer dengan tujuan akhir dari pencapaian hasil penting berguna untuk mengambil keputusan strategis. Keputusan strategis tersebut akan sendiri dibuat guna memenuhi kebutuhan pengukuran baru dan akibatnya pada kebutuhan bisnis. Data mining tidak hanya tentang penggunaan algoritma komputer atau statistik. Teknik tersebut juga sebuah  proses intelijen bisnis yang dapat digunakan bersama-sama denganapa yang disediakan oleh teknologi informasi untuk mendukung keputusan perusahaan.Data mining juga bukan hanya analisis dari sebuah data. Namun juga sebuah integrase dari hasil untuk mendukung pada keputusan bisnis dalam perusahaan. Dalam pengetahuan bisnis. Melakukan ekstraksi dari permasalahan kepada keputusan bisnis kita dituntut untuk dapat membuat sebuah analisis yang tajam dan dapat menghasilkan keputusan yang baik. Model yang telah didapat dari  sebuah analsis dari dataset tersebut juga diharapkan mampu meningkatkan profit perusahaan.Melihat dari manfaat yang bisa didapat dari data mining. Sangat krusial untuk melakukan implementasi proses dengan benar.  Inklusi dari proses data mining terhadap permasalahan perusahaan harus dilakukan dengan baik, juga memperhatikan realitas dari sebuah metode untuk menyelesaikan permasalahan tersebut. Proses integrasi dapat dibedakan menjadi:

  1. Strategic phase: Pada tahap ini kita mempelajari prosedur bisnis yang digunakan untuk melakukan identifikasi dimana data mining dapat memberikan manfat yang besar. hasil dari tahap ini adalah didapat sebuah definisi bisnis yang objektif terhadap analisator dan kriteria koreksi (error) untuk melakukan evaluasi tersebut
  2. Training phase : Pada tahap ini dianggap data mining mampu mengevaluasi secara hati-hati. Analisator diharapkan mampu dalam melakukan kajian perusahaan dan menerapkan sisi objektif dan kriteria berdasarkan tahap sebelumnya. Pilihan yang dipilih oleh analisator merupakan aspek yang sangat fundamental. Penting di ingat bahwa diperlukan metode yang efisien dan mudah dalam implementasi  dan mampu melakukan visualisasi masalah dengan baik. Pada tahap ini akan didapatkan 2 kemungkinan. Antara lain adalah: evaluasi preliminary dari metode data mining yang berbed dan definisi dari system prototype data mining.
  3. Creation Phase: berdasarkan hasil evaluasi yang telah dilakukan pada tahap sebelumnya. Dapat dilakukan re-organise terhadap prosedur bisnis dengan memasukkan aktivitas data mining. Lebih jelasnya adalah, dengan melakukan tahap ini dimungkinkan untuk merubah database bisnis dengan beberapa kemungkinan dri data warehouse. Untuk membangun prototype data mining kita harus mampu melakukan operasi terhadap permasalahan tersebut.
  4. Migration Phase: Pada tahap ini kita membuduhkan semua perencanan organisasi yang mendukung lalu proses data mining dapat dilakukan secara integrasi. Ini berarti bahwa mengajari kepada user yang potensial pada sebuah system dan meningkatkan kepercayaan kepada mereka dan benefit akan didapat. Secara konstan melakukan evaluasi dan komunikasi pada hasil efisien yang didapat dari proses data mining.

Telah dipublikasikan pada INFOKOMPUTER January 2017  halaman 80-81

Rezzy Eko Caraka (Research and Development team Data Science Indonesia)

www.rezzyekocaraka.com

Latest articles

OUR TOP 5 CONTRIBUTOR

image description

Fajar Muharandy

-

-

image description

Fajar Jaman

-

-

image description

Bernardus Ari Kuncoro

-

-

image description

Rasyid Ridha

image description

Data Science Indonesia

data scientist

@datascience