Perbedaan Supervised and Unsupervised Learning

image description

Dalam dunia data mining atau data science sering kali kita mendengar supervised dan unsupervised learning. Secara garis besar terdapat 2 pendekatan untuk melakukan teknik - teknik data mining. Mari kita bahas satu persatu. Supervised learning adalah sebuah pendekatan dimana sudah terdapat data yang dilatih, dan terdapat variable yang ditargetkan sehingga tujuan dari pendekatan ini adalah mengkelompokan suatu data ke data yang sudah ada, lain halnya dengan unsupervised learning, unsupervised learning tidak memiliki data latih, sehingga dari data yang ada, kita mengelompokan data tersebut menjadi 2 bagian atau 3 bagian dan seterusnya.

Contoh Supervised Learning adalah ketika Anda memiliki sejumlah buku yang sudah dilabeli dengan kategori tertentu. Misalnya, kategori buku novel seperti Digital Fortress, Inferno, Deception Point. Kategori buku akademik, seperti Pengantar Teknologi Informasi, R in Action, Rekayasa Perangkat Lunak. Kategori biografi antara lain Anne Frank, Abraham Lincoln dan Mandela. Selanjutnya, ketika Anda membeli sejumlah buku baru, maka Anda harus mengindentifikasi isi dari buku tersebut, dan memasukannya dalam kategori. Ketika Anda membeli buku Logika fuzzy, Anda pasti akan memasukan buku tersebut ke dalam buku akademik.

Lain halnya dengan Unsupervised Learning. Anda tidak memiliki data yang dilatih sebelumnya. Anggaplah Anda belum pernah membeli buku sama sekali, namun dalam satu hari, Anda membeli banyak tumpukan buku dan ingin membaginya kedalam beberapa kategori agar nantinya mudah dicari. Anda akan mengidentifikasi buku buku mana yang mirip. Dalam hal ini, kita memilih pendekatan buku berdasarkan isinya. Misalnya anda memiliki buku Digital Fortress, Inferno, Deception Point, Pengantar Teknologi Informasi, R in Action, Rekayasa Perangkat Lunak, Anne Frank, Abraham Lincoln dan Mandela. Anda akan mengklasifikasikan buku Pengantar Teknologi Informasi, R in Action, Rekayasa Perangkat Lunak Anda ke dalam buku akademik karena keperluannya untuk kuliah.

Untuk melakukan hal itu Anda perlu algoritma yang mendukung untuk pengimplementasian dari metode tersebut.

Algoritma Supervised Learning

  • Decision tree
  • Nearest - Neighbor Classifier
  • Naive Bayes Classifier
  • Artificial Neural Network
  • Support Vector Machine
  • Fuzzy K-Nearest Neighbor

Algoritma Unsupervised Learning

  • K-Means
  • Hierarchical Clustering
  • DBSCAN
  • Fuzzy C-Means
  • Self-Organizing Map

Kesimpulannya dari penjelasan di atas adalah jika anda memiliki data data sebelumnya dan memiliki variabel target yang akan diklasifikasikan, maka Anda dapat memakai metode supervised learning. Jika Anda ingin membagi data - data tersebut ke dalam beberapa kelompok maka Anda memakai metode unsupervised learning



Latest articles

OUR TOP 5 CONTRIBUTOR

image description

Fajar Muharandy

-

-

image description

Fajar Jaman

-

-

image description

Bernardus Ari Kuncoro

-

-

image description

Rasyid Ridha

image description

Data Science Indonesia

data scientist

@datascience