Rabu, 11 April 2018

Komparasi 5 Metode Algoritma Klasifikasi Data Mining Pada Prediksi Keberhasilan Pemasaran Produk Layanan Perbankan



     Pemasaran adalah suatu proses tentang pengembangan produk, periklanan, distribusi dan penjualan (Zhang, 2008) .Proses pemasalan sangan erat kaitannya dengan peran telemarketing. Telemarketing merupakan sebuah cara baru dalam bidang pemasaran yang menggunakan teknologi telekomunikasi sebagai bagian dari pemasaran yang teratur dan terstuktur. Telemarketing (pemasaran jarak jauh) adalah penggunaan telepon dan pusat panggilan untuk menarik prospek, menjual kepada pelanggan yang telah ada dan menyediakan layanan dengan mengambil pesanan dan menjawab pertanyan melalui telepon. Telemarketing membantu perusahaan dalam meningkatkan pendapatan, mengurangi biaya penjualan, meningkatkan kepuasan pelanggan, Penawaran melalui jalur Telemarketing memberikan solusi bagi nasabah yang memiliki keterbatasan jarak serta waktu untuk tetap dapat melakukan transaksi atas program perlindungan yang dibutuhkan baik perlindungan bagi nasabah sendiri ataupun anggota keluarga. Dukungan data mining pada pemasaran adalah pada marketing research dan Business Intelligence. Dalam mengoptimasisasi proses pemasaran diperlukan suatu strategi sehingga dapat digunakan untuk meningkatkan keunggulan kompetetif, Data mining dalam strategi pemasaran menggunakan salah satunya menggunakan database marketing untuk melakukan proses pencarian pengetahuan baru guna mendukung pengambilan keputusan, Oleh karena itu, penelitian inifokus pada pemanfaatan data mining untuk memprediksi tingkat keberhasilan telemarketing bank dalam mencari calon nasabah bank dari berbagai produk layanan perbankan, sehingga dapat diketahui apakah calon nasabah yang bersangkutan merupakan nasabah yang berpotensi menjadi nasabah kredit yang produktif atau tidak di liat dari penelitian sebelumnya algoritma yang di pakai adalah Decision Tree di gunakan untuk memecahkan masalah tersebut , oleh karna itu penulis ingin menguji algoritma klasifikasi lain apakah tingkat akurasinya lebih baik atau di bawah nilai dari decesion tree.Untuk menangani permasalahan tersebut, maka akan dibandingkan beberapa algoritma yaitu pohon keputusan C4.5, naive bayes, neural network, Logistic Regreesion dan K-NN untuk mengetahui algoritma mana yang lebih akurat dalam memprediksi tingkat keberhasilan telemarketing dalam layanan produk perbankan.

1. Neural Network
       Neural Network (Jaringan Saraf Tiruan) adalah prosesor tersebar paralale yang sangat besar dan memiliki kecenderungan untuk menyimpan pengetahuan yang bersifat pengalaman dan membuatnya siap untuk digunakan (puspitaningrum, 2006). NN ini merupakan sistem adaptif yang dapat merubah strukturnya untuk memecahkan masalah berdasarkan informasi eksternal maupun internal yang mengalir melalui jaringan tersebut. Secara sederhana NN adalah sebuah alat pemodelan data statistik non-linear. NN dapat digunakan untuk memodelkan hubungan yang kompleks antara input dan output untuk menemukan pola-pola pada data. Neuron juga terdiri dari satu output. Outputnya adalah terbentuk dari pengolahan dari beberbagai input oleh neuron-neuron (shukla, 2010).

2. Decision Tree
  Decision tree sendiri merupakan metode klasifikasi dan prediksi yang sangat kuat dan banyak di minati (Wu, 2009) . Dalam decision tree ini data yang berupa fakta dirubah menjadi sebuah pohon keputusan yang berisi aturan dan tentunya dapat lebih mudah dipahami dengan bahasa alami. Model pohon keputusan banyak digunakan pada kasus data dengan output yang bernilai diskrit . Walaupun tidak menutup kemungkinan dapat juga digunakan untuk kasus data dengan atribut numeric.

3. Naive Bayes
 Naïve Bayes merupakan sebuah model klasifikasi statistik yang dapat digunakan untuk memprediksi probabilitas keanggotaan suatu kelas. Naïve Bayes didasarkan pada teorema bayes yang memiliki kemampuan klasifikasi serupa dengan decision tree dan neural network. Teknik Naïve Bayes (NB) adalah salah satu bentuk sederhana dari Bayesian yang jaringan untuk klasifikasi. Sebuah jaringan Bayes dapat dilihat sebagai diarahkan sebagai tabel dengan distribusi probabilitas gabungan lebih dari satu set diskrit dan variabel stokastik (Liao, 2007).Metode ini penting karena beberapa alasan, termasukberikut. Hal ini sangat mudah untuk membangun, tidak perlu ada yang rumit Parameter estimasi skema berulang. Ini berarti dapat segera diterapkan untuk besar Data set. Sangat mudah untuk menafsirkan, sehinggapengguna tidak terampil dalam teknologi classifier dapat memahami mengapa itu adalah membuat klasifikasi itu membuat. Dan, sangat penting, hal itu sering sangat baik: Ini mungkin bukan classifier terbaik dalam setiap diberikan aplikasi, tetapi biasanya dapat diandalkan untuk menjadi kuat dan melakukan dengan sangat baik (Wu, 2009).

4. Logistic Regreesion.
  Regresi logistik (Logistic regression) adalah bagian dari analisis regresi yang digunakan ketika variabel dependen (respon) merupakan variabel dikotomi. Variabel dikotomi biasanya hanya terdiri atas dua nilai (Santosa, 2007) yang mewakili kemunculan atau tidak adanya suatu kejadian yang biasanya diberi angka 0 atau 1. Tidak seperti regresi linier biasa, regresi logistik tidak mengasumsikan hubungan antara variabel independen dan dependen secara linier. Ada beberapa penelitian yang menggunakan komparasi algoritma klasifikasi untuk mengukur akurasi terhadap dataset marketing bankRBFNN), SVM, CBR, dan pohon keputusan (DTs). Dari semua model ternyata tingkat klasifikasi akurasi yang mengungguli adalah Decision trees, DTs tidak hanya mengklasifikasikan lebih baik dari model yang lain tapi juga memiliki pengetahuan dalam membentuk aturan yang mudah ditafsirkan, masukakal dalam menjelaskan tentang alasan penolakan pinjaman.
 Comparing decision trees with logistic regression for credit risk analysis (Satchidananda & Simha, 2006. Penelitian ini membandingkan dua model algoritma untuk analisa resiko kredit, yaitu Pohon Keputusan dan Regresi Logistik. Data diambil dari dua bank yang berbeda, kemudian untuk mengelompokkan kasus positif dan negatif maka dilakukan klustering data dengan menggunakan k-means. Hasil analisa dari masing-masing model dikomparasi dan kemudian diukur,kemudian didapatkan bahwa algoritma pohon keputusan mempunyai tingkat akurasi yang tinggi dibandingkan algoritma regresi logistik

5. K-Nearest Neighbor
     Algoritma k-nearest neighbor (k-NN atau KNN) adalah sebuah metode untuk melakukan klasifikasi terhadap objek berdasarkan data pembelajaran yang jaraknya paling dekat dengan objek tersebut, Ketepatan algoritma k-NN ini sangat dipengaruhi oleh ada atau tidaknya fitur-fitur yang tidak relevan, atau jika bobot fitur tersebut tidak setara dengan relevansinya terhadap klasifikasi. Riset terhadap algoritma ini sebagian besar membahas bagaimana memilih dan memberi bobot terhadap fitur, agar performa klasifikasi menjadi lebih baik,menurut (Wu, 2009) KNN juga merupakan contoh teknik lazy learning, yaitu teknik yang menunggu sampai pertanyaan (query) datang agar sama dengan data training.

Sumber :
http://ejournal.nusamandiri.ac.id/ejurnal/index.php/techno/article/view/266

Tidak ada komentar:

Posting Komentar