Konsep dan Aplikasi Data Mining – Seri Data Mining for Business Intelligence (1)

By : Albert Verasius Dian Sano, S.T., M.Kom.

Secara umum, pengertian data mining untuk business intelligence adalah cara-cara untuk mengembangkan business intelligence dari data yang dikumpulkan, diorganisir, dan disimpan oleh suatu organisasi. Teknik-teknik dalam data mining sangatlah luas sekali dan digunakan oleh berbagai organisasi untuk mendapatkan pemahaman yang lebih baik mengenai pelanggan dan cara kerja mereka dan untuk menyelesaikan berbagai masalah organisasi yang sangat kompleks. Dalam seri ini kita akan mempelajari data mining sebagai teknologi pendorong bagi business intelligence, mempelajari proses-proses standard dalam melaksanakan proyek-proyek data mining, memahami dan membangun keahlian dalam menggunakan teknik-teknik data mining yang populer, mengembangkan pengetahuan mengenai berbagai tool software yang ada, dan membedah berbagai macam mitos dan jebakan dalam data mining.

 

Konsep dan aplikasi data mining

Dalam suatu interview dengan majalah ‘Computerworld’ pada Januari 1999, Dr. Arno Penzias (pemenang nobel dan mantan kepala peneliti di Bell Labs) mengatakan bahwa sebentar lagi data mining dari berbagai database perusahaan akan menjadi aplikasi yang menjadi andalan. Dalam menjawab pertanyaan klasik dari ‘Computerworld’ mengenai “Apakah yang akan menjadi aplikasi killer bagi korporasi?” Dr. Penzias menjawab: “Data mining”.  Kemudian dia menambahkan, “Data mining akan menjadi sesuatu yang sangat penting sehingga perusahaan-perusahaan tidak akan membuang (data) apapun mengenai para pelanggan mereka karena hal itu merupakan sesuatu yang sangat berharga. Bila anda tidak melakukan hal ini (data mining), anda akan terdepak keluar dari bisnis”. Demikian pulan, dalam suatu artikel di ‘Harvard Business review’ Thomas Davenport (2006) berpendapat bahwa  senjata strategis terbaru bagi perusahaan-perusahaan adalah  pembuatan keputusan berdasarkan analitik, dengan memberikan contoh-contohnya seperti Amazon.com, Capital One, Marriot International, dan lain-lain yang telah menggunakan analitik untuk memahami mengenai para pelanggan mereka dengan lebih baik dan mengoptimasi supply chain mereka yang untuk memaksimalkan RoI (return on investment) mereka sembari memberikan customer service yang terbaik. Tingkat kesuksesan seperti ini akan bergantung pada perusahaan yang memahami pelanggannya, vendornya, proses bisnisnya, dan supply chain-nya dengan baik.

Komponen utama dari pemahaman ini bermula dengan cara menganalisa jumlah data yang sangat banyak yang dikumpulkan perusahaan. Biaya yang digunakan untuk menyimpan dan memproses data dalam beberapa waktu terakhir  telah menurun secara dramatis, dan dampaknya, jumlah data yang disimpan dalam bentuk elektronik menjadi tumbuh dalam jumlah yang eksplosif.  Dengan pembuatan database-database yang besar, kemungkinan menganalisa data yang disimpan menjadi muncul/ada. Istilah data mining awalnya digunakan untuk menjelaskan proses dimana berbagai pola di dalam data yang tak diketahui sebelumnya  menjadi terungkap. Definisi tersebut kemudian diperluas oleh beberapa vendor software untuk memasukkan sebagian besar bentuk analisa data untuk meningkatkan penjualan dengan popularitas label data mining. Pada seri ini, kita akan menggunakan definisi asli mengenai data mining.

Meskipun istilah data mining relatif baru, tetapi ide dibelakangnya sama sekali bukan sesuatu yang baru. Banyak sekali teknik dalam data minig yang berasal dari analisa statistik tradisional dan kecerdasan buatan yang dilakukan di awal 1980an. Mengapa kemudian secara tiba-tiba mendapat perhatian dari dunia bisnis? Berikut adalah beberapa alasan yang paling banyak disebut:

Kompetisi yang semakin intens di skala global yang didorong oleh kebutuhan dan keinginan pelanggan yang selalu berubah di pasar yang makin lama makin jenuh.Sudah menjadi pengetahuan umum bahwa ada nilai tersembunyi yang belum dimanfaatkan di dalam sumber-sumber data yang besar. Konsolidasi dan integrasi baris-baris dalam database, yang memungkinkan suatu tampilan tunggal mengenai pelanggan, vendor, transaksi, dll.

Konsolidasi database dan penyimpanan data yang lain ke dalam satu lokasi tunggal dalam bentuk data warehouse.Kemajuan yang pesat dan eksponensial dalam pemrosesan data dan teknologi database. Penurunan harga yang signifikan dalam hardware dan software untuk penyimpanan dan pemrosesan data.

Gerakan menuju ‘de-massification’ (konversi berbagai informasi kedalam bentuk yang non-fisik) dalam praktik-praktik bisnis. Data yang dihasilkan oleh Internet meningkat dengan cepat baik dari sisi volume dan kompleksitas. Jumlah data yang sangat besar terus menerus dihasilkan dan diakumulasikan diseluruh dunia. Berbagai disiplin ilmu seperti astronomi dan fisika nuklir selalu menghasilkan kuantitas data yang besar secara regular. Pera peneliti di bidang farmasi dan kedokteran secara konstan menghasilkan dan menyimpan data yang bisa digunakan dalam aplikasi data mining untuk mengetahui cara-cara yang lebih baik untuk mendiagnosa secara akurat dan mengobati penyakit dan untuk menemukan obat-obat baru yang lebih baik.

Pada bidang komersial, barangkali penggunaan data mining yang paling umum ada dalam bidang finance, retail, dan healthcare. Data mining digunakan untuk mendeteksi dan mengurangi berbagai aktivitas penipuan, terutama dalam klaim asuransi dan penggunaan kartu kredit; untuk mengetahui pola-pola pembelian oleh pelanggan; untuk mengakuisisi kembali para pelanggan yang menguntungkan; untuk mengetahui berbagai aturan perdangan berdasarkan data historis; dan untuk membantu untuk meningkatkan profitabilitas dengan menggunakan market-basket analysis. Data mining sudah digunakan secara luas untuk menarget klien-klien secara lebih baik, dan dengan perkembangan e-commerce yang luas, hal ini akan menjadi suatu yang lebih wajib seiring berjalannya waktu.