Business understanding

  • Tahap awal berfokus pada pemahaman tujuan dan persyaratan proyek dari perspektif bisnis, kemudian mengubah pengetahuan ini menjadi definisi masalah data mining dan rencana awal yang dirancang untuk mencapai tujuan.

Data understanding

  • Tahap pemahaman data dimulai dengan pengumpulan data awal dan dilanjutkan dengan aktivitas yang memungkinkan untuk mengenal data, mengidentifikasi masalah kualitas data, menemukan informasi tentang data, dan / atau mendeteksi subset yang menarik untuk membentuk hipotesis mengenai informasi tersembunyi.

Data Preparation / Data Preprocessing

  • Tahap persiapan data mencakup semua kegiatan yang diperlukan untuk membangun data akhir (data yang akan dimasukkan ke dalam alat pemodelan) dari data mentah awal. Tugas persiapan data kemungkinan dilakukan beberapa kali dan tidak dalam urutan yang ditentukan. Tugas meliputi pemilihan tabel, catatan, dan atribut, serta transformasi dan pembersihan data untuk alat pemodelan.

Modelling

Pada tahap ini, berbagai teknik pemodelan dipilih dan diterapkan, dan parameternya dikalibrasi dengan nilai optimal. Biasanya, ada beberapa teknik untuk jenis masalah data mining yang sama. Beberapa teknik memiliki persyaratan khusus berupa data. Karena itu, tahap persiapan data sangat diperlukan.

Evaluation

Sebelum dilanjutkan ke penerapan model akhir, penting untuk mengevaluasi secara menyeluruh dan meninjau langkah-langkah yang dijalankan untuk membuatnya, untuk memastikan model tersebut benar mencapai tujuan bisnis. Tujuan utamanya adalah untuk menentukan apakah ada beberapa masalah bisnis penting yang belum cukup dipertimbangkan. Pada akhir tahap ini, keputusan penggunaan hasil data mining harus dicapai.

Deployment

Pembuatan model umumnya bukan akhir dari proyek. Sekalipun tujuan dari model ini adalah untuk meningkatkan pengetahuan tentang data, pengetahuan yang didapat perlu diorganisir dan disajikan sedemikian rupa sehingga pelanggan dapat menggunakannya. Bergantung pada persyaratan, fase deployment dapat sesederhana menghasilkan laporan atau serumit penerapan proses pengumpulan data berulang diseluruh perusahaan. Jika analis akan melakukan upaya deployment, penting bagi pelanggan untuk memahami terlebih dahulu tindakan apa yang perlu dilakukan agar benar-benar memanfaatkan model yang dibuat.