Pengantar Data Analytics dan Implementasi sederhana menggunakan Python (1)
Data merupakan kumpulan fakta baik dalam bentuk angka, kata, pengukuran, observasi, dan lainnya yang telah diterjemahkan ke dalam bentuk yang dapat diproses oleh komputer. Ukuran data yang semakin besar menyebabkan peningkatan kebutuhan untuk melakukan pemeriksaan, pembersihan, transformasi, serta pemodelan data agar mendapatkan wawasan dari data tersebut dan memperoleh kesimpulan untuk proses pengambilan keputusan. Proses ini dikenal sebagai data analytics.
Data analytics merupakan bentuk analisis data yang digunakan dalam banyak hal seperti dalam sektor kesehatan, bisnis, telekomunikasi, dan lainnya untuk membuat keputusan dan tindakan yang diperlukan dari data tersebut. Dalam menganalisis suatu data diperlukan proses yang interaktif untuk menangani masalah, menemukan data apa yang diperlukan untuk mendapatkan jawaban, dan mendapatkan hasil agar dapat memberikan rekomendasi tindakan yang harus dilakukan. Terdapat banyak tools yang dapat digunakan untuk analisis data, misalnya bahasa R, Python, SAS, Tableau Public, Apache Spark, Excel, dan masih banyak lagi.
Ada dua jenis data, yaitu kualitatif dan kuantitatif. Kedua jenis data tersebut memiliki kekuatan dan keterbatasan masing-masing. Data kuantitatif dapat dihitung, diukur, dan dinyatakan dengan angka. Data kuantitatif dibuat dari informasi numerik, yang analisisnya melibatkan teknik statistik. Contoh data kuantitatif adalah survei kepuasan pelanggan yang meminta pelanggan untuk menilai pengalaman mereka pada skala 1 sampai 5. Dalam hal ini, data akan berbentuk numerik, dan teknik statistik diperlukan untuk menarik kesimpulan tentang kepuasan pelanggan tersebut. Data kuantitatif dapat dihasilkan melalui:
- Hasil uji (test)
- Eksperimen
- Survei
- Laporan pasar (market reports)
- Metriks
Data kualitatif bersifat deskriptif dan konseptual. Data kualitatif dapat dikategorikan berdasarkan sifat dan ciri-cirinya. Salah satu contoh data kualitatif adalah data kelompok dosen yang berpartisipasi dalam program community service yang dilakukan untuk memahami persepsi peserta. Dalam hal ini, data yang dikumpulkan kemungkinan dalam bentuk naratif, sehingga diperlukan teknik kualitatif untuk menganalisis transkrip untuk konten dan tema yang relevan dalam program tersebut. Data kualitatif dapat dihasilkan melalui:
- Teks dan dokumen
- Rekaman audio dan video
- Gambar dan simbol
- Transkrip wawancara
- Hasil observasi
Dalam implementasinya, analisis data dapat penerapkan teknik atau proses untuk memperoleh suatu wawasan, serta melibatkan kumpulan data untuk mencari korelasi yang bermakna antara data satu dengan yang lain. Fokus dari Analisis Data terletak pada inferensi, yaitu proses pengambilan kesimpulan yang semata-mata didasarkan pada apa yang telah diketahui sebelumnya. Tujuan dari analisis data adalah untuk memberikan wawasan dan pengetahuan dari data yang dikumpulkan.
Analisis data adalah ilmu yang mampu mengintegrasikan berbagai macam data dari berbagai sumber, menarik kesimpulan, dan membuat prediksi untuk membuat inovasi, membuat strategi bisnis yang kompetitif, dan membantu pengambilan keputusan yang strategis (Venkat N. Gudivada, 2017) . Domain analitik data telah berkembang dengan berbagai nama termasuk Online Analytical Processing (OLAP), data mining, visual analytics, big data analytics, dan cognitive analytics. istilah analitik juga digunakan untuk merujuk pada pengambilan keputusan berdasarkan data. Faktanya, analitik adalah istilah yang menyebar dan digunakan di banyak domain masalah yang berbeda dengan nama yang berbeda, misalnya analitik lalu lintas jalan raya, analitik teks, analitik spasial, analitik risiko, dan analitik grafik, dan lainnya.
Pada artikel selanjutnya, kita akan mempelajari cara menganalisis data menggunakan bahasa pemrograman Python. Kita akan belajar bagaimana mempersiapkan data untuk analisis, melakukan analisis statistik sederhana, serta membuat visualisasi data sederhana. Dalam Analisis Data menggunakan Python, kita juga akan belajar menggunakan library Pandas, Numpy, dan Scipy untuk menganalisis kumpulan data sampel.
Comments :