Memberi ‘Mata Super’ pada AI: Mengenal Teknologi Wavelet Transform
Setiap kali kita melihat sebuah gambar digital, mata kita dengan mudah menangkap objek, bentuk, dan detail. Namun bagi komputer, gambar hanyalah lautan angka piksel yang tidak memiliki makna. Tantangannya adalah: bagaimana cara mengajari AI untuk melihat seperti kita? Yaitu, fokus pada detail yang penting dan mengabaikan informasi yang tidak relevan. Di sinilah sebuah teknik matematika elegan bernama Discrete Wavelet Transform (DWT) mengambil peran.

Bayangkan DWT sebagai sebuah saringan atau lensa khusus. Ketika “melihat” sebuah gambar, ia tidak hanya memprosesnya sebagai satu kesatuan. Sebaliknya, ia secara cerdas memecahnya menjadi dua bagian utama. Bagian pertama adalah versi ringkas dari gambar tersebut, yang menangkap informasi umum seperti bentuk dasar dan warna (disebut aproksimasi). Bagian kedua adalah kumpulan dari semua detail tajam yang esensial, seperti garis, tekstur, dan tepi (disebut detail).
Pemisahan inilah kuncinya. Untuk banyak tugas AI, informasi paling berharga justru tersembunyi di dalam komponen “detail” tersebut. Misalnya, jika kita ingin AI memperkirakan usia seseorang dari foto, fitur seperti kerutan di sekitar mata atau tekstur kulit jauh lebih penting daripada warna pipi yang merata. DWT memungkinkan kita untuk langsung mengambil sari pati informasi ini, menyajikannya kepada AI dalam format yang jauh lebih ringan dan penuh makna daripada jutaan piksel mentah.
Contoh sempurna dari penerapan ini dapat dilihat dalam sebuah penelitian tentang perkiraan usia dari wajah manusia. Para peneliti menggunakan DWT justru untuk tugas “menyaring” ini. Gambar wajah diolah dengan DWT untuk mengekstrak pola-pola tekstur yang relevan dengan usia. Hasil saringan yang kaya fitur inilah yang kemudian dianalisis oleh model machine learning. Hasilnya, AI mampu memberikan perkiraan usia yang akurat dengan cara yang jauh lebih efisien.

Pada akhirnya, kekuatan DWT terletak pada keserbagunaannya. Teknik yang sama yang membantu AI “membaca” wajah juga merupakan tulang punggung dari kompresi gambar modern seperti JPEG 2000 dan digunakan di berbagai bidang lain, mulai dari medis hingga keuangan. DWT adalah penerjemah fundamental, yang mengubah lautan data yang rumit menjadi wawasan yang dapat dipahami oleh mesin.
Referensi :
Winata, A., Tchin, J. A. R. W., Prasetyo, S. Y., & Purwanto, E. S. (2024). Discrete Wavelet Transform for Age Estimation in Human Face Images. In 2024 Beyond Technology Summit on Informatics International Conference (BTS-I2C). IEEE. https://ieeexplore.ieee.org/abstract/document/10942154
Comments :