Sebagai manusia tentunya kita dengan mudah mengenali wajah rekan ataupun teman kita. Cukup dengan melihat sekilas beberapa detik saja, kita sudah dapat mengingat informasi tentang dia, tentunya itu berlaku jika orang tersebut adalah orang yang kita kenal.

Namun, pernahkah kita memikirkan, bagaimana komputer mengenali kita, dengan hanya melihat wajah. Pertanyaan ini muncul ketika saya mulai memasuki bangku kuliah, pada saat itu saya masih tidak atau belum mengerti apa itu deep learning, apa itu machine learning dan masih banyak lainnya. Setelah saya mengikuti mata kuliah Pengolahan Citra, saya sedikit mengerti bagaimana selama ini komputer bekerja dalam mengenali sebuah benda. Ya! Wajah adalah benda menurut komputer. Komputer tidak seperti manusia yang memiliki rasa pertimbangan dan nalar yang panjang, komputer hanya berjalan sesuai dengan instruksi yang diberikan oleh manusia. Lalu, bagaimana komputer mengenali kita ? Training adalah jawabannya.

Apa yang dimaksud dengan training ?? seakan semua terlihat rumit jika kita berurusan dengan komputer. Bukan rumit ! namun butuh usaha extra karena dapat dikatakan ketika kita berurusan dengan proses pelatihan komputer, kita seakan sedang mengajari seorang balita. Kembali ke topik, intinya, untuk mengenali wajah kita butuh komputer belajar terlebih dahulu tentang “bagaimana wajah manusia itu”.

Di dalam Computer Vision, dibahas berbagai metode untuk pengolahan citra / gambar. Dari gambar tersebut kita bisa mendapatkan informasi-informasi unik yang menjadi ciri khas sebuah objek. Bagian yang paling menantang adalah bagaimana kita menentukan standar bahwa objek tersebut dapat dikatakan sebagai wajah. Jika kita menggunakan sudut pandang manusia, maka kita akan mengatakan bahwa wajah itu memiliki mata, mulut, hidung dan alis. Ya ! itulah yang akan kita katakan ke komputer melalui proses training, bahwa wajah manusia itu memiliki bentuk mata seperti itu, hidung seperti ini ataupun mulut seperti itu.

Proses dalam mentransfer informasi ciri-ciri wajah manusia ke komputer ini memang tidak mudah, namun telah ada beberapa penelitian sebelumnya yang cukup membantu kita untuk lebih mengembangkan fitur ataupun ciri-ciri yang dimiliki oleh  manusia. Salah satu metode yang paling umum digunakan adalah menggunakan pengolahan citra untuk merubah wajah manusia menjadi “garis-garis hitam putih”.

Figure 1. Face detection using HoG features, designed by Felzenszwalb et al. (2010)

 

HoG atau Histogram of Oriented Gradient Transfrom memiliki fungsi untuk mendeskripsikan fitur yang dimiliki oleh gambar (wajah) berdasarkan orientasi gradient. Sehingga, hasil dari gambar yang diproses dengan HoG akan memiliki keunikan tersendiri. Dari sini, fitur-fitur untuk mengenali wajah sebenarnya sudah terselesaikan. Pertanyaan selanjutnya adalah bagaimana komputer dapat mengingat atau minimal mengenali wajah tersebut ??

Proses Pengenalan

Setelah komputer dapat merubah sebuah foto wjah menjadi HoG, disini, proses menjadi lebih mudah, yaitu dengan cara mentranformasi gambar HoG tersebut menjadi “matrix”. Sebenarnya, gamar wajah RGB juga merupakan matrix, namun matrix tersebut lebih komplex dan tidak memiliki struktur atau ciri khas yang dapat dengan mudah dikenali oleh komputer. Maka dari itu, diperlukannya penyederhanaan untuk mendapatkan fitur ataupun ciri khas tadi.

Pertanyaan berikutnya muncul, setelah gambar dirubah menjadi matrix, lalu langkah apa yang digunakan oleh komputer untuk menemukan wajah yang tepat ?

Salah satu cara paling populer yang digunakan adalah dengan menggunakan “template matching”. Template Matching disini digambarkan dengan sebuah matrix yang berjalan sepanjang matriks besar (gambar) untuk mencari objek yang memiliki kemiripan dengannya.

Figure 2. Template Matchin (OpenCV documentation)

Dengan melakukan proses pencocokan mulai dari ujung kiri atas gambar hingga ujung kanan bawah gambar, maka komputer akan mencari mana kiranya objek yang paling mendekati dengan template yang sudah kita berikan tadi. Ketika komputer telah mampu mengenali bentuk wajah, selanjutnya komputer dapat kita bekali kemampuan lebih lanjut agar dapat mengetahui identitas pemiliki wajah tersebut dengan skema training yang pastinya lebih dalam dan kompleks lagi yang akan kita sama-sama pelajari pada kesempatan berikutnya ! 😀