Source: https://images.app.goo.gl/MQEGmtrWT7UhYSZ97

Pernah nggak, kamu lagi nyari tutorial masak atau review film di YouTube, tapi malah harus nonton video sepanjang 10 menit buat dapetin info yang sebenarnya cuma 2 menit? Nah, teknologi baru yang dibahas dalam riset oleh Vora dkk. (2025) ini bisa jadi jawabannya. 

Dalam paper berjudul AI-driven video summarization, peneliti dari India mengenalkan sistem canggih yang bisa meringkas video panjang secara otomatis, berdasarkan apa yang dicari user. Jadi semacam fitur “baca cepat” tapi untuk video. Keren, kan? 

 

Masalah Video Online: Terlalu Banyak, Terlalu Lama 

Internet sekarang dibanjiri video. Dari TikTok sampai YouTube, tiap detik ada ribuan jam konten baru yang diunggah. Tapi saking banyaknya, malah bikin kita susah nemu yang relevan. Solusi lama seperti manual cut atau algoritma sederhana udah nggak cukup. Menurut Vora et al., sistem manual itu lambat dan nggak scalable buat data sebanyak ini. 

Nah, di sinilah AI masuk. 

AI dan Deep Learning: Otak di Balik Video Singkat 

Riset ini menggabungkan Convolutional Neural Networks (CNN) untuk menganalisis tiap frame video, LSTM (Long Short-Term Memory) buat menangkap urutan kejadian dalam video, dan ResNet50 yang terkenal akurat buat mengenali gambar. Semuanya digabungin sama teknik TVFlow yang menangkap gerakan antar frame biar videonya nggak terasa “lompat-lompat”. 

Hasilnya? Sistem ini bisa bikin rangkuman video dengan skor precision 79.2%, recall 86.5%, dan F1-score 83%. Itu angka tinggi banget untuk teknologi summarization loh! 

Bukan Cuma Teknologi, Tapi Juga Efisiensi 

Apa hubungannya sama kamu yang kuliah Business IT? 

Coba bayangin kamu kerja di perusahaan media atau e-learning. Tiap hari harus sortir video panjang buat buat highlight, teaser, atau konten promosi. Kalau semua dilakukan manual, habis waktu dan biaya. Sistem AI kayak gini bisa bantu percepat kerjaan, bahkan otomatisasi konten. Bisa juga diterapkan buat analisis video rapat, review CCTV, atau edit video YouTube secara otomatis. 

Bonusnya, sistem ini juga mendukung praktik digital yang lebih ramah lingkungan. Gimana caranya? Karena video yang disimpan jadi lebih pendek dan relevan, otomatis server jadi nggak boros penyimpanan. Data duplikat juga bisa dikurangi. Jadi, teknologi ini nggak cuma efisien tapi juga sustainable. 

Gimana Cara Kerjanya? 

Prosesnya kira-kira kayak gini: 

  1. User upload query (misalnya gambar tokoh di film). 
  2. Sistem ambil frame-frame dari video. 
  3. AI hitung skor relevansi tiap frame terhadap query tadi pakai cosine similarity. 
  4. Frame yang paling relevan dikumpulkan dan dijahit jadi video ringkasan. 

Bahkan, sistem ini bisa bantu deteksi obyek secara akurat di video, misalnya “orang yang pakai jaket merah” atau “adegan yang menampilkan makanan.” Berguna banget buat marketer dan content creator. 

Tantangan & Masa Depan 

Walaupun sistem ini keren, penulis juga menyadari tantangannya. Misalnya, sistemnya masih cukup berat dijalankan karena butuh banyak komputasi. Makanya, ke depan mereka mau coba integrasi dengan model yang lebih ringan seperti MobileNet biar bisa jalan di device kecil. 

Untuk mahasiswa BIT, ini jadi pembelajaran penting. Bahwa gabungan antara machine learning, data mining, dan pengolahan multimedia bisa menghasilkan inovasi yang powerful banget, bahkan bisa jadi solusi untuk masalah di dunia nyata. 

 

 

Referensi 

Vora, D., Kadam, P., Mohite, D.D., Kumar, N., Kumar, N., Radhakrishnan, P., & Bhagwat, S. (2025). AI-driven video summarization for optimizing content retrieval and management through deep learning techniques. Scientific Reports, 15, 4058. https://doi.org/10.1038/s41598-025-87824-9