Dian Restiani- Pertemuan 9 – Temu Balik Informasi (Multimedia)

Sistem Temu Kembali Informasi Multimedia

1. Pengertian dari Sistem Temu Kembali Informasi Multimedia

  • Menurut Maghrebi: sistem informasi yang dapat memperhitungkan jenis informasi, karakteristik dan komponen (gambar, suara, teks) dalam rangka memungkinkan pengguna untuk memiliki akses ke informasi tersebut. (Maghrebi, 2008, p2)
  • Menurut Peter: metodologi yang telah dikembangkan untuk mencari informasi yang relevan didalam database multimedia, dalam hal ini disebut dokumen. (Peter, 1997, p4)
  • Menurut Joan: sistem untuk manajemen (penyimpanan, pengambilan, dan manipulasi) data beberapa media seperti kombinasi data tabulasi/administrasi, dokumen teks, gambar, spasial, sejarah, audio, dan data video.

2. Prinsip Sistem Temu Kembali Informasi Multimedia

Peter S. Dalam Multimedia Information Retrieval menyatakan bahwa biasanya pengguna tidak pernah melihat dokumen yang diinginkan sebelumnya, dan jumlah dokumen yang relevan tidak diketahui (Peter, 1997, p4).

Semua metode pencarian yang telah diterbitkan didasarkan pada salah satu dari dua prinsip berikut:

1. Prinsip Temu Kembali Berorientasi Penyimpanan (Storage Oriented Retrieval Principle):

Fokus utama dari prinsip ini adalah organisasi dari “tempat yang sesuai” dimana dokumen yang akhirnya disimpan, atau dimana referensi dokumen yang disimpan (misalnya kartu indeks). Pendekatan yang mengikuti hasil prinsip dalam struktur informasi berupa klasifikasi, dan thesaurus (Lancaster, 1986).

2. Prinsip Probabilitas Peringkat (Probability Ranking Principle):

Jika respon sistem pengambil referensi untuk setiap permintaan adalah peringkat dokumen dalam koleksi dalam probabilitas kegunaan bagi pengguna yang mengajukan permintaan, dimana probabilitas diperkirakan seakurat mungkin atas dasar data apapun yang telah dibuat tersedia untuk sistem untuk tujuan ini, maka keseluruhan efektifitas sistem untuk penggunanya akan menjadi yang terbaik yang dapat diperoleh berdasarkan data (Robertson, 1977).

Dalam konteks perpustakaan digital, prinsip pertama belum dibenarkan sejauh ini. Prinsip probabilitas peringkat lebih jelas lebih unggul daripada pendekatan penyimpanan tradisional yang berorientasi dalam dua hal. Pertama, prinsip probabilitas peringkat bisa dibuktikan secara sistematis. Kedua, percobaan dibuat juga menunjukkan keunggulan prinsip probabilitas peringkat. Perlu dicatat, bahwa kedua prinsip tersebut tidak sepenuhnya berhubungan. Terdapat hubungan antara berbagai jenis metode pengambilan (Penyu dan Croft, 1992) dan (Wong dan Yao, 1995).

3. Komponen penting dalam Sistem Temu Kembali Informasi (STKI) Multimedia

Peter (Peter, 1997, p5) menuliskan ada 4 komponen yang penting, yaitu:

1). Dokumen Multimedia: sistem yang mampu menyimpan dokumen multimedia

  • Dokumen yang disimpan terdiri dari data multimedia (teks, gambar audio, video, dll)
  • Dokumen yang disimpan adalah semi struktur, yaitu berisi data terstruktur serta data tidak terstruktur.
  • Dengan data terstruktur, atrribut database khusus seperti tanggal lahir, no.karyawan, dan nama belakang. Dengan data tidak terstruktur, seperti Binary Large Objects (BLOBs), misalnya teks, gambar, audio, dan video rekaman.

2). Model Temu Kembali: sistem mengadopsi model pengambilan yang mengoptimalkan efektivitas pengambilan sesuai dengan prinsip probabilitas peringkat.

  • Sistem merespon untuk permintaan dengan menyajikan daftar dokumen yang diurukan dalam peringkat yang baik mewakili probabilitas sendiri maupun dapat dipetakan ke probabilitas dengan cara order preserving transformation.
  • Skor ini sering disebut Retrievak Status Value (RSV) bergantung pada deskripsi dokumen yang terdiri dari informasi statistik yang tepat tentag fitur pengindeksan (misal: fitur frekuensi / frekuensi dokumen).
  • Skor tersebut mungkin juga tergantung pada domain parameter yang diperkirakan dengan cara tambahan, misalnya dengan pengumpulan pelatihan atau oleh thesaurus.

3). Analisis Dokumen: dokumen diproses untuk mengumpulkan informasi statistik.

  • Pengolahan dokumen adalah jenis pemrosesan sinyak ketika informasi yang tidak relevan maka akan dihapus. Ketika menganalisis dokumen teks, kata-kata umum (misalnya: sebuah, untuk) dan akhiran (misalnya: -ed, -eng) dapat dihapus karena sedikit makna.
  • Informasi statistik dikumpulka untuk menghitung RSV yang sesuai. Secara khusus, data kuantitatif dihitung yang berkolerasi dengan relevansi dokumen kueri.

4). Teknik pencarian yang interaktif: sistem mendukung interaksi dengan pengguna untuk meningkatkan kemungkinan keberhasilan pencarian.

  • Setelah presentasi dari daftar peringkat dokumen, pengguna dapat memberikan informasi umpan kembali kepada sistem. Umpan balik informasi dapat terdiri dari referensi ke dokumen yang relevan, atau batas-batas bagian yang relevan, atau dari pencarian tambahan.
  • Sistem pencarian menggabungkan umpan kembali informasi dengan informasi statistik yang diperoleh dari analisis dokumen. Hasil dari kombinasi tersebut mungkin menjadi kueri baru untuk menghasilka urutan dokumen yang lebih baik.

4. Jenis-jenis Sistem Temu Kembali:

1). Berdasarkan Jenis Medianya:

  1. Temu Kembali Audio Berbasis Konten (Content Based Audio Retrieval)
  2. Temu Kembali Vidio Berbasis Konten (Content Based Video Retrieval)
  3. Temu Kembali Citra Berbasis Konten (Content Based Image Retrieval)
  • Suatu teknik pencarian kembali gambar yang mempunyai kemiripan karakteristik atau content dari sekumpulan gambar.
  • Proses umum dari CBIR adalah gambar yang menjadi query dan penyimpanan dalam database dilakukan proses ekstraksi fitur.
  • Fitur gambar yang dapat digunakan untuk retrieval pada sistem ini misalnya histogram, susunan warna, teksture, dan shape, tipe spesifik dari obyek, tipe event tertentu, lokasi, emosi.

4. Temu Kembali Teks Berbasis Konten (Content Based Text Retrieval)

5. Arsitektur Content Based Image Retrieval (CBIR)

Bagian arsitektur CBIR:

a). Interface: bagian untuk interaksi antar pengguna dengan sistem CBIR melalui aplikasi GUI (Graphical User Interface). Terdiri dari:

  • Data insertion: untuk memasukkan citra yang akan di ekstraksi.
  • Query Specification: untuk menentukan citra yang akan dijadikan citra query serta menentukan metode ekstraksi fitur.
  • Visualization: untuk menampilkan citra query dan citra hasil pencarian.

b). Query-processing module, terdiri dari:

  • Feature vector extraction: untuk mengekstraksi baik citra yang ada didatabase citra maupun citra query.
  • Similarity Computation: digunakan untuk menghitung kesamaan fitur citra.
  • Ranking: digunakan untuk mengurutkan citra yang memiliki tingkat kemiripan dengan citra query.

c). Image Database, terdiri dari:

  • Feature Vectors: digunakan untuk menyimpan hasil ekstraksi fitur citra dan disimpan didalam database derby.
  • Image merupakan database citra yang secara fisik berupa folder yang didalamnya terdaoat kumpulan citra.

5. Komponen Content Based Image Retrieval (CBIR)

Sebuah sistem CBIR merupakan sistem yang kompleks yang terdiri dari berbagai komponen. Komponen ini diantaranya: user interface, prosesor query, struktur pengindeksan, perhitungan kesamaan citra dan output citra.

 

Contoh Implementasi Sistem Temu Kembali Informasi Multimedia dalam Jurnal :

  1. Sistem Temu Balik Citra Menggunakan Jarak Histogram Dalam Model Warna YIQ

(Rahman ,Arif. 2009. Sistem Temu Balik Citra Menggunakan Jarak Histogram Dalam Model Warna YIQ. Seminar Nasional Aplikasi Teknologi Informasi 2009 (SNATI 2009) Yogyakarta, 20 Juni 2009)

Komposisi warna merupakan salah satu ciri dari citra yang dapat digunakan sebagai pembeda dalam sistem temu-balik citra. Komposisi warna piksel dalam suatu citra dapat direpresentasikan dalam histogram warna. Tingkat kemiripan warna antar citra dapat ditentukan berdasarkan nilai jarak antar histogramnya. Semakin kecil nilai jarak antar histogram, semakin tinggi tingkat kemiripan suatu citra. Jarak anatar histogram pada citra berwarna dihitung setiap komponen warna. penelitian ini menggunakan model warna YIQ : Tiap komoponen warna YIQ nilainya dikuantisasi menjadi 128, 64 dan 32 level. Komponen warna Y memiliki jumlah level ebih banyak karena memiliki pengarh lebih dominan pada persepsi mata manusia terhadap warna dibanding komponen yang lain. Jumlah piksel dalam citra berbeda-beda sesuai dengan ukuran citra, sehingga histogram perlu dinormalisasi agar invarian terhadap ukuran citra. Normalisasi dilakukan dengan membagi jumlah piksel tiap level dengan jumlah total piksel citra, sehingga didapatkan jangkauan nilai [0,1] untuk tiap level. Total jarak antar histogram merupakan hasil jumlahan dari jarak tiap levelnya yang dihitung menggunakan rumus jarak Manhattan. Hasil temu balik diranking berdasarkan nilai jarak antar histogramnya.

*YIQ adalah salah satu model warna yang berfokus pada persepsi mata manusia terhadap warna.

  1. PENGEMBANGAN SISTEM PEROLEHAN CITRA BATIK MADURA YANG EFEKTIF SEBAGAI UPAYA INVENTARIS KEKAYAAN BUDAYA MADURA

(Wahyuningrum, Rima Tri., Rochman, Eka Mala Sari. 20012. PENGEMBANGAN SISTEM PEROLEHAN CITRA BATIK MADURA YANG EFEKTIF SEBAGAI UPAYA INVENTARIS KEKAYAAN BUDAYA MADURA. Jurnal Rekayasa, Volume 5, No. 2, Oktober 2012. http://journal.trumojoyo.ac.id/rekayasa)

Gaya hidup manusia yang serba praktis, cepat dan akurat menuntut pertumbuhan teknologi yang pesat untuk memiliki kebutuhan. Salah satunya adalah kebutuhan akan data dan informasi yang akurat. Salah satu teknik yang digunakan adalah Sistem Perolehan Citra berbasis Isi (SPCI) atau Content Based Image Retrieval (CBIR), yaitu suatu teknik pencarian citra yang mirip dengan melakukan perbandingan anatar citra query dengan citra database. Obyek yang digunakan pada penelitian yaitu batik Madura dengan tujuan sebagai upaya imnventarisasi kekayaan budaya Madura. Pada penelian telah dibuat pengembangan Sistem Perolehan Citra Batik yang efektif menggunakan fitur warna, tekstur dan bentuk. Metode yang digunakan adalah kombinasi Fuzzy Color Histogram (FCH), Gray Level Cooccurence Matrix (GLCM) dan Moment Invarians. Untuk mengukur kemiripan citra batik didasarkan pada perhitungan modifikasikan Euclidian Distance. Dengan menggabungkan ketiga metode untuk ekstraksi fitur tersebut telah diperoleh tingkat akurasi perolehan citra yang tinggi, akurat dan efektif sesuai dengan yang diharapkan. Untuk mengevaluasi performansi dari sistem yang dikembangkan mengunakan Recall dan Precision. Berdasarkan hasil uji coba ditunjukan bahwa dengan jumlah data yang ditampilkan sebanyak 10 pada nilai recall = 0,2 maka nilai precision yang dicapai cukup tinggi yaitu 0,93 yaitu saat jumlah data pelatihan yang digunakan sebanyak 160 dan jumlah data uji yang digunakan sebanyak 40 data.

  1. SISTEM TEMU BALIk CITRA MENGGUNAKAN EKSTRAKSI FITUR CITRA DENGAN KLASIFIKASI REGION UNTUK IDENTIFIKASI OBJEK

(Chyan, Phle., Marwi, Hans Christian. 2014. SISTEM TEMU BALIk CITRA MENGGUNAKAN EKSTRAKSI FITUR CITRA DENGAN KLASIFIKASI REGION UNTUK IDENTIFIKASI OBJEK. JURNAL TELEMATIKA VOL. 2, NO. 2, September 2014)

Sistem pencarian citra dikembangkan untuk mencari gambar dalam koleksi gambar yang terdapat pada database berdasarkan masukan (query) berupa gambar contoh yang disediakan oleh pengguna. Citra tersebut digambarkan sebagai satu set hasil segmentasi wilayah. Pengguna sistem menentukan objek yang akan dicari pada gambar dan memberi contoh sebuah wilayah untuk melatih sistem melalui antarmuka grafis. Untuk proses pengambilan gambar, berisi objek tertentu pengguna membuka gambar dan memilih daerah yang berisi objek pada sistem, maka sistem akan memberi peringkat semua wilayah dalam koleksi tersebut diindeks query kelas ke dalam koleksi database di Euclidean jarak daerah dalam query pengguna dan menampilkan hasil gambar yang sesuai dari koleksi pada database, yaitu citra yang memiliki kemiripan tertinggi.

 

Referensi

´_______. SISTEM Temu-kembali Informasi Multimedia (Multimedia Information Retrieval System). Kajian Pustaka (2011-1-00327-if 2)

´_______. Content Based Image Retrival. Makalah PDF(Materi-1-Relevance-Feedback1)

´Chyan, Phle., Marwi, Hans Christian. 2014. SISTEM TEMU BALIk CITRA MENGGUNAKAN EKSTRAKSI FITUR CITRA DENGAN KLASIFIKASI REGION UNTUK IDENTIFIKASI OBJEK. JURNAL TELEMATIKA VOL. 2, NO. 2, September 2014

´Rahman ,Arif. 2009. Sistem Temu Balik Citra Menggunakan Jarak Histogram Dalam Model Warna YIQ. Seminar Nasional Aplikasi Teknologi Informasi 2009 (SNATI 2009) Yogyakarta, 20 Juni 2009

´Wahyuningrum, Rima Tri., Rochman, Eka Mala Sari. 20012. PENGEMBANGAN SISTEM PEROLEHAN CITRA BATIK MADURA YANG EFEKTIF SEBAGAI UPAYA INVENTARIS KEKAYAAN BUDAYA MADURA. Jurnal Rekayasa, Volume 5, No. 2, Oktober 2012. http://journal.trumojoyo.ac.id/rekayasa

 

Download File Presentasi

Dian Restiani – Pertemuan 9 (Temu Balik Informasi Multimedia)