Nur Rahmat Dwi Riyanto – Sistem Temu Kembali Informasi Multimedia

Sistem Temu Kembali Informasi Multimedia

A. Sistem Temu-kembali Informasi Multimedia (Multimedia Information Retrieval System)

Tujuan dari Sistem Temu-kembali Informasi Multimedia adalah untuk memberikan jawaban terbaik yang sesuai dengan kebutuhan pengguna informasi. Umumnya, dalam sistem informasi, pengguna mengekspresikan  kebutuhan informasi mereka dalam bentuk pertanyaan dan kemudian sistem mencocokan kueri ke database untuk menemukan informasi yang relevan. Dalam kasus informasi multimedia, kebutuhan informasi pengguna dapat dihubungkan dengan seluruh dokumen –dokumen yang ada.

Untuk informasi multimedia, kebutuhan informasi dapat mencakup informasi multimedia secara keseluruhan atau komponen audio-visual, misalnya urutan, layar, ay at-ayat, dialog. Dalam basis informasi mu ltimedia, para peneliti mencoba untuk memfasilitasi akses ke bit informasi yang relevan dengan kebutuhan pengguna dan beradaptasi  untuk menjawab kebutuhan informasi yang beragam.

a)      Pengertian Sistem Temu-kembali Informasi Multimedia

Maghrebi berpendapat bahwa sistem informasi mu ltimedia adalah sistem informasi yang dapat memperhitungkan jenis informasi, karakteristik dan komponen (gambar, suara, teks) dalam rangka memungkinkan pengguna untuk memiliki  akses  ke  informasi  tersebut  (Maghrebi,  2008,  p2).

Menurut  Peter S., Temu-kembali Informasi Multimedia adalah sebuah metodologi yang telah dikembangkan untuk mencari infomasi yang relevan didalam database multimedia, dalam hal ini disebut dokumen (Peter, 1997, p4). Joan mendefinisikan Sistem Temu-kembali Informasi Multimedia sebagai sebuah sistem untuk manajemen (penyimpanan, pengambilan,dan manipulasi) data beberapa media, seperti kombinasi data tabular/administratif, dokumen teks, gambar, spasial, sejarah, audio, dan data video (Joan, 2008).

b)     Prinsip Sistem Temu-kembali Informasi Multimedia

Peter S. dalam Multimedia Information Retrieval menyatakan bahwa biasanya pengguna tidak pernah melihat dokumen yang diinginkan  sebelumnya, dan jumlah dokumen yang relevan tidak diketahui (Peter, 1997, p4). Semua  metode pencarian yang telah diterbitkan sejauh ini didasarkan pada salah satu dari dua prinsip-prinsip berikut:

  1. Prinsip Temu-kembali   Berorientasi   Penyimp anan   (Storage    Oriented Retrieval Prin ciple):

Jika dokumen disimpan dalam tempat yang cocok, maka akan mudah untuk mengambilnya di masa depan. Fokus utama dari prinsip berorientasi penyimp anan adalah organisasi dari “tempat yang sesuai” di mana dokumen yang akhirnya disimpan, atau dimana referensi dokumen yang disimpan (misalnya kartu indeks). Pendekatan yang mengikuti hasil prinsip dalam struktur informasi berupa klasifikasi, dan thesaurus (Lancaster, 1986).

  1. Prinsip Probabilitas Peringkat (Probablitiy Ranking Principle):

Jika respon sistem pengambilan referensi untuk setiap permintaan adalah peringkat dokumen dalam koleksi dalam probabilitas kegunaan bagi pengguna yang mengajukan permintaan, dimana probabilitas diperkirakan seakurat mungkin atas dasar apa pun data telah dibuat tersedia untuk sistem untuk tujuan ini, maka keseluruhan efektivitas sistem untuk penggunanya akan menjadi yang terbaik yang dapat diperoleh berdasarkan data (Robertson, 1977).

Dalam konteks perpustakaan digital, prinsip pertama belum dibenarkan sejauh ini. Prinsip probabilitas peringkat jelas lebih unggul daripada pendekatan penyimp anan tradisional yang berorientasi dalam dua hal. Pertama, prinsip probabilitas peringkat bisa dibuktikan secara matematis. Kedua, percobaan dibuat sejauh ini juga menunjukkan keunggulan prinsip probabilitas peringkat. Perlu dicatat, bagaimanapun, bahwa metode pengambilan penyimpanan berorientasi dan metode pengamb ilan berdasarkan prinsip probabilitas tidak sepenuhnya tidak berhubungan. Terdapat hubungan antara berbagai jenis metode pengambilan (Penyu dan Croft, 1992) dan (Wong dan Yao, 1995).

c)      Komponen Penting dalam Sistem Temu-kembali Informasi Multimedia

Peter (Peter, 1997, p5) menuliskan ada 4 kelompok komponen yang  penting, antara lain : dokumen multimedia, model Temu-kembali, analisis dokumen, dan teknik pencarian interaktif.

  • Dokumen Multimedia: Sistem mampu menyimpan dokumen
    1. Dokumen yang disimpan terdiri dari data multimedia (teks, gambar audio, video, dll).
    2. Dokumen yang disimpan adalah semi terstruktur, yaitu mereka berisi data terstruktur serta data tidak

Dengan data yang terstruktur , atribut database khusus seperti tanggal lahir, no. karyawan, dan nama belakang. Dengan data yang tidak terstruktur, seperti Binary Large Objects (BLOBs), misalnya teks, gambar, audio, dan video rekaman. BLOBs tersebut dapat mengandung beberapa simbol yang dapat diinterpretasikan dalam cara yang tepat (misalnya perintah SGML).

  • Model Temu-kembali: sistem mengadopsi model pengambilan yang mengoptimalkan efektivitas pengamb ilan sesuai dengan prinsip probabilitas
  1. Sistem merespon untuk permintaan dengan menyajikan daftar dokumen yang diurutkan dalam peringkat yang baik mewakili probabilitas sendiri maupun dapat dipetakan  ke  probabilitas dengan cara order preserving transformation.
  2. Skor ini  sering  disebut Retrieval  Status   Value   (RSV) bergantung pada deskripsi dokumen yang terdiri dari informasi statistik yang tepat tentang fitur pengindeksan (misalnya fitur frekuensi atau frekuensi dokumen).
  3. Skor tersebut mungkin juga tergantung pada domain parameter yang diperkirakan dengan  cara   data  tambahan,  misalnya dengan   cara    pengumpulan    pelatihan    atau    oleh thesaurus.
  • Analisis Dokumen: dokumen diproses untuk mengumpulkan informasi statistik.
  1. Pengolahan dokumen adalah jenis pemrosesan sinyal ketika informasi yang tidak relevan maka akan Ketika menganalisis dokumen teks, kata-kata umum (misalnya, sebuah, untuk) dan akhiran (misalnya-ed,-ing) dapat dihapus karena mereka mengandung sedikit makna. Dalam kasus rekaman percakapan, pitch bisa dihapus karena kata yang sama dapat diucapkan dengan suara tinggi atau dengan suara rendah yang berisi informasi sedikit tentang isi rekaman pidato.
  2. Informasi statistik dikumpulkan untuk menghitung RSV yang Secara khusus, data kuantitatif dihitung yang berkorelasi dengan relevansi dokumen terhadap kueri.
  • Teknik Pencarian yang interaktif: sistem mendukung interaksi dengan pengguna untuk meningkatkan kemungkinan keberhasilan
  1. Setelah presentasi dari daftar peringkat dokumen, pengguna dapat member ikan informasi umpan kembali kepada sistem. Umpan balik informasi dapat terdiri dari referensi ke dokumen yang relevan, atau batas-batas bagian yang relevan, atau dari pencarian
  2. Sistem pencarian menggabungkan umpan kembali informasi dengan informasi statistik yang diperoleh dari analisis dokumen. Hasil dari kombinasi tersebut mungkin menjadi kueri baru untuk menghasilkan   urutan   dokumen   yang  lebih   baik   atau mungkin menyertakan pencarian tambahan yang diusulkan kepada pengguna akan dimasukkan ke kueri.

 

 

B. Sejarah Singkat Temu-kembali Multimedia

Exact-Match Retrieval dokumen multimedia diusulkan oleh Dennis Tsichritzis (1983) dan Stavros Christodoulakis (1986). Best-Match Retrieval citra dilakukan oleh Fausto Rabitti (1987). Lihat juga referensi  dalam  laporan MULTOS (Thanos,1990).

Pada 1990-1991, Ulla Glavitsch dan Peter Schäuble mulai meneliti Temu- kembali percakapan (Glavitsch dan Schäuble 1992). Baru-baru ini, proyek Video Mail Retrieval (VMR) dimulai di Cambridge University, Inggris (Brown, Foote, Jones, Sparck-Jones, dan Young 1994), (Jones, Foote, Jones, dan Young 1996) dan proyek  Temu-kembali  informasi   multimedia   dimulai   dalam   proyek INFORM EDIA di Carnigie Mellon University (Hauptmann, Witbrock,  dan Christel 1995).

Seir ing dengan proyek Temu-kembali percak ap an, kelompok pengen alan percakapan di XEROX PARC dan di MIT Lincoln Lab mulai bekerja pada klasifikasi pesan suara, disebut Topic IDentification (TID) (Wilcox dan Bush 1991), (Rose, Chang, dan Lippmann 1991). referensi yang lebih baru pada TID adalah (Jeanrenaud, Siu, Rohlicek, Mezeer, dan Gish 1994) dan (M cDonough, Ng, Jeanrenaud, Gish, dan Rohlicek 1994).

Konferensi multimedia’91 yang diselenggarakan di Singapura mungkin merupakan konferensi pertama yang memiliki sesi Temu-kembali multimedia. Sejak    itu,   konferensi   multimedia   seperti   konferensi   Multimedia   di   ACM (Association  for  Computing  Machinery)  telah          memiliki  sedikitnya  satu sesi tentang Multimed ia Retrieval yang sering disebut, “Content-Based Retrieval“.

C. Jenis-Jenis Sistem Temu Kembali Multimedia

Berikut adalah jenis-jenis sistem temu kembali multimedia:

  • Temu Kembali Audio berbasis Konten (Conten Based Audio Retrieval)
  • Temu Kembali video berbasis Konten (Content Based Video Retrieval)
  • Temu Kembali Citra Berbasis Konten (Content Based Image Retrieval)
  • Temu Kembali Teks Berbasis Konten (Content Based Text Retrieval)
  1. Pengukuran Jarak Antar Dua Histogram
  • Fitur warna merupakan fitur yang paling banyak digunakan pada sistem CBIR.
  • Banyak diantaranya mengunakan image color histogram.
  • Color histogram antara dua gambar tadi kemudian dihitung jaraknya.
  • Gambar yang memiliki jarak paling kecil, merupakan solusinya.
  • Dimisalkan ada dua gambar dengan histogram 4 warna yang sudah terkuantisasi sebagai berikut:

  • Rumus menghitung jarak:

  • Sehingga:

  • Cara lain dg rumus Euclidan

  • Sehingga

2. Arsitektur CBIR

  1. Bagian Arsitektur CBIR
    1. Interface :bagian untuk interaksi antara pengguna dengan sistem CBIR melalui aplikasi GUI (Graphical User Interface). Terdiri dari:
      • Data Insertion : untuk memasukan citra yang akan di ekstrasi.
      • Query Specification untuk menentukan citra yang akan dijadikan citra query serta menentukan metode ekstraksi fitur.
      • Visualization untuk menampilkan citra query dan citra hasil
  1. Query-processing module, terdiri dari:
  • Feature vector extraction untuk mengekstraksi baik citra yang ada didatabase citra maupun citra
  • Similarity Computation digunakan untuk menghitung kesamaan fitur citra.
  • Ranking digunakan untuk mengurutkan citra yang memiliki tingkat kemiripan dengan citra
  1. Image Database, terdiri dari
  • Feature Vectors yang digunakan untuk menyimpan hasil ekstraksi fitur Dan disimpan didalam database derby.
  • Images merupakan database citra yang secara fisik berupa folder yang didalamnya terdapat kumpulan citra

Referensi

  • http://sutikno.blog.undip.ac.id/files/2013/06/Materi-1-Relevance-Feedback1.pdf2222
  • http://library.binus.ac.id/eColls/eThesisdoc/Bab2/2011-1-00327-if%202.pdf

Download

  1. Referensi disini
  2. Power Point disini