DWI NGAFIFUDIN – TEMU BALIK INFORMASI MULTIMEDIA

TEMU BALIK INFORMASI MULTIMEDIA

Pengertian Sistem Temu Kembali Multimedia

            Maghrebi berpendapat bahwa sistem informasi multimedia adalah sistem informasi yang dapat memperhitungkan jenis informasi, karakteristik dan komponen (gambar, suara, teks) dalam rangka memungkinkan pengguna untuk memiliki akses ke informasi tersebut (Maghrebi, 2008, p2). Menurut Peter S., Temu kembali informasi multimedia adalah sebuah metodologi yang telah dikembangkan untuk mencari informasi yang relevan di dalam database multimedia, dalam hal ini disebut dokumen (Peter, 1997, p4. Joan mendefinisikan sistem temu kembali multimedia sebagai sebuah sistem untuk manajemen (penyimpanan, pengambilan, dan manipulasi) data beberapa media, seperti kombinasi data tabular/administratif, dokumen tekks, gambar, spasial, sejarah, audio, dan data video (Joan, 2008).

Tujuan Sistem Temu Kembali Multimedia

           Tujuan dari sistem temu kembali multimedia aalah untuk memberikan jawaban terbaik yang sesuai dengan kebutuhan pengguna informasi. Umumnya, dalam sistem informasi, pengguna mengekspresikan kebutuhan informasi mereka dalam bentukk pertanyaan dan kemudian sistem mencocokan kueri ke database untuk menemukan informasi yang relevan. Dalam kasus informasi multimedia, kebutuhan informasi pengguna dapat dihubungkan dengan seluruh dokumen-dokumen yang ada.

          Untuk kebutuhan multimedia, kebutuhan informasi dapat mencakup informasi multimedia secara keseluruhan atau komponen audio-visual, misalnya urutan, layar, ayat-ayat, dialog. Dlam basis informasi multimedia, para peneliti mencoba untuk memfasilitasi akses ke bit informasi yang relevan dengan kebutuhan pengguna dan beradaptasi untuk menjawab kebutuhan informasi yang beragam.

Prinsip Sistem Temu kembali Informasi Multimedia

            Peter  S. Dalam Multimedia Information Retrieval menyatakan bahwa biasanya pengguna tidak pernah melihat dokumrn yang diinginan sebelumnya, dan jumlah dokumen yang relevan tidak diketahui (Peter, 1997, p4). Semua metode pencarian yang telah diterbitkan sejauh ini didasarkan pada salahsatu dari dua prinsip-prinsip berikut:

  1. Prinsip Temu Kembali berorientasi Penyimpanan (Storage Oriented Retrieval Principle)

         Jika dokumen disimpan dalam tempat yang cocok mka akan mudah untuk mengambilnya di masa depan. Fokus utma dari prinsip berorientasi penyimpanan adalah organisasi “tempat yang sesuai” di mana dokumen yang akhirnya disimpan, atau dimana referensi dokumen yang disimpan (misalnya kartu indeks). Pendekatan yang mengikuti hasil prinsip dalam struktur informasi berupa klasifikasi, dan thesaurus (Lancaster, 1986).

  1. Prinsip probabilitas Peringkat (Probability Ranking Principle):

       Jika respon sistem pengambilan referensi untuk setiap permintaan adalah peringkat dokumen dalam koleksi dalam probabilitas kegunaan bagi pengguna yang mengajukan permintaan, dimana probabilitas diperkirakan seakurat mungkin atas dasar dasar apapun data telah dibuat tersedia untuk sistem untuk tujuan ini, maka keseluruhan efektifitas sistem untuk penggunanya akan menjadi yang terbaik yang dapat diperoleh berdasarkan data (Robertson, 1997).

       Dalam konteks perpustakaan digital, prinsip pertama belum dibenarkan sejauh ini. Prinsip proabilitas peringkat jelas lebih unggul daripada pendekatan penyimpanan tradisional yang berorientasi dalam dua hal. Pertama, prinsip probabilitas peringkta bisa dibuktikan secara matematis. Kedua, percobaan dibuat sejauh ini juga menunjukkan keunggulan prinsip probabilitas peringkat. Perlu dicatat, bagaimanapun, bahwa metode pengabilan penyimapanan berorientasi dan metode pengambilan berdasarkan prinsip probabilitas tidak sepenuhnya tidak berhubungan. Terdapat hubungan antara berbagai jenis metode pengambilan (Penyu dan Corft, 1992) dan (Wong dan Yao, 1995).

Komponen Penting dalam Sistem Temu Kembali Informasi Multimedia

        Peter (Peter, 1997, p5) menuliskan ada 4 komponen yang penting antara lain: dokumen multimedia, model Temu-Kembali, analisis dokumen, dan teknik pencarian interaktif.

  1. Dokumen Multimedia: Sistem mampu menyimpan dokumen multimedia.
  2. Dokumen yang didimpa terdiri dari data multimedia(teks, gambar, audio, video, dll)
  3. Dokumen yang tersipan adalah semi terstruktur, yaitu mereka bersis data terstruktur serta data tidak terstruktur.
  4. Dengan data yang terstruktur, atribut database khusus seperti tanggal lahir, no. Karyawan, dan nama belakang. Dengan data yang tidak terstruktur seperti Binary Large Objects (BOBs), misalnya mengandung beberapa simbol yang dapat diinterpretasikan dalam cara yang tepat (misalnya perintah SGML).
  5. Model Temu Kembali : sistem mengadopsi model pengambilan yang mengoptimalkan efektivitas pengambilan sesuai dengan prinsip probabilitas peringkat.
  6. Sistem merespon untuk permintaan dengan menyajikan daftar dokumen yang diurutkan dalam peringkat yang baik mewakili probabilitas sendiri maupun dapat di petakan ke probabilitas dengan cara Order preserving transformation.
  7. Skor ini sering disebut Retrieval Status Value (RSV) bergantung pada deskripsi dokumen yang terdiri dari informasi statistik yang tepat tentang fitur pengndeksan (misalnya fitur frekuensi atau frekuensi dokumen).
  8. Skor tersebut mungkin juga tergantung pada domain parameter yang diperkirakan dengan cara data tambahan, misalnya sengan cara pengumpulan pelatihan atau oleh thesaurus.
  9. Analisis Dokumen: dokumen diproses untuk mengumpulkan informasi statistik.
  10. Pengolahan dokumen adalah jenis pemrosesan sinyal ketika informasi yang tidak relevan maka akan dihapus. Etika menganalisis dokumen teks, kata-kata umum (misalnya, sebuah untuk) dan akgiran (mislanya-ed, ing) dapat dihapus karena mereka mengandung sedikit makna. Dalam kasus rekaman percakapan, pitch bisa dihapus karena kata yang sa dapat diucapkan dengan suara tinggi atau dengan suara rendah yang berisi informasi sedikit tentang isi rekaman pidato.
  11. Informasi statistik dikumpulkan untuk menghitung RSV yang sesuai. Secara khusus, data kuantitatif dihitung yang berkorelasi dengan relevansi dokumen terhadapp kueri.
  12. Teknik Pencarian yang interaktif: sistem mendukung interaksi dengan pengguna untuk memungkinkan keberhasilan pencarian.
  13. Setelah presentasi dari daftar peringkat dokumen, pengguna dapat memberikan informasi umpan kembali kepada sistem. Umpan balik informasi dapat terdiri dari referensi ke dokumen yang relevan, atau batas-batas bagian yang relevan, atau dari pencarian tambahan.
  14. Sistem pencarian menggabungkan umpan kembali informasi dengan informasi statistik yang diperoleh dari analisis diokumen. Hasil dari kombinasi tersebut mungkin menjadi kueri baru untuk menghasilkan urutan dokumen yang lebih baik atau mungkin menyertakan pencarian tambahan yang diusulkan kepada pengguna akan dimasukkan ke kueri.

http://library.binus.ac.id/eColls/eThesisdoc/Bab2/2011-1-00327-if%202.pdf

Jenis-jenis Sistem Temu Kembali

  1. Temu Kembali Audio berbasis Konten(ContenBased Audio Retrieval)
  2. Temu Kembali video berbasis Konten(Content Based Video Retrieval)
  3. Temu Kembali Citra Berbasis Konten(Content Based Image Retrieval)
  4. Temu Kembali Teks Berbasis Konten(Content Based Text Retrieval)

http://sutikno.blog.undip.ac.id/files/2013/06/Materi-1-Relevance -Feedback1.pdf

Penerapan Temu Balik Informasi

           Beberapa dekade yang lalu, busana muslim wanita sudah ada tetapi belum populer. Sekarang, busana muslimah dengan cepat mengikuti perkembangan dunia mode, sehingga muncul model busana muslimah dengan warna, tekstur, dan bentuk (shape) yang variatif. Sama halnya dengan penjualan busana jenis umum, penjualan busana muslimah banyak yang dilakukan secara daring. Sampai saat ini, untuk mencari busana pada suatu sistem penjualan daring, digunakan kata kunci, berupa teks sebagai query.  Penelitian menunjukkan bahwa querying menggunakan teks sering menghasilkan citra-citra yang tidak sesuai dengan keinginan pengguna. Setidaknya ada dua penyebab, yaitu manusia mengalami kesulitan mendeskripsikan sebuah objek menggunakan kata-kata, baik itu dari segi warna, tekstur, maupun bentuk, atau sistem tidak dapat memfasilitasi variasi kata kunci (teks) yang diberikan manusia sebagai query ke sistem. Kondisi ini dapat diselesaikan jika query ke sistem adalah citra itu sendiri. Proses querying dengan query berupa citra dikenal dengan nama temu kembali citra berdasarkan isi (TKCI). Isi yang dimaksud adalah warna, tekstur, dan bentuk objek. Pada TKCI, isi objek citra diekstrak dan disimpan dalam wadah yang disebut ciri (feature).

        Penelitian menunjukkan bahwa bentuk sebagai ciri visual sulit atau hampir tidak mungkin dideskripsikan dengan teks. Selanjutnya, dikemukakan bahwa penerapan TKCI berdasarkan bentuk lebih sulit jika dibandingkan dengan TKCI berdasarkan warna atau tekstur. Banyak penelitian telah dilakukan untuk mengekstrak ciri bentuk dari suatu objek citra. Curvature Scale Space (CSS) adalah ciri bentuk standar yang didefinisikan pada Motion Picture Experts Group-7 (MPEG-7), selain beberapa ciri lain seperti chain-code dan deskriptor wavelet. CSS telah digunakan untuk mencari kemiripan bentuk binatang laut. Penelitian ini menunjukkan bahwa metode CSS lebih unggul daripada deskriptor Fourier dan moment invariants. Selanjutnya, telah digunakan juga metode CSS pada TKCI merek dagang. Penelitian tersebut menunjukkan bahwa citra yang direpresentasikan  dengan CSS tidak terpengaruh oleh adanya derau citra, perubahan skala, dan orientasi citra.  Penerapan TKCI pada busana merupakan ranah riset baru yang aktif diteliti beberapa tahun ini. Sebuah penelitian membahas TKCI dengan membandingkan penggunaan lima deskriptor, yaitu deskriptor warna dan arah tepi, MPEG-7, correlogram warna, histogram warna, dan tekstur Tamura. Semua deskriptor ini digunakan dalam eksperimen dengan serangkaian citra busana dengan berbagai merek dan gaya yang ada dalam lima tahun. Hasil eksperimen menunjukkan bahwa deskriptor tekstur Tamura melebihi deskriptordeskriptor lain dalam hal precision dan recall. Penelitian lain mengusulkan metode sparse-coding untuk pencarian citra busana berbasis isi, dengan ciri berupa style, warna, dan tekstur.  Sebuah penelitian membahas cara menerapkan teknik “shape contex” untuk hasil yang lebih baik dalam pencarian citra busana. Metode ini mencapai tingkat temu kembali rata-rata sebesar 32,73%. Pada penelitian lain, diusulkan metode temu kembali berdasarkan “shape contex”. Artikel ini mengungkapkan bahwa bentuk adalah hal yang penting dalam TKCI busana. Selanjutnya disebutkan bahwa sistem belanja secara daring sudah selayaknya mempertimbangkan barang yang diperjualbelikan berupa busana.  Ciri bentuk lain yang banyak dipakai sebagai descriptor bentuk pada TKCI busana adalah histogram of gradient (HOG). Pada penelitian tersebut, diukur unjuk kerja penggunaan HOG dan beberapa ciri lain untuk mendeteksi bagian-bagian dari busana. Dibandingkan dengan ciri yang lain, ditemukan bahwa penggunaan HOG menghasilkan unjuk kerja terbaik dengan nilai presisi tertinggi sebesar 0.6. Studi menunjukkan bahwa penerapan CSS pada TKCI citra-citra umum lebih baik dibandingkan dengan ciri bentuk lain yang didefinisikan pada MPEG-7. Selanjutnya, ciri bentuk lain, yaitu HOG, yang banyak telah dicoba untuk diterapkan pada TKCI busana masih menghasilkan nilai unjuk kerja yang rendah. Makalah ini memiliki kontribusi sebagai berikut.

  1. Membahas penerapan CSS sebagai metode ektraksi ciri bentuk untuk busana muslim wanita. Penerapan suatu ciri yang sama pada domain yang berbeda akan menghasilkan unjuk kerja yang berbeda-beda. Studi penggunaan CSS pada TKCI busana muslimah perlu dilakukan, mengingat keandalannya pada TKCI citra umum dan perkembangan pasar busana muslimah yang semakin besar dan cenderung akan terus membesar dalam tahun-tahun mendatang.
  2. Dalam eksperimen, ditampilkan unjuk kerja penggunaan panjang ciri CSS yang berbeda-beda. Hal seperti ini tidak pernah ada pada penelitian-penelitian sebelumnya.
  3. Menunjukkan bahwa penggunaan CSS menghasilkan unjuk kerja yang lebih baik daripada HOG, berdasarkan parameter recall dan precision.

            CSS merupakan metode ekstraksi ciri bentuk kontur tertutup. Metode berbasis kontur ini awalnya dikembangkan oleh Mokhatarian dan selanjutnya disempurnakan untuk digunakan dalam standar MPEG-7. Manusia memetakan kontur dalam bentuk cekung dan cembung. CSS juga menggunakan teknik yang sama, menyegmentasikan kontur menjadi bagian cekung dan cembung dengan menghitung titik pada kontur. Kontur kemudian dihaluskan menggunakan filter Gaussian pada masing-masing titik perubahan dari cekung ke cembung dan sebaliknya (titik infleksi). Proses filter dilakukan pada semua titik infleksi di sepanjang kontur. Jumlah semua titik yang mengalami proses filter dicatat dan filter berhenti ketika seluruh kontur menjadi cembung (tidak ada lagi titik infleksi). Sebelum menerapkan CSS, diperlukan tahap pengolahan awal dan ekstraksi kontur.

Diagram Alir Temu Balik Informasi Multimedia

http://ejnteti.jteti.ugm.ac.id/index.php/JNTETI/article/download/297/226

ppt silahkan download disini : DWI.N-TI14D-TEMU BALIK INFORMASI MULTIMEDIA