Joko Prayogi : Konsep dan Model Temu Balik Informasi

  1. Konsep Information Retrieval / Temu Balik Informasi

1

“Representation” dari gambar di sebelah kiri menunjukkan representasi dokumen, data dan informasi. “Query” pada komponen sebelah kanan merupakan representasi dari pertanyaan pengguna, serta “matching function” komponen yang di tengah merupakan fungsi pencocokan antara representasi data/dokumen dengan pertanyaan.

  1. Penulis mempresentasikan sekumpulan ide dalam sebuah dokumen menggunakan sekumpulan konsep.
  2. Terdapat beberapa pengguna yang memerlukan ide yang dikemukakan oleh penulis tersebut, tapi mereka tidak dapat mengidentifikasikan dan menemukannya dengan baik.
  3. Sistem temu kembali informasi bertujuan untuk mempertemukan ide yang dikemukakan oleh penulis dalam dokumen dengan kebutuhan informasi pengguna yang dinyatakan dalam bentuk pertanyaan (query).

 

     2. Model Information Retrieval / Temu Balik Informasi

  1. Generalized Vektor Space Model (GVSM)

Generalized Vektor Space Model merupakan perluasan dari vektor space model (VSM) yaitu dengan menambahkan jenis informasi tambahan, disamping term, dalam merepresentasikan dokumen.

  1. Vector Space Model

Model ruang vektor dibuat berdasarkan pemikiran bahwa isi dari dokumen ditentukan oleh kata-kata yang digunakan dalam dokumen tersebut. Model ini menentukan kemiripan (similarity) antara dokumen dengan query dengan cara merepresentasikan dokumen dan query masing-masing ke dalam bentuk vektor.

  1. Latent Semantic Indexing (LSI)

Latent Semantic Indexing adalah sebuah teknik berbasis bidang vektor (vector space) yang dapat menciptakan asosiasi antara dokumen-dokumen yan dapat menciptakan asosiasi antara dokumen-dokumen yang berhubungan secara konseptual [2]

[2] Chen, C., Stoffel, N.,Post,M., Basu,C., Bassu, D., Behrens, C., Telcordia LSI Engine: Implementation and Scalability Issues, Proc. of the 11th Int. Workshop on Research Issues in Data Engineering (RIDE 2001): Document Management for Data Intensive Business and Scientific Applications, Heidelberg, Germany, Apr. 1-2, 20014.

 

Model Information Retrieval

Model Information Retrieval adalah model yang digunakan untuk melakukan pencocokan antara term-term dari query dengan term-term dalam document collection. Model yang terdapat dalam  Information retrieval terbagi dalam 3 model besar, yaitu [3] :

  1. Set-theoritic models, model merepresentasikan dokumen sebagai himpunan kata atau frase. Contoh model ini ialah standard Boolean model dan extended Boolean model.
  2. Algebratic model, model merepresentasikan dokumen dan query sebagai vektor atau matriks similarity antara vektor dokumen dan vektor query yang direpresentasikan sebagai sebuah nilai skalar. Contoh model ini ialah vektor space model (model ruang vektor) dan latent semantic indexing (LSI).
  3. Probabilistic model, model memperlakukan proses pengambilan dokumen sebagai sebuah probabilistic inference.Contoh model ini ialah penerapan Teorema bayes dalam model probabilistik.

Link File Presentasi : Temu balik informasi

Link Referensi :

 https://openlibrary.telkomuniversity.ac.id/pustaka/files/94834/bab1/implementasi-dan-analisis-gravitation-based-model-dengan-algoritma-pagerank-pada-information-retrieval-system-studi-kasus-dokumen-html-.pdf

http://elib.unikom.ac.id/files/disk1/522/jbptunikompp-gdl-agusmaulan-26077-6-unikom_a-i.pdf

http://sugengpri.blog.undip.ac.id/files/2013/07/2.-TEMU-BALIK-INFORMASI.pdf