Novi Kurniawan : TBI Pertemuan ke-2

 

Konsep Information retrieval

■Indexing

Indexing Berfungsi menghasilkan database index. Merupakan proses persiapan sehingga dokumen siap untuk di retrive.

Tahap-tahap dalam proses indexing ialah:

  1. Word Token / Parsing
  2. Stopword Removal / filtering
  3. Stemming
  4. TF/IDF ( Term Frequency – Inversed Document Frequency )

■Searching

■Perengkingan relevansi  keyword query

Adalah pengurutan dokumen-dokumen yang diterima yang (sangat diharapkan) mencerminkan relevansi dari dokumen tersebut dengan query pengguna.

Ranking didasarkan pada pemikiran  fundamental mengenai relevansi, seperti :

■Himpunan index term

■Pemakaian term-term terbobot

■Kemungkinan relevansin query pengguna

Setiap himpunan dari pemikiran mengarahkan ke suatu model Information Retrieval tertentu

 

Model-model dalam Information Retrieval

■ Model Klasik

  1. Model Boolean Merupakan model sistem temu kembali informasi sederhana yang berdasarkan atas teori himpunan dan aljabar boolean
  2. Model Vector Space Merupakan model sistem temu kembali informasi yang merepresentasikan dokumen dan query dalam bentuk vektor dimensional
  3. Model Probabilistic merupakan model yang didasarkan pada Prinsip Ranking Probabilitas, yang menyatakan bahwa sistem pencarian informasi yang seharusnya berdasarkan peringkat probabilitas dokumen mereka yang relevan dengan query, mengingat semua bukti yang tersedia

■ Model Terstruktur

  1. Non Overlapping List adalah model yang membagi teks ke dalam regional teks nonoverlapping yang dihimpun dalam lists (list of chapters, list of all sections, …)
  2. Proximal Nodes adalah model yang mengatur list non-overlapping ke dalam suatu hirarki dan  menggunakan struktur indeks yang memiliki hirarki independen (non-flet) terhadap sebuah dokumen.

 

Full Materi Download <<

bisa juga Disini

Sumber:

■http://hbunyamin.itmaranatha.org/Papers/TESIS_hendra_final.pdf

http://informationretrievalsystem.blogspot.com/2012/07/sistem-temu-kembali-informasi.html/

■web.ipb.ac.id/~julio/webaku/isi/kom431/slide/04-model.pdf

■http://suyatmobng.blogspot.com/2013/03/metode-cara-kerja-dan-algoritma-ir.html

http://dokumen.tips/documents/modul-ii-ir-2010.html halaman 11

■http://megaslides.com/doc/270080/term—kungfumas