Konsep Information retrieval
■Indexing
Indexing Berfungsi menghasilkan database index. Merupakan proses persiapan sehingga dokumen siap untuk di retrive.
Tahap-tahap dalam proses indexing ialah:
- Word Token / Parsing
- Stopword Removal / filtering
- Stemming
- TF/IDF ( Term Frequency – Inversed Document Frequency )
■Searching
■Perengkingan relevansi keyword query
Adalah pengurutan dokumen-dokumen yang diterima yang (sangat diharapkan) mencerminkan relevansi dari dokumen tersebut dengan query pengguna.
Ranking didasarkan pada pemikiran fundamental mengenai relevansi, seperti :
■Himpunan index term
■Pemakaian term-term terbobot
■Kemungkinan relevansin query pengguna
Setiap himpunan dari pemikiran mengarahkan ke suatu model Information Retrieval tertentu
Model-model dalam Information Retrieval
■ Model Klasik
- Model Boolean Merupakan model sistem temu kembali informasi sederhana yang berdasarkan atas teori himpunan dan aljabar boolean
- Model Vector Space Merupakan model sistem temu kembali informasi yang merepresentasikan dokumen dan query dalam bentuk vektor dimensional
- Model Probabilistic merupakan model yang didasarkan pada Prinsip Ranking Probabilitas, yang menyatakan bahwa sistem pencarian informasi yang seharusnya berdasarkan peringkat probabilitas dokumen mereka yang relevan dengan query, mengingat semua bukti yang tersedia
■ Model Terstruktur
- Non Overlapping List adalah model yang membagi teks ke dalam regional teks nonoverlapping yang dihimpun dalam lists (list of chapters, list of all sections, …)
- Proximal Nodes adalah model yang mengatur list non-overlapping ke dalam suatu hirarki dan menggunakan struktur indeks yang memiliki hirarki independen (non-flet) terhadap sebuah dokumen.
Full Materi Download <<
bisa juga Disini
Sumber:
■http://hbunyamin.itmaranatha.org/Papers/TESIS_hendra_final.pdf
■http://informationretrievalsystem.blogspot.com/2012/07/sistem-temu-kembali-informasi.html/
■web.ipb.ac.id/~julio/webaku/isi/kom431/slide/04-model.pdf
■http://suyatmobng.blogspot.com/2013/03/metode-cara-kerja-dan-algoritma-ir.html
■http://dokumen.tips/documents/modul-ii-ir-2010.html halaman 11
■http://megaslides.com/doc/270080/term—kungfumas