TBI18-TI15C-P2-MODEL MODEL SISTEM TEMU BALIK INFORMASI-RIZKY ARIF FAUZI

I. Model Sistem Temu Kembali Informasi

1. Model Klasik

a. Boolean

Model Boolean dalam sistem temu kembali merupakan model yang paling sederhana. Model ini berdasarkan teori himpunan dan aljabar Boolean.
Keuntungan menggunakan model Boolean :

– Model Boolean merupakan model sederhana yang menggunakan teori dasar himpunan sehingga mudah diimplementasikan.

– Model Boolean dapat diperluas dengan menggunakan proximity operator dan wildcard operator.

– Adanya pertimbangan biaya untuk mengubah software dan struktur database, terutama pada sistem komersil.

Kerugian menggunakan model Boolean :

– Model Boolean tidak menggunakan peringkat  dokumen yang terambil. Dokumen yang terambil hanya dokumen yang benar-benar sesuai dengan pernyataan boolean/kueri yang diberikan Sehingga dokumen yang terambil bisa sangat banyak atau bisa sedikit. Akibatnya ada kesulitan dalam mengambil keputusan.

– Teori himpunan memang mudah, namun tidak demikian halnya dengan pernyataan Boolean yang bisa kompleks. Akibatnya pengguna harus memiliki pengetahuan banyak mengenai kueri dengan boolean agar pencarian menjadi efisien.

– Tidak bisa menyelesaikan partial matching pada kueri.

Model Boolean dibagi menjadi 2 yaitu :

1. Model Himpunan Fuzzy

2. Model Extended Boolean

b. Vektor

Dalam sistem IR, kemiripan antar dokumen didefinisikan berdasarkan representasi bag of words dan dikonversikan ke suatu model ruang vektor (vector space model – VSM). Pada VSM, setiap dokumen di dalam database dan query pengguna direpresentasikan oleh suatu vektor multi-dimensi.

Pada model ruang vektor, pembobotan terhadap term dilakukan dengan mengalikan bobot lokal tf dan bobot global idf, dikenal dengan pembobotan tf-idf.

c. Probabilistic

Model probabilistik adalah model sistem temu kembali informasi yang mengurutkan dokumen dalam urutan menurun terhadap peluang relevansi sebuah dokumen terhadap informasi yang dibutuhkan. Beberapa model yang juga dikembangkan berdasarkan perhitungan probabilistik yaitu, Binary IndependenceModel, model Okapi BM25, dan Bayesian Network Model (Manning dkk, 2009).

2. Model Terstruktur

a. Non Overlapping List

Sistem yang menggunakan model ini akan membagi-bagi dokumen sebagai wilayah teks tertentu misalnya dengan mengikuti stuktur dokumen (bab, sub-bab, judul, sub-judul, gambar, foto, tabel dan seterusnya) kemudian untuk masing-masing wilayah ini dilakukan pengindeksan yang tidak saling menindih (non overlapping).

b. Proximal Nodes

Model IR ini menggunakan beberapa struktur indeks yang memiliki hirarki independen terhadap sebuah dokumen. Masing-masing dari indeks ini merujuk ke struktur dokumen (bab, sub-bab, judul, sub judul, gambar, foto tabel dan seterusnya)yang dinamakan nodes.

II. Refrensi

1. https://computernet-news.blogspot.co.id/2017/04/metode-dan-model-sistem-temu-balik.html

2. https://putuandreaswaranu.wordpress.com/2015/03/10/pemodelan-sistem-temu-kembali-informasi-boolean/

III. Download

1. Materi Presentasi (PPT)