ANGGA TRI SASONGKO : PERTEMUAN 2 – METODE DAN MODEL SISTEM TEMU BALIK INFORMASI

A. Definisi Metode dan Model

  • Metode pada dasarnya merupakan cara ilmiah untuk mendapatkan data dengan tujuan dan kegunaan tertentu (sugiyono 2012:2)
  • Menurut Agus Suprijono (2010:46) Model pembelajaran ialah pola yang digunakan sebagai pedoman dalam memecahkan suatu permasalahan

B. Model Model Sistem Temu Balik Informasi

  • Model Klasik
  1. Boolean
  2. Vector
  3. Probabilistic
  • Model Terstruktur
  1. Non Overlapping List
  2. Proximal Nodes

Model IR

 

Model Boolean

Dengan model boolean maka pencarian query dilakukan dengan fungsi-fungsi logika yang umum seperti OR, AND, XOR,NOT,NAND, NOR dan lain sebagainya diantara kata yang diinginkan. Contohnya jika query Q= ( K1 AND K2) OR ( K3 AND ( NOT K4)).

Pencarian Boolean akan mengambil semua dokumen yang di indeks oleh K1 dan K2, seperti halnya semua dokumen yang diindeks oleh K3 yang tidak termasuk dalam indeks K4. Suatu cara mengimplementasikan pencarian Boolean adalah melalui inverted file. Kita menyimpan daftar tiap kata kunci dalam sebuah kata dan tiap kata menunjuk alamat dokumen yang mengandung kata tertentu itu untuk memaksimalkan query kita melakukan set terhadap operasi dan menghubungkannya dengan daftar koleksi (K-List)

Kelebihan dan Kekurangan Model Boolean

  • Kelebihannya adalah lebih mudah bagi user yang berpengalaman
  • kelemahannya adalah kerumitan dalam penggunaan bahasa query dan akan membingungkan pengguna yang biasa

 

Model Vector

Dalam sistem IR, kemiripan antar dokumen didefinisikan berdasarkan representasi bag of words dan dikonversikan ke suatu model ruang vektor (vector space model – VSM). Pada VSM, setiap dokumen di dalam database dan query pengguna direpresentasikan oleh suatu vektor multi-dimensi.

Picture2Picture3

Pada model ruang vektor, pembobotan terhadap term dilakukan dengan mengalikan bobot lokal tf dan bobot global idf, dikenal dengan pembobotan tf-idf. Metode pembobotan ini dilakukan dengan memberikan bobot kepada term yang penting. Artinya, term yang jika muncul di suatu dokumen maka, dokumen tersebut dapat dianggap relevan denganquery pengguna

 

Model Probabilistic

Model probabilistik adalah model sistem temu kembali informasi yang mengurutkan dokumen dalam urutan menurun terhadap peluang relevansi sebuah dokumen terhadap informasi yang dibutuhkan. Beberapa model yang juga dikembangkan berdasarkan perhitungan probabilistik yaitu, Binary IndependenceModel, model Okapi BM25, dan Bayesian Network Model (Manning dkk, 2009).

 

Model Non Overlapping

Sistem yang menggunakan model ini akan membagi-bagi dokumen sebagai wilayah teks tertentu misalnya dengan mengikuti stuktur dokumen (bab, sub-bab, judul, sub-judul, gambar, foto, tabel dan seterusnya) kemudian untuk masing-masing wilayah ini dilakukan pengindeksan yang tidak saling menindih (non overlapping)

 

Model Proximal nodes

Model IR ini menggunakan beberapa struktur indeks yang memiliki hirarki independen terhapap sebuah dokumen. Masing-masing dari indeks ini merujuk ke struktur dokumen (bab, sub-bab, judul, sub judul, gambar, foto tabel dan seterusnya)yang dinamakan nodes. Pada masing-masing node inilah ada rujukan ke bagian dari dokumen yang mengandung teks tertentu.

 

B. Metode Dalam Temu Balik Informasi

 

Metode TF-IDF

TF adalah algoritma pembobotan heuristik yang menentukan bobot dokumen berdasarkan kemunculan term (istilah). Semakin sering sebuah istilah muncul, semakin tinggi bobot dokumen untuk istilah tersebut, dan sebaliknya. Terdapat empat buah algoritma TF yaitu Raw TF, Logarithmic TF, Binary TF, Augmented TF [8]. Dalam penelitian ini digunakan algoritma Raw TF. Raw TF diperoleh dari perhitungan frekuensi kemunculan suatu istilah pada dokumen .IDF merupakan banyaknya istilah tertentu dalam keseluruhan dokumenDokumen-dokumen yang ditampilkan oleh sistem temu balik informasi harus memenuhi persyaratan recall, precision dan NIAP (Non Interpolated Average Precision) [8]. Recall didefinisikan dengan menemukan seluruh dokumen yang relevan dalam koleksi dokumen.

 

Metode BIM 

Binary Independence Model, query dianggap sebagai sebuah vector term. Jika pada model lain jumlah atau kemunculan term diperhitungkan, maka pada Model ini nilainya berupa biner, Yaitu ada atau tidak ada.

Picture4

 

Sumber Referensi

[1] Pengertian Metode Menurut Sugiyono http://elib.unikom.ac.id/files/disk1/526/jbptunikompp-gdl-riskariast-26277-5-unikom_r-i.pdf

[2] Pengertian Model Menurut Agus http://elib.unikom.ac.id/files/disk1/526/jbptunikompp-gdl-riskariast-26277-5-unikom_r-i.pdf

[3] Pengertian Metode BIM http://repository.uin-suska.ac.id/2679/1/2013_201301.pdf

[4] Pengertian Metode TF-IDF  http://id.portalgaruda.org/?ref=browse&mod=viewarticle&article=112004

[5] Pengertian Model Model TBI http://docplayer.info/37181830-Browsing-dan-searching-sebagai-sarana-temu-kembali-sumber-sumber-informasi-dalam-perpustakaan-digital.html

Download Presentasi : Download Disini

Download Sumber : Download Disini