1. Konsep dan Metode-Metode yang Ada Dalam Temu Balik Informasi
a. Konsep
![]()
Representasi menunjukkan representasi dokumen, data dan informasi. Query pada gambar merupakan
representasi dari pertanyaan pengguna, serta Matching Function merupakan fungsi pencocokan antara
representasi data atau dokumen dengan pertanyaan.
Sumber :
http://sugengpri.blog.undip.ac.id/files/2013/07/2.-TEMU-BALIK-INFORMASI.pdf

Ada 2 tahapan arsitektur STKI gambar diatas yaitu Preprocessing dan Matching.
Tahapan Preprocessing :
a) Tokenisasi
Yaitu mengubah dokumen menjadi kumpulan term dengan cara menghapus semua karakter dalam tanda
baca yang terdapat pada dokumen abstrak TA dan mengubah kumpulan term menjadi huruf kecil semua
(lowercase)
b) Stopword Removal
Proses penghapusan kata-kata yang serinf dtampilkan dalam dokumen seperti : pada, dengan, adalah,
yaitu, yang, juga, dari, dia, kami, kamu, ini, itu, atau, dan, tersebut, ke dan sebagainya.
c) Stemming
Proses mengubah suatu kata bentukan menjadi kata dasar (root word)
d) Term Weighting (pembobotan)
Proses pembobotan setiap term di dalam dokumen.
Tahapan matching (pencocokan) merupakan proses menemukan kembali informasi abstrak tugas akhir
yang relevan terhadap query yang diberikan. Tidak semua dokumen yang diambil (retrieved) oleh sistem
merupakan dokumen abstrak yang sesuai dengan keinginan pengguna (relevant). Gambar berikut menunjukan
hubungan antara dokumen relevan, dokumen yang terambil oleh sistem, dan dokumen relevan yang terambil
oleh system.
Sumber: https://drive.google.com/file/d/0B5URBEGM7QP_eTBYOHBfRWFJLXc/view
Afuan, Lsmedi. (2014).RANCANG BANGUN SISTEM TEMU KEMBALI
INFORMASI ABSTRAK TUGAS AKHIR MAHASISWA PRODI TEKNIK INFORMATIKA UNSOED. Jurnal
Telematika Vol. 7 No.1 Februari 2014 .
b. Metode
a) Vector Space Model
Vector Space Model (VSM) adalah metode untuk melihat tingkat kedekatan atau kesamaan (similarity)
term dengan cara pembobotan term. Dokumen dipandang sebagai sebuah vector yang memilikimagnitude
(jarak) dan direction (arah). Pada Vector Space Model, sebuah istilah direpresentasikan dengan sebuah
dimensi dari ruang vektor. Relevansi sebuah dokumen ke sebuah query didasarkan pada similaritas diantara
vektor dokumen dan vektor query. (Baeza,1999)

Sumber : http://ejournal.undip.ac.id/index.php/jsinbisnis
b) Term Frequency-Inverse Document Frequency (TF-IDF)
Algoritma Term Frequency Inverse Document Frequency merupakan suatu algoritma yang mengalikan
antara Term Frequency dengan Inverse Document frequency. Term Frequency yaitu jumlah kemunculan
sebuah term pada sebuah dokumen. Inverse Document Frequency yaitu pengurangan dominasi term yang
sering muncul diberbagai dokumen, dengan memperhitungkan kebalikan frrekuensi dokumen yang
mengandung suatu kata.
Sumber: http://e-journals.unmul.ac.id/index.php/JIM/article/view/113
2. Model-model Temu Balik Informasi
Dalam bidang sistem temu balik informasi, dikenal berbagai model menilai objektif presisi dari suatu
pencarian, antara lain model boolean (Boolean Model), model ruang vektor (Vector Space Model), model
probabilistik (Probabolistic Model). Ketiga model ini masing-masing memiliki kekurangan dan kelebihan. Model
Boolean adalah model yang paling awal dikenal dan paling mudah dimplementasikan. Hanya saja, model
Boolean tidak dapat memberikan hasil yang diharapkan dan sangat lambat dalam run-time (Jaya, 2007).
Sistem temu balik informasi juga memperkenalkan model probabilistik. Model ini mengurutkan dokumen
dalam urutan menurun terhadap peluang relevansi sebuah dokumen pada informasi yang dibutuhkan
(Ramadhany, 2008). Terakhir model ruang vektor, model ini menampilkan hasil temu balik secara terurut(ranking)
(Jaya, 2007). Model ruang vektor tidak membutuhkan komputasi yang berlebihan sehingga waktu mengeksekusi
semakin cepat dan lebih efektif(Ramadhany, 2008).
Sumber : http://a-research.upi.edu/operator/upload/s_d545_0608772_chapter1.pdf