TEMU BALIK INFORMASI
Dasar-dasar Teori
- Temu Balik Informasi
Temu Balik Informasi adalah sebuah sistem pengambilan informasi yang di rancang untuk mengambil suatu dokumen atau informasi yang di perlukan oleh komunitas pengguna
- Stoplist
proses pembuangan kata buang (tidak memiliki makna), seperti: tetapi, yaitu, sedangkan, dan sebagainya.
- Stemming
proses penghilangan / pemotongan dari suatu kata menjadi bentuk dasar yang merupakan salah satu cara yang digunakan untuk meningkatkan performa IR (Information Retrival)
- Algoritma yang digunakan dalam final project Algoritma Stemming Porter
- Metode pembobotan yang di pakai adalah Metode Term Frequency Inverse Document Frequence (TF-IDF)
Adalah suatu cara untuk memberikan bobot hubungan suatu kata (term) terhadap dokumen (Robertson, 2005). Dalam metode ini terdapat 2 konsep untuk perhitungan bobot, yaitu : Frekuensi kemunculan sebuah kata didalam sebuah dokumen tertentu dan inverse frekuensi dokumen yang mengandung kata tersebut.
Dimana D adalah jumlah semua dokumen dalam koleksi sedangkan dtj adalah jumlah dokumen yang mengandung term (tj)
Sumber data yang di gunakan berasal dari web
http://www.hirupmotekar.com?json=1
Menghitung artikel yang sudah diindex dengan metode VSM (Vector Space Model)