FINAL PROJECT TEMU BALIK INFORMASI
A. TEORI DASAR
Pendahuluan
Perkembangan teknologi dan informasi saat ini terus berkembang dengan pesat,. Semakin kompleksnya kebutuhan manusia, maka banyaknya individu yang semakin memanfaatkan waktu sebaik mungkin untuk mendapatkan informasi yang dibutuhkannya. Kami mencoba ikut andil dalam pemenuhan kebutuhan akan pemaksimalan waktu. Maka dibuatlah aplikasi website Temu Balik Informasi yang merepresentasikan sistem algoritma yang digunakan dalam fitur search engine yang biasa digunakan untuk mendapatkan informasi yang relevan.
- Temu Balik Informasi
TBI atau Temu Balik Informasi adalah tindakan, metode dan prosedur untuk menemukan kembali data yang tersimpan, kemudian menyediakan informasi mengenai subyek yang dibutuhkan. Tindakan tersebut mencakup text indexing, inquiry analysis, dan relevance analysis. Dan Data mencakup teks, tabel, gambar, ucapan, dan video.
- Stoplist
Stop list merupakan pembuangan kata yang tidak deskriptif, seperti : yang, dan, di, dari, adalah.
- Steaming
Stemming adalah proses menggabungkan atau memecahkan setiap varian suatu kata menjadi kata dasar. Contoh : Membela -> Bela, Memasak -> Masak, dll.
B. Dasar-dasar Teori Lanjutan
Algoritma yang digunakan dalam final project : Algoritma Stemming Porter
Metode pembobotan yang di pakai adalah Metode Term Frequency Inverse Document Frequence (TF-IDF)
Adalah suatu cara untuk memberikan bobot hubungan suatu kata (term) terhadap dokumen (Robertson, 2005). Dalam metode ini terdapat 2 konsep untuk perhitungan bobot, yaitu : Frekuensi kemunculan sebuah kata didalam sebuah dokumen tertentu dan inverse frekuensi dokumen yang mengandung kata tersebut.
Dimana D adalah jumlah semua dokumen dalam koleksi sedangkan dtj adalah jumlah dokumen yang mengandung term (tj)
C. PROJECT
Sumber data yang di gunakan berasal dari web http://www.hirupmotekar.com?json=1
Database :
Database yang digunakan adalah dbstbi.sql
Terdapat 5 tabel, dapat di lihat pada gambar di bawah ini :
D. FITUR
- Beranda, yaitu Tampilan awal ketika program dijalankan.
- Mengambil Json, yaitu digunakan untuk menginput data Json dari hirupmotekar.com ke dalam table berita yang ada dalam database dbstbi.sql.
- Tampilkan Corpus, yaitu digunakan untuk menampilkan isi corpus dari artikel yang sudah didownload.
- Membuat Index, yaitu digunakan untuk menampikan yang nantinya akan digunakan untuk proses pengindexan.
- Hitung Bobot, yaitu digunakan untuk menghitung bobot dai setiap term/kata, disini kami menghitungnya menggunakan pendekatan TF-IDF.
- Hitung Vektor, yaitu digunakan untuk mengitung Panjang vector untuk setiap id artikeldengan bobot dan di kuadratkan.
- Hitung Tampilkan, yaitu digunakan untuk menampilkan hasil dari pengindexan artikel / dokumen dan membuang kata-kata yang tidak penting dengan stopwords.
- Panjang Vektor, yaitu digunakan untuk meghitung Panjang vector untuk setiap id artikel dengan jumlahkan semua bobot da dikuadratkan.
- Retrieval, yaitu digunakan untuk mencari dengan keyword yang ada di artikel aslinya.
- Cache, yaitu digunakan untuk menampilkan riwayat pencarian.
- Hapus Data, yaitu digunakan untuk menghapus semua data yang terdapat pada database dbstbi.sql.
Download Presentasi Final Project
Download Project Temu Balik Informasi
Demo Project Video