Presentasi Final Project Temu Balik Informasi TI 14 A Kelompok Achmad Amar Ramadhan 14.11.0074

Pengertian Temu Balik Informasi (Information Retrieval)

Sistem temu balik informasi merupakan kegiatan yang bertujuan untuk menyediakan dan memasok informasi bagi pemakai sebagai jawaban atas permintaan atau berdasarkan kebutuhan pemakai. Hasugian (2006: 2) mengemukakan bahwa “pada dasarnya sistem temu balik informasi adalah suatu proses untuk mengidentifikasi, kemudian memanggil (retrieve) suatu dokumen dari suatu simpanan (file), sebagai jawaban atas permintaan informasi”.

Stoplist dan Stemming

-Stoplist yaitu proses pembuangan kata buang yang tidak akan digunakan sebagai istilah indeks. seperti: tetapi, yaitu, sedangkan, dan sebagainya.

-Stemming merupakan proses yang memetakan bentuk varian kata menjadi kata dasarnya (Fadillah, 2003).

-Proses stemming dilakukan dengan cara menghilangkan semua imbuhan (affixes) baik yang terdiri dari awalan (prefixes), sisipan (infixes), akhiran (suffixes) dan confixes (kombinasi dari awalan dan akhiran) pada kata turunan. Stemming digunakan untuk mengganti bentuk dari suatu kata menjadi kata dasar dari kata tersebut yang sesuai dengan struktur morfologi bahasa Indonesia yang benar (Tala, 2003).

Metode Pembobotan

Metode pembobotan yang di pakai adalah Metode Term Frequency Inverse Document Frequence (TF-IDF)

Adalah suatu cara untuk memberikan bobot hubungan suatu kata (term) terhadap dokumen (Robertson, 2005). Dalam metode ini terdapat 2 konsep untuk perhitungan bobot, yaitu : Frekuensi kemunculan sebuah kata didalam sebuah dokumen tertentu dan inverse frekuensi dokumen yang mengandung kata tersebut.

Dimana D adalah jumlah semua dokumen dalam koleksi sedangkan dfj adalah jumlah dokumen yang mengandung term (tj)

Algoritma Porter

Porter Stemmer for Bahasa Indonesia dikembangkan oleh Fadillah Z. Tala pada tahun 2003. Implementasi Porter Stemmer for Bahasa Indonesia berdasarkan English Porter Stemmer yang dikembangkan oleh W.B. Frakes pada tahun 1992. Karena bahasa Inggris datang dari kelas yang berbeda, beberapa modifikasi telah dilakukan untuk membuat Algoritma Porter dapat digunakan sesuai dengan bahasa Indonesia. Desain dari Porter Stemmer for Bahasa Indonesia dapat dilihat pada gambar dibawah ini :

Berdasarkan gambar disamping, Adapun langkah-langkah algoritma pada algoritma Porter adalah sebagai berikut (Agusta, 2009):

1.Hapus Particle,

2.Hapus Possesive Pronoun.

3.Hapus awalan pertama. Jika tidak ada lanjutkan ke langkah 4a, jika ada cari maka lanjutkan ke langkah 4b.

4.a. Hapus awalan kedua, lanjutkan ke langkah 5a. b. Hapus akhiran, jika tidak ditemukan maka kata tersebut diasumsikan sebagai root word. Jika ditemukan maka lanjutkan ke langkah 5b.

5.a. Hapus akhiran. Kemudian kata akhir diasumsikan sebagai root word b. Hapus awalan kedua. Kemudian kata akhir diasumsikan sebagai root word.

Database

Database yang digunakan adalah fita_dbstbi.sql.

Dalam database terdiri dari 7 tabel yaitu tabel :

1.Tbberita

2.Tbcache

3.Tbindex

4.Tbkatadasar

5.Tbterm

6.TbStoplist

7.Tb Vektor

Sumber : http://www.hirupmotekar.com?json=1

Tampilan Beranda
Tampilan beranda adalah tampilan awal program ketika dijalankan

Disini Tampilan awal Mulai dari Beranda, Get Berita, Proses Stoplist, Proses Stemming, Buat Index,Hitung Bobot, Hitung panjang Vektor,dan Retrival untuk dijalankan satu persatu juga ada langkah yang langsung untuk semua proses.

Kemudian ada tampilkan cache, Tampilkan Index dan Bobot, Tampilkan Stoplist dan Tampilkan Vektor.

Get Berita
Menampilkan isi corpus dari artikel yang sudah di download  dan Menampilkan semua artikel yang nantinya akan digunakan untuk proses pengindexan

Proses Stoplist
Proses untuk pembuangan kata buang yang tidak akan digunakan sebagai istilah indeks.

Proses Stemming

Buat Index
Dalam pengindexan baru mengindeks 19 berita karena untuk proses load semua berita membutuhkan waktu yang lama

Hitung Bobot

Hitung Panjang Vektor

Retrieval

Tampilkan Cache

Tampilkan Index dan Bobot

Tampilkan Stoplist

Tampilkan Stemming

Tampilkan Vektor

 

Referensi

uhttp://ir.majumapan.com/irs/fungsi-sistem-temu-kembali-informasi-lancaster-dan-kent/

uLasmedi Afuan, 2013 STEMMING DOKUMEN TEKS BAHASA INDONESIA MENGGUNAKAN ALGORITMA PORTE, Jurnal Telematika Vol. 6 No. 2

uAdmin. Stopword PHP. Diambil dari https://www.sistemphp.com/stopword-php/https://informatikalogi.com/term-weighting-tf-idf/

Link Youtube presentasi final project Temu Kembali Informasi sebelum revisi : https://www.youtube.com/watch?v=FyhjgEJuO_s

Link Youtube presentasi final project Temu Kembali Informasi sesudah revisi : https://www.youtube.com/watch?v=zot03Nd4ARA
Yang kami revisi dari aplikasi sebelumnya adalah :
1. Proses Stemming
2. Stoplist
3. Proses Retrieval
4. Penghitungan Bobot
5. Proses tambahan yaitu kami menjadikan Stemming + stoplist + hitung bobot + panjang vektor + indexing menjadi satu kali klik untuk proses.

File Presentasi : https://drive.google.com/open?id=0BxYw6S18heQ2aVpwTlBMTG01czQ

File Program : https://drive.google.com/open?id=0BxYw6S18heQ2YnU4aDFhakYtb2s