PRESENTASI FINAL PROJEK
DASAR TEORI
- Temu Balik Informasi
Temu Balik Informasi adalah sebuah sistem pengambilan informasi yang di rancang untuk mengambil suatu dokumen atau informasi yang di perlukan oleh komunitas pengguna
- Stoplist
proses pembuangan kata buang (tidak memiliki makna), seperti: tetapi, yaitu, sedangkan, dan sebagainya.
- Stemming
proses penghilangan / pemotongan dari suatu kata menjadi bentuk dasar yang merupakan salah satu cara yang digunakan untuk meningkatkan performa IR (Information Retrival)
- Algoritma yang digunakan dalam final project
Algoritma Stemming Porter
Stemming adalah teknik untuk menjadikan kata-kata dalam sebuah dokumen yang berupa teks menjadi kata dasar. Pada proses stemming berbeda dalam tiap bahasa, karena pada setiap bahasa yang digunakan disebagian negara memiliki aturan-aturan berbeda saat meggunakan kata berimbuhan dalam penggunaanya.
Pada proses stemming merupakan pengelolaan keyword menjadi keyword yang utuh yaitu dengan menghilangkan imbuhan seperti diantaranya “yang”, “di”,”ke”,”me”, “meng”, dan “kan”. Penguraian dari suatu kata menjadi bentuk kata dasarkan (stem). Tahapan pada proses stemming :
1. Token hasil tokenizing diperiksa apakah mengandung imbuhan atau tidak
2. Jika terdapat imbuhan maka akan dilakukan pembuangan imbuhan, terus berulang sampai tidak mengandung imbuhan.
3. Jika tidak mengandung imbuhan maka akan ditampilkan
Pada gambar dibawah ini menunjukan tahapan yang dilakukan sistem dalam mencari kata dasar dari sebuah file dokumen yang diinputkan.
Algoritma Porter ditemukan oleh Martin Porter 1980. Algoritma tersebut digunakan untuk stemming Bahasa Inggris, kemudian karena proses stemming bahasa Inggris berbeda dengan bahasa Indonesia, maka dikembangkan algoritma Porter khusus untuk bahasa Indonesia (Porter Stemmer for Bahasa Indonesia) oleh W.B Frakes pada tahun 1992.
Langkah-Langkah Algortima pada Porter Stemmer.
1. Menghapus Partikel seperti: kah, lah, tah
2. Menghapus Kata ganti (Possesive Pronoun), seperti ku, mu, nya
3. Menghapus awalan pertama. Jika tidak ditemukan, maka lanjut ke langkah 4a, dan jika ada maka lanjut ke langkah 4b.
4. a Menghapus Awalan kedua, dan dilanjutkan pada langkah 5a
b. Menghapus akhiran, jika tidak ditemukan maka kata tersebut diasumsikan sebagai kata dasar (rootword). Jika ditemukan maka lanjut ke langkah 5b.
5. a. Menghapus akhiran dan kata akhir diasumsikan sebagai kata dasar (root word).
b. Menghapus awalan kedua dan kata akhir diasumsikan sebagai kata dasar (root word)
PROJEK
- Tampilan Data Base
- Tampilan Tabel
- Halaman Depan
- Index
- Tampil Corpus
- Tampil Panjang Vektor
- Hitung Bobot
Video Youtube : https://www.youtube.com/watch?v=Of7_3oQXVTc
File Presentasi :presentasi final projek
Projek akhir : https://drive.google.com/file/d/1jKe-L9lKreO1BolTOri2PSTeqmMPOgnL/view?usp=sharing
Referensi :
- http://hirupmotekar.com/
- https://informatikalogi.com/term-weighting-tf-idf/
- https://www.json.org/json-id.html
- Pratomo, Eko Deni. Sistem Temu Kembali Informasi . seputar-info-it.blogspot.co.id/2015/03/sistem-temu-kembali-informasi.html?m=1. waktu akses : Selasa, 4 April 2017