Stoplist atau stopword adalah kata-kata yang tidak deskriptif (tidak penting) yang dapat dibuang dengan pendekatan bag-of-words.
Stemming adalah proses pembuangan prefiks dan sufiks (secara morfologi) dari suatu kata berimbuhan menjadi kata dasar. Contoh : menyelesaikan menjadi selesai (stem).
Alur Stoplist adalah Kalimat tanya dimasukkan sebuah variabel dan kemudian dipecah hingga menjadi sebuah array. Kemudian disamakan atau dicocokkan dengan stopword yang ada pada tabel stoplist.
Algoritma Stemming
Algoritma stemming untuk teks berbahasa Indonesia, diantaranya : Algortima Porter, Algoritma Nazief & Adriani. Berikut penjelasan dari masing-masing algoritmanya :
- Algortima Porter merupakan algoritma yang paling populer. Ditemukan oleh Martin Porter tahun 1980. Mekanisme algoritma tersebut dalam mencari kata dasar suatu kata berimbuhan, yaitu dengan membuang imbuhan–imbuhan (atau lebih tepatnya akhiran pada kata–kata bahasa Inggris karena dalam bahasa Inggris tidak mengenal awalan).
- Algoritma Nazief & Adriani sebagai algoritma stemming untuk teks berbahasa Indonesia yang memiliki kemampuan prosentase keakuratan (presisi) lebih baik dari algoritma lainnya.
Konsep Penggunaan
- Stoplist
Misal kita mempunyai sebuah query “information is retrieval” dan ”information retriefal(keduanya dicari dengan tanpa menyertakan tanda kutip). Jika sustu sistem information retrieval menyertakan fitur stoplist, seharusnya kedua query tersebut menghasilkan search result yang sama karena kata “is” adalah stopword dan tidak akan di index oleh sistem (diabaikan dalam proses retrieving).
2. Steamming
Ketika query yang dimasukan adalah “memakan buah apel” maka kata perimbuhan”memakan” akan menjadi “makan” karena imbuhan me- dan akhiran –an akan dihilangkan sesuai dengan aturan pada algoritma steamming.
Sumber lainnya :
Ritanita, Ajeng, N.W. Preprocessing. Diambil dari http://tugasakhirkami.blogspot.co.id/2012/04/preprocessing.html
Admin. Stopword PHP. Diambil dari https://www.sistemphp.com/stopword-php/
File Presentasi : download
Program Stemming menggunakan PHP & MySQL : download
Sumber dari http://www.sholihin.com/2012/11/program-stemming-bahasa-indonesia.html