THESAURUS DALAM SISTEM TEMU KEMBALI INFORMASI
Mata Kuliah : Temu Balik Informasi
Dosen Pengampu : Nandang Hermanto, M.Kom
Disusun Oleh : Ana Rofiqoh 15.11.0203
Rizky Arif Fauzi 15.11.0254
Fadhel Widya Rakhman 15.11.0184
Dodi Taruna Baskara 15.11.0165
Reza Agus Adi Pratama 15.11.0224
Ahmad Yahya Asy-syidqie 15.11.0336
Kelas : TI 15 C
PROGRAM STUDI TEKNIK INFORMATIKA
STMIK AMIKOM PURWOKERTO
2018
- Definisi Thesaurus
Berasal dari bahasa Yunani yaitu “ Thesauros yang artinya kekayaan, harta ataupun gudang tempat menyimpan harta benda atau kekayaan”. (Sri Rohyanti Z.: 2002: 1). Menurut Hornby dikutip Sri Rohyanti Z. (2002: 1) : Thesaurus adalah kamus kata-kata dan ungkapan yang dikumpulkan menurut kesamaan artinya dan sinonimnya. Dalam dunia perpustakaan, dokumntasi dan informasi, thesaurus dapat diartikan menurut fungsi dan strukturnya.
Kamus Amerika Webster’s dikutip Sri Rohyanti Z. (2002: 1) mendefinisikan thesaurus sebagai suatu ‘buku yang berisi kata atau informasi mengenai bidang subyek tertentu atau suatu kelompok konsep, seperti kamus sinonim.
Tesaurus adalah alat untuk pengawasan kosa kata (vocabulary control). (E. John Leide: 2002: 1)
- Manfaat Thesaurus
Ada beberapa manfaat dari Thesaurus diantaranya adalah:
- Menyediakan sebuah kosakata yang berstandar untuk bidang tertentu, sehingga para pengindeks (manusia) dapat secara konsisten menetapkan istilah yang akan dipakai sebagai indeks.
- Menjadi sebuah panduan bagi pengguna sistem informasi ketika memilih istilah untuk digunakan dalam pencarian berdasarkan subjek.
- Menjadi sumber bagi istilah-istilah yang sudah terstandardisasi di bidang pengetahuan tertentu.
- Menyediakan hirarki berkelas sehingga sebuah proses pencarian dapat diperluas atau dipersempit.
- Algoritma Thesaurus
Dalam ditemukannya data oleh thesaurus tidak begitu saja ditemukan. Ini menggunakan algoritma tertentu dan algoritma yang digunakann adalah algoritma stemming.
Algoritma Stemming
Algoritma ini didahului dengan pembacaan tiap kata dari file sampel. Sehingga input dari algoritma ini adalah sebuah kata yang kemudian dilakukan:
- Pemeriksaan semua kemungkinan bentuk kata. Setiap kata diasumsikan memiliki 2 awalan / prefiks dan 3 akhiran / sufiks. Sehingga bentuknya menjadi :
Prefiks 1 + Prefiks 2 + Kata Dasar + Sufiks 3 + Sufiks 2+ Sufiks 1
Seandainya kata tersebut tidak memiliki imbuhan sebanyak imbuhan di atas, maka imbuhan yangkosong diberi tanda x untuk prefiks dan diberi tanda xx untuk sufiks. Untuk mewujudkannya maka dibuatlah struktur data untuk menampung setiap kata yang bentuknya sebagai berikut :
enum awalan_t {AwalanError=0,x,
me, pe, be, di, se, ke, te,
mem=100, men, per, pem, ber, ter,
pen,
ber_luluh, ter_luluh, per_luluh,
mem_luluh, pem_luluh, men_luluh,
pen_luluh, meny=200, peny, meng,
meng_luluh, peng_luluh, peng
};
enum akhiran_t {AkhiranError=0, i, kan, an, ku, mu, lah, pun, nya, kah, xx};
struct arrkata_t {
enum awalan_t p1,p2;
char kd[30];
enum akhiran_t s3,s2,s1;
};
- Dengan struktur data di atas, maka langkah awal pemotongan bisa dari mana saja. Dalam hal ini pemotongan dilakukan secara berurutan sebagai berikut :
- Awalan I, hasilnya disimpan pada p1
- Awalan II, hasilnya disimpan pada p2
- Akhiran I, hasilnya disimpan pada s1
- Akhiran II, hasilnya disimpan pada s2
- Akhiran III, hasilnya disimpan pada s3
Pada setiap tahap pemotongan di atas diikuti dengan pemeriksaan di kamus apakah hasil pemotongan itu sudah berada dalam bentuk dasar. Kalau pemeriksaan ini berhasil maka proses dinyatakan selesai dan tidak perlu melanjutkan proses pemotongan imbuhan lainnya.
- Namun jika sampai pada pemotongan akhiran III, belum juga ditemukan di kamus, maka dilakukan proses kombinasi. Kata dasar yang dihasilkan dikombinasikan dengan imbuhan-imbuhannya dalam 12 konfigurasi berikut :
- Kata Dasar
- Kata Dasar + Akhiran III
- Kata Dasar + Akhiran III + Akhiran II
- Kata Dasar + Akhiran III + Akhiran II + Akhiran I
- Awalan I + Awalan II + Kata Dasar
- Awalan I + Awalan II + Kata Dasar + Akhiran III
- Awalan I + Awalan II + Kata Dasar + Akhiran III + Akhiran II
- Awalan I + Awalan II + Kata Dasar + Akhiran III + AkhiranII + AkhiranI
- Awalan II + Kata Dasar
- Awalan II + Kata Dasar + Akhiran III
- Awalan II + Kata Dasar + Akhiran III + Akhiran II 3
- Awalan II + Kata Dasar + Akhiran III + Akhiran II + Akhiran I
- Macam-macam Thesaurus
Untuk membangun tesaurus harus memilih di antara tiga jenis: tesaurus klasik, tesaurus pengindeksan, dan tesaurus yang mencari.
- Tesaurus klasik
Thesaurus klasik digunakan untuk melakukan proses indexing dan proses searching. Dimana Indexer menggunakan thesaurus untuk memetakan varian dari istilah yang ada untuk mewakili banyak istilah pada proses indexing di level dokumen. Sedangkan Searcher menggunakan thesaurus untuk melakukan retrieval atau Temu balik.
Istilah dalam query akan di cocokkan dengan banyak kata dalam kamus thesaurus yang memungkinkan pengelolaan sinonim, penjelajahan hierarkis, dan tautan asosiatif.
- Pengindeksan Tesaurus
Thesaurus ini hanya memiliki proses indexing dan tidak seperti classic thesaurus yang secara lengkap memiliki proses indexing dan proses searching.
Pada thesaurus indexing kita dapat melakukan pengindeksan kosa kata secara terkontrol, akan tetapi tidak dapat menggunakannya untuk melakukan proses searching dan memetakan varian istilah dari pengguna ke istilah terpilih dimana ini merupakan kekurangan serius.
Alasan kenapa lebih baik ada indexing thesaurus daripada tidak ada sama sekali:
(a) Thesaurus indexing menyusun proses indexing, mempromosikan konsistensi dan efisiensi.
(b) Memungkinkan untuk membangun index dari kata kata terpilih yang bisa di jelajahi. Dimana memungkinkan pengguna untuk menemukan semua dokumen tentang subjek atau produk tertentu melalui satu titik akses.
- Pencarian Thesaurus
Terkadang thesaurus klasik tidak bisa di gunakan karena ada masalah dalam pengindexan di tingkat dokumen, misal jika berurusan dengan konten pihak ketiga atau berita dinamis yang berubah setiap hari. Maka Searching thesaurus digunakan.
Searching thesaurus memanfaatkan istilah terkontrol pada pencarian bukan pada pengindexan. Misal user memasukkan query ke mesin pencari, Searching thesaurus dapat memetakan query tersebut ke dalam istilah terkontrol sebelum mengeksekusi query tersebut pada indeks teks lengkap.
- Struktur Thesaurus
Sebuah thesaurus biasanya paling sedikit terdiri dari dua bagian utama yaitu :
(1) Daftar deskriptor (rumusan) menurut abjad; dan
(2) Daftar istilah yang merupakan panduan suatu deskriptor.
Ø Istilah yang dipergunakan sebagai deskriptor untuk mengindeks dan menelusuri informasi, yaitu daftar istilah dalam bahasa indeks yang dikelompokkan secara alpabetis yang terdiri dari faset (kategori) yang mempunyai erat antara satu sama lain.
Contoh : PERPUSTAKAAN
: PERPUSTAKAAN NASIONAL.
: PERPUSTAKAAN PERGURUAN TINGGI.
: PERPUSTAKAAN SEKOLAH.
Ø Istilah-istilah yang merupakan panduan suatu deskriptor (lead in term) yang merupakan pintu masuk kosa kata yang dipakai sebagai deskriptor dan menunjuk hubungan hierarkhis dari masing-masing deskriptor.
- Penerapan Thesaurus
Thesaurus sangat terlihat peran sertanya dalam temu kembali informasi ketika dalam proses penelusuran informasi, lebih utamanya lagi yaitu mengenai input query dalam pencarian bahan koleksi yang menggunakan system komputerisasi. Melalui system komputerisasi, diperlukan adanya kekayaan kosa kata dalam hal pemasukan subjek mengenai bahan koleksi yang dibutuhkan. Contoh konkritnya yaitu ketika user ingin menemukan bahan koleksi mengenai ikan, ketika user hanya memasukkan query ikan saja maka akan didapatkan indeks-indeks hasil pencarian bertemakan ikan, termasuk ikan laut maupun tawar. Tapi jika ia memasukkan query ikan tawar ataupun ikan asin, tentunya akan didapatkan indeks-indeks yang berhubungan dengan ikan tawar atau ikan asin. Itulah salah satu implikasi kehadiran thesaurus terhadap penelusuran informasi yang telah menggunakan system komputerisasi.
DAFTAR PUSTAKA
Bandono, SIP.- 2010. THESAURUS SEBAGAI SARANA TEMU KEMBALI INFORMASI UNTUK MENINGKATKAN PELAYANAN KEPADA PENGGUNA DI PERPUSTAKAAN. Diakses 09 Juli 2018, dari https://bandonoisi.wordpress.com/2010/12/20/thesaurus-sebagai-sarana-temu-kembali-informasi-untuk-meningkatkan-pelayanan-kepada-pengguna-di-perpustakaan/
Rofiek Andi-2009-2017. Thesaurus Untuk Temu Kembali Informasi. Diakses 09 Juli 2018, dari https://www.spesifikasihp.xyz/2011/12/thesaurus-untuk-temu-kembali-informasi.html
Yusuf.S dkk – 2011. softnesslibrary.blogspot.com. Diakses 09 Juli 2018, dari
http://softnesslibrary.blogspot.com/2011/11/draft-tugas-ilmu-dokumentasi-tentang.html
Sahid H.N-2017.THESAURUS DALAM TEMU BALIK INFORMASI. Diakses 09 Juli 2018, dari http://hirupmotekar.com/2017/06/06/niam-habibiy-sahid-thesaurus-dalam-temu-balik-informasi/
Download File : Word
Download PPT : Power Point