Pengertian Thesaurus
- Berasal dari bahasa Yunani yaitu “ Thesauros yang artinya kekayaan, harta ataupun gudang tempat menyimpan harta benda atau kekayaan”. (Sri Rohyanti Z.: 2002: 1)
- Menurut Hornby dikutip Sri Rohyanti Z. (2002: 1) : Thesaurus adalah kamus kata-kata dan ungkapan yang dikumpulkan menurut kesamaan artinya dan sinonimnya. Dalam dunia perpustakaan, dokumntasi dan informasi, thesaurus dapat diartikan menurut fungsi dan strukturnya.
- Kamus Amerika Webster’s dikutip Sri Rohyanti Z. (2002: 1) mendefinisikan thesaurus sebagai suatu ‘buku yang berisi kata atau informasi mengenai bidang subyek tertentu atau suatu kelompok konsep, seperti kamus sinonim.
- Tesaurus adalah alat untuk pengawasan kosa kata (vocabulary control). (E. John Leide: 2002: 1)
Konsep Thesaurus
Tesaurus merupakan suatu kosakata terkontrol yang diatur secara terurut dimana relasi ekivalensi, hirarki dan asosiasi antar term ditampilkan secara eksplisit dan diidentifikasikan dengan indikator relasi standard [4].
Tesaurus memiliki fungsi berdasarkan fungsionalitas-nya yaitu:
- Tesaurus stand-alone : Berfungsi untuk membantu pengguna memahami arti suatu term beserta relasinya, membantu mencari variasi term dan mencari translasi term.
- Tesaurus terintegrasi : Memiliki dua fungsi utama yaitu pengambilan informasi dan pengindeksan.
Struktur Thesaurus
Thesaurus terdiri dari 2 bagian utama, yakni:
- Daftar descriptor menurut abjad : Pengelompokkan secara alfabetis yang terdiri dari kategori yang mempunyai hubungan satu sama lain.
- Daftar istilah yang merupakan panduan suatu descriptor : Merupakan pintu masuk kosa kata yang dipakai sebagai descriptor dan menunjukkan hubungan hierarkis dari masing-masing descriptor.
Fungsi Thesaurus
Thesaurus berfungsi sebagai system untuk mengolah informasi dan sarana temu kembali informasi yang berbasis computer. Sri Rohyanti, 2002, mengemukakan pendapatnya mengenai fungsi dari Thesaaurus, antara lain:
- Membantu menentukan dan menemukan istilah yang diberi definisi tertentu.
- Sangat berguna bagi orang yang bertanggung jawab terhadap peng-index-an dan retrieving dalam bidang tertentu.
- Mencapai standarisasi dan konsistensi dalam pengindeksan dokumen.
Manfaat Thesaurus
Ada beberapa manfaat dari Thesaurus diantaranya adalah:
- Menyediakan sebuah kosakata yang berstandar untuk bidang tertentu, sehingga para pengindeks (manusia) dapat secara konsisten menetapkan istilah yang akan dipakai sebagai indeks.
- Menjadi sebuah panduan bagi pengguna sistem informasi ketika memilih istilah untuk digunakan dalam pencarian berdasarkan subjek.
- Menjadi sumber bagi istilah-istilah yang sudah terstandardisasi di bidang pengetahuan tertentu.
- Menyediakan hirarki berkelas sehingga sebuah proses pencarian dapat diperluas atau dipersempit.
Tujuan Thesaurus
Dalam Encyclopedia of Library and Information Science Vol. 30 (1970) dikutip Lalu Anwar (2000) diuraikan bahwa yang menjadi tujuan utama disusunnya thesaurus, antar lain adalah sebagi berikut :
- Untuk memberikan gambaran tentang bidang ilmu pengetahuan tertentu, menunjukkan pengertian atau ide tentang konsep yang saling berhubungan, untuk membantu pengindeks atau peneliti dalam memahami struktur bidang ilmu pengetahuan tersebut.
- Untuk menyediakan kosa kata yang standar untuk bidang subyek tertentu yang dipergunakan oleh para pengindeks sacara konsisten pada saat menyusun entri indeks dalam rangka penyimpanan dan atau dalam proses temu kembali informasi.
- Untuk menyediakan sebuah sistem referensi antara istilah yang telah dipastikan hanya mempunyai satu bentuk sinonim yang digunakan untuk mengindeks sebuah dokumen.
- Untuk menyediakan panduan bagi para pemakai sistem, sehingga mereka dapat memilih istilah yang benar untuk menelusur subyek tertentu.
- Untuk menyediakan pengklasifikasian yang hierarkhis sehingga penelusur dapat memperluas atau mempersempit secara sistematis, jika pilihan pertama dalam penelusuran terlalu sedikit atau terlalu banyak petunjuk terhadap bahan yang tersedia.
Peran Thesaurus dalam Pengelolaan Informasi
Dalam kaitanya dengan pengelolaan informasi, Thesaurus berperan penting di dalamnya diantaranya:
a.Sebagai sarana temu kembali informasi yang berbasis komputer.
b.Sebagai pedoman dalam mengolah dokumen seperti pembuatan indeks dan penentuan tajuk.
c.Mempermudah dalam mengelola data yang telah ada.
d.Mempercepat diketemukannya informasi yang di cari.
Algoritma Thesaurus
Dalam ditemukannya data oleh thesaurus ini menggunakan algoritma tertentu dan algoritma yang digunakann adalah algoritma stemming.
Algoritma Stemming
Algoritma ini didahului dengan pembacaan tiap kata dari file sampel. Sehingga input dari algoritma ini adalah sebuah kata yang kemudian dilakukan:
a. Pemeriksaan semua kemungkinan bentuk kata. Setiap kata diasumsikan memiliki 2 awalan / prefiks dan 3 akhiran / sufiks. Sehingga bentuknya menjadi :
Prefiks 1 + Prefiks 2 + Kata Dasar + Sufiks 3 + Sufiks 2+ Sufiks 1
Seandainya kata tersebut tidak memiliki imbuhan sebanyak imbuhan di atas, maka imbuhan yang kosong diberi tanda x untuk prefiks dan diberi tanda xx untuk sufiks.
b. Dengan struktur data di atas, maka langkah awal pemotongan bisa dari mana saja. Dalam hal ini pemotongan dilakukan secara berurutan sebagai berikut :
- Awalan I, hasilnya disimpan pada p1
- Awalan II, hasilnya disimpan pada p2
- Akhiran I, hasilnya disimpan pada s1
- Akhiran II, hasilnya disimpan pada s2
- Akhiran III, hasilnya disimpan pada s3
Pada setiap tahap pemotongan di atas diikuti dengan pemeriksaan di kamus apakah hasil pemotongan itu sudah berada dalam bentuk dasar. Kalau pemeriksaan ini berhasil maka proses dinyatakan selesai dan tidak perlu melanjutkan proses pemotongan imbuhan lainnya.
c. Namun jika sampai pada pemotongan akhiran III, belum juga ditemukan di kamus, maka dilakukan proses kombinasi. Kata dasar yang dihasilkan dikombinasikan dengan imbuhanimbuhannya dalam 12 konfigurasi berikut :
- Kata Dasar
- Kata Dasar + Akhiran III
- Kata Dasar + Akhiran III + Akhiran II
- Kata Dasar + Akhiran III + Akhiran II + Akhiran I
- Awalan I + Awalan II + Kata Dasar
- Awalan I + Awalan II + Kata Dasar + Akhiran III
- Awalan I + Awalan II + Kata Dasar + Akhiran III + Akhiran II
- Awalan I + Awalan II + Kata Dasar + Akhiran III + AkhiranII + AkhiranI
- Awalan II + Kata Dasar
- Awalan II + Kata Dasar + Akhiran III
- Awalan II + Kata Dasar + Akhiran III + Akhiran II 3
- Awalan II + Kata Dasar + Akhiran III + Akhiran II + Akhiran I
Daftar Pustaka :
http://ladangbelajar.blogspot.co.id/2013/09/sistem-temu-kembali-informasi-thesaurus.html
http://language-komputer.blogspot.com/2011/12/thesaurus-untuk-temu-kembali-informasi.html
Jurnal : ANTARA : TESAURUS MULTI BAHASA BERBASIS KOMPONEN oleh : Siti Rochimah,Alexander L. Romy