ANJAS EKO P – KONSEP THESOURUS DALAM INFORMATION DAN RETRIVAL SERTA MACAM-MACAM THESOURUS DAN ALGORITMANYA

Tugas 6 TBI

 

Nama Kelompok :

Yogi Arif Gunawan S (14.11.0148)
M. Bintang Ariviano (14.11.0151)
Kabul Agus P (14.11.0152)
Lendy Wilyan P (14.11.0154)
Andreana Ferdinand (14.11.0155)
Hendra Irawan (14.11.0156)
Anjas Eko P (14.11.0157)

 

A. Pengertian Thesaurus Menurut Para Ahli

Berasal dari bahasa Yunani yaitu “ Thesauros yang artinya kekayaan, harta ataupun gudang tempat menyimpan harta benda atau kekayaan”. (Sri Rohyanti Z.: 2002: 1)

Menurut Hornby dikutip Sri Rohyanti Z. (2002: 1) : Thesaurus adalah kamus kata-kata dan ungkapan yang dikumpulkan menurut kesamaan artinya dan sinonimnya. Dalam dunia perpustakaan, dokumntasi dan informasi, thesaurus dapat diartikan menurut fungsi dan strukturnya.

Kamus Amerika Webster’s dikutip Sri Rohyanti Z. (2002: 1) mendefinisikan thesaurus sebagai suatu ‘buku yang berisi kata atau informasi mengenai bidang subyek tertentu atau suatu kelompok konsep, seperti kamus sinonim.

B. Struktur Thesaurus

Sebuah thesaurus biasanya paling sedikit terdiri dari dua bagian utama yaitu :

Daftar deskriptor (rumusan) menurut abjad; dan

Daftar istilah yang merupakan panduan suatu deskriptor.

Istilah yang dipergunakan sebagai deskriptor untuk mengindeks dan menelusuri informasi, yaitu daftar istilah dalam bahasa indeks yang dikelompokkan secara alpabetis yang terdiri dari faset (kategori) yang mempunyai erat antara satu sama lain.

Contoh :

Perpustakaan, Perpustakaan Nasional, Perpustakaan Perguruan Tinggi, Perpustakaan sekolah

C. Fungsi Thesaurus

Thesaurus dapat berfungsi sebagai sistem untuk mengolah informasi dan sarana temu kembali informasi yang berbasis komputer. Sebagai sistem pengelolaan informasi, thesaurus dapat berfungsi sebagai pedoman dalam mengolah dokumen seperti pembuatan indeks dan penentuan tajuk. Sebagai sarana temu kembali informasi, thesaurus terdiri dari komponen-komponen pokok yang dapat digunakan dalam sistem temu kembali informasi seperti struktur kosa kata kendali dan sistem acuan.

Dalam proses temu kembali informasi berbasis komputer, pemakai harus menyediakan pertanyaan (query) yang diperlukan dengan menggunakan kata kunci (keyword). Thesaurus menyediakan daftar kata-kata kunci yang disusun secra alpabetis dengan sinonim yang berdekatan dan sering dikembangkan untuk mencakup beberapa indikasi dari istilah yang luas (broader term) dan istilah khusus (narrower term). Dengan kata lain bahwa thesaurus dalam fungsinya sebagai sarana temu kembali informasi, bahwa kosa kata yang terdapat dalam thesaurus dapat dipergunakan sebagai kata kunci (key word) untuk membuat pertanyaan (query) dalam proses temu kembali informasi seperti dilakukan dalam pengoperasiaan Boolean Logic.

Seperti kegunaan atau fungsi sebuah kamus atau daftar kata-kata adalah memberikan definisi atau penjelasan arti tentang kata dan istilah tersebut, menurut Sri Rohyanti Z. (2002) maka thesaurus berguna untuk :

  1. Membantu menentukan dan menemukan istilah yang diberi definisi tersebut.
  2. Sangat berguna bagi orang yang bertanggungjawab terhadap indexing dan retrieving dalam bidang tertentu.
  3. Mencapai standardisasi dan konsistensi dalam pengindeksan dokumen.

D. Tujuan Thesaurus

Dalam Encyclopedia of Library and Information Science Vol. 30 (1970) dikutip Lalu Anwar (2000) diuraikan bahwa yang menjadi tujuan utama disusunnya thesaurus, antar lain adalah sebagi berikut :

  1. Untuk memberikan gambaran tentang bidang ilmu pengetahuan tertentu, menunjukkan pengertian atau ide tentang konsep yang saling berhubungan, untuk membantu pengindeks atau peneliti dalam memahami struktur bidang ilmu pengetahuan tersebut.
  2. Untuk menyediakan kosa kata yang standar untuk bidang subyek tertentu yang dipergunakan oleh para pengindeks sacara konsisten pada saat menyusun entri indeks dalam rangka penyimpanan dan atau dalam proses temu kembali informasi.
  3. Untuk menyediakan sebuah sistem referensi antara istilah yang telah dipastikan hanya mempunyai satu bentuk sinonim yang digunakan untuk mengindeks sebuah dokumen.
  4. Untuk menyediakan panduan bagi para pemakai sistem, sehingga mereka dapat memilih istilah yang benar untuk menelusur subyek tertentu.
  5. Untuk menyediakan pengklasifikasian yang hierarkhis sehingga penelusur dapat memperluas atau mempersempit secara sistematis, jika pilihan pertama dalam penelusuran terlalu sedikit atau terlalu banyak petunjuk terhadap bahan yang tersedia.

E. Algoritma Thesaurus

Dalam ditemukannya data oleh thesaurus tidak begitu saja ditemukan. Ini menggunakan algoritma tertentu dan algoritma yang digunakann adalah algoritma stemming.

F. Algoritma Stemming

Algoritma ini didahului dengan pembacaan tiap kata dari file sampel. Sehingga input dari algoritma ini adalah sebuah kata yang kemudian dilakukan:

1. Pemeriksaan semua kemungkinan bentuk kata. Setiap kata diasumsikan memiliki 2 awalan / prefiks dan 3 akhiran / sufiks. Sehingga bentuknya menjadi :

Prefiks 1 + Prefiks 2 + Kata Dasar + Sufiks 3 + Sufiks 2+ Sufiks 1

Seandainya kata tersebut tidak memiliki imbuhan sebanyak imbuhan di atas, maka imbuhan yangkosong  diberi tanda x untuk prefiks dan diberi tanda xx untuk sufiks. Untuk mewujudkannya maka dibuatlah struktur data untuk menampung setiap kata yang bentuknya sebagai berikut :

enum awalan_t {AwalanError=0,x,

me, pe, be, di, se, ke, te,

mem=100, men, per, pem, ber, ter,

pen,

ber_luluh, ter_luluh, per_luluh,

mem_luluh, pem_luluh, men_luluh,

pen_luluh, meny=200, peny, meng,

meng_luluh, peng_luluh, peng

};

enum akhiran_t {AkhiranError=0, i, kan, an, ku, mu, lah, pun,  nya, kah, xx};

struct arrkata_t {

enum awalan_t p1,p2;

char kd[30];

enum akhiran_t s3,s2,s1;

};

2. Dengan struktur data di atas, maka langkah awal pemotongan bisa dari mana saja. Dalam hal ini pemotongan dilakukan secara berurutan sebagai berikut :

  • Awalan I, hasilnya disimpan pada p1
  • Awalan II, hasilnya disimpan pada p2
  • Akhiran I, hasilnya disimpan pada s1
  • Akhiran II, hasilnya disimpan pada s2
  • Akhiran III, hasilnya disimpan pada s3

Pada setiap tahap pemotongan di atas diikuti dengan pemeriksaan di kamus apakah hasil pemotongan itu sudah berada dalam bentuk dasar. Kalau pemeriksaan ini berhasil maka proses dinyatakan selesai dan tidak perlu melanjutkan proses pemotongan imbuhan lainnya.

3. Namun jika sampai pada pemotongan akhiran III, belum juga ditemukan di kamus, maka dilakukan proses kombinasi. Kata dasar yang dihasilkan dikombinasikan dengan imbuhanimbuhannya dalam 12 konfigurasi berikut :

  • Kata Dasar
  • Kata Dasar + Akhiran III
  • Kata Dasar + Akhiran III + Akhiran II
  • Kata Dasar + Akhiran III + Akhiran II + Akhiran I
  • Awalan I + Awalan II + Kata Dasar
  • Awalan I + Awalan II + Kata Dasar + Akhiran III
  • Awalan I + Awalan II + Kata Dasar + Akhiran III + Akhiran II
  • Awalan I + Awalan II + Kata Dasar + Akhiran III + AkhiranII + AkhiranI
  • Awalan II + Kata Dasar
  • Awalan II + Kata Dasar + Akhiran III
  • Awalan II + Kata Dasar + Akhiran III + Akhiran II 3
  • Awalan II + Kata Dasar + Akhiran III + Akhiran II + Akhiran I

G. Refrensi

https://bandonoisi.wordpress.com/2010/12/20/thesaurus-sebagai-sarana-temu-kembali-informasi-untuk-meningkatkan-pelayanan-kepada-pengguna-di-perpustakaan/

http://indonesian.abcthesaurus.com/browse_synonyms/synonyms_for_bermacam-macam.html

http://jejeffri.blogspot.co.id/2011/01/tesaurus_21.html

http://language-komputer.blogspot.com/2011/12/thesaurus-untuk-temu-kembali-informasi.html?m=1

H. File Presentasi

Download