TBI18-TI15C-P7-THESAURUS DALAM SISTEM TEMU KEMBALI INFORMASI- Rizky Arif Fauzi

THESAURUS DALAM SISTEM TEMU KEMBALI INFORMASI

 

 

     

Mata Kuliah              :  Temu Balik Informasi

Dosen Pengampu      :  Nandang Hermanto, M.Kom

Disusun Oleh             :  Ana Rofiqoh                                   15.11.0203

                                       Rizky Arif Fauzi                             15.11.0254

                                       Fadhel Widya Rakhman               15.11.0184

                                       Dodi Taruna Baskara                    15.11.0165

                                       Reza Agus Adi Pratama               15.11.0224

                                       Ahmad Yahya Asy-syidqie            15.11.0336

Kelas                           :  TI 15 C

 

PROGRAM STUDI TEKNIK INFORMATIKA

STMIK AMIKOM PURWOKERTO

2018

 

  1. Definisi Thesaurus

Berasal dari bahasa Yunani yaitu “ Thesauros yang artinya kekayaan, harta ataupun gudang tempat menyimpan harta benda atau kekayaan”. (Sri Rohyanti Z.: 2002: 1). Menurut Hornby dikutip Sri Rohyanti Z. (2002: 1) : Thesaurus adalah kamus kata-kata dan ungkapan yang dikumpulkan menurut kesamaan artinya dan sinonimnya. Dalam dunia perpustakaan, dokumntasi dan informasi, thesaurus dapat diartikan menurut fungsi dan strukturnya.

Kamus Amerika Webster’s dikutip Sri Rohyanti Z. (2002: 1) mendefinisikan thesaurus sebagai suatu ‘buku yang berisi kata atau informasi mengenai bidang subyek tertentu atau suatu kelompok konsep, seperti kamus sinonim.

Tesaurus adalah alat untuk pengawasan kosa kata (vocabulary control). (E. John Leide: 2002: 1)

 

  1. Manfaat Thesaurus

Ada beberapa manfaat dari Thesaurus diantaranya adalah:

  1. Menyediakan sebuah kosakata yang berstandar untuk bidang tertentu, sehingga para pengindeks (manusia) dapat secara konsisten menetapkan istilah yang akan dipakai sebagai indeks.
  2. Menjadi sebuah panduan bagi pengguna sistem informasi ketika memilih istilah untuk digunakan dalam pencarian berdasarkan subjek.
  3. Menjadi sumber bagi istilah-istilah yang sudah terstandardisasi di bidang pengetahuan tertentu.
  4. Menyediakan hirarki berkelas sehingga sebuah proses pencarian dapat diperluas atau dipersempit.

 

  1. Algoritma Thesaurus

Dalam ditemukannya data oleh thesaurus tidak begitu saja ditemukan. Ini menggunakan algoritma tertentu dan algoritma yang digunakann adalah algoritma stemming.

 

Algoritma Stemming

Algoritma ini didahului dengan pembacaan tiap kata dari file sampel. Sehingga input dari algoritma ini adalah sebuah kata yang kemudian dilakukan:

  1. Pemeriksaan semua kemungkinan bentuk kata. Setiap kata diasumsikan memiliki 2 awalan / prefiks dan 3 akhiran / sufiks. Sehingga bentuknya menjadi :

Prefiks 1 + Prefiks 2 + Kata Dasar + Sufiks 3 + Sufiks 2+ Sufiks 1

Seandainya kata tersebut tidak memiliki imbuhan sebanyak imbuhan di atas, maka imbuhan yangkosong  diberi tanda x untuk prefiks dan diberi tanda xx untuk sufiks. Untuk mewujudkannya maka dibuatlah struktur data untuk menampung setiap kata yang bentuknya sebagai berikut :

enum awalan_t {AwalanError=0,x,

me, pe, be, di, se, ke, te,

mem=100, men, per, pem, ber, ter,

pen,

ber_luluh, ter_luluh, per_luluh,

mem_luluh, pem_luluh, men_luluh,

pen_luluh, meny=200, peny, meng,

meng_luluh, peng_luluh, peng

};

enum akhiran_t {AkhiranError=0, i, kan, an, ku, mu, lah, pun,  nya, kah, xx};

struct arrkata_t {

enum awalan_t p1,p2;

char kd[30];

enum akhiran_t s3,s2,s1;

};

 

  1. Dengan struktur data di atas, maka langkah awal pemotongan bisa dari mana saja. Dalam hal ini pemotongan dilakukan secara berurutan sebagai berikut :
  2. Awalan I, hasilnya disimpan pada p1
  3. Awalan II, hasilnya disimpan pada p2
  4. Akhiran I, hasilnya disimpan pada s1
  5. Akhiran II, hasilnya disimpan pada s2
  6. Akhiran III, hasilnya disimpan pada s3

Pada setiap tahap pemotongan di atas diikuti dengan pemeriksaan di kamus apakah hasil pemotongan itu sudah berada dalam bentuk dasar. Kalau pemeriksaan ini berhasil maka proses dinyatakan selesai dan tidak perlu melanjutkan proses pemotongan imbuhan lainnya.

 

  1. Namun jika sampai pada pemotongan akhiran III, belum juga ditemukan di kamus, maka dilakukan proses kombinasi. Kata dasar yang dihasilkan dikombinasikan dengan imbuhan-imbuhannya dalam 12 konfigurasi berikut :
  2. Kata Dasar
  3. Kata Dasar + Akhiran III
  4. Kata Dasar + Akhiran III + Akhiran II
  5. Kata Dasar + Akhiran III + Akhiran II + Akhiran I
  6. Awalan I + Awalan II + Kata Dasar
  7. Awalan I + Awalan II + Kata Dasar + Akhiran III
  8. Awalan I + Awalan II + Kata Dasar + Akhiran III + Akhiran II
  9. Awalan I + Awalan II + Kata Dasar + Akhiran III + AkhiranII + AkhiranI
  10. Awalan II + Kata Dasar
  11. Awalan II + Kata Dasar + Akhiran III
  12. Awalan II + Kata Dasar + Akhiran III + Akhiran II 3
  13. Awalan II + Kata Dasar + Akhiran III + Akhiran II + Akhiran I

 

  1. Macam-macam Thesaurus

Untuk membangun tesaurus harus memilih di antara tiga jenis: tesaurus klasik, tesaurus pengindeksan, dan tesaurus yang mencari.

  1. Tesaurus klasik
    Thesaurus klasik digunakan untuk melakukan proses indexing dan proses searching. Dimana Indexer menggunakan thesaurus untuk memetakan varian dari istilah yang ada untuk mewakili banyak istilah pada proses indexing di level dokumen. Sedangkan Searcher menggunakan thesaurus untuk melakukan retrieval atau Temu balik.
    Istilah dalam query akan di cocokkan dengan banyak kata dalam kamus thesaurus yang memungkinkan pengelolaan sinonim, penjelajahan hierarkis, dan tautan asosiatif.

 

  1. Pengindeksan Tesaurus
    Thesaurus ini hanya memiliki proses indexing dan tidak seperti classic thesaurus yang secara lengkap memiliki proses indexing dan proses searching.
    Pada thesaurus indexing kita dapat melakukan pengindeksan kosa kata secara terkontrol, akan tetapi tidak dapat menggunakannya untuk melakukan proses searching dan memetakan varian istilah dari pengguna ke istilah terpilih dimana ini merupakan kekurangan serius.
    Alasan kenapa lebih baik ada indexing thesaurus daripada tidak ada sama sekali:
    (a) Thesaurus indexing menyusun proses indexing, mempromosikan konsistensi dan efisiensi.
    (b) Memungkinkan untuk membangun index dari kata kata terpilih yang bisa di jelajahi. Dimana memungkinkan pengguna untuk menemukan semua dokumen tentang subjek atau produk tertentu melalui satu titik akses.

 

  1. Pencarian Thesaurus
    Terkadang thesaurus klasik tidak bisa di gunakan karena ada masalah dalam pengindexan di tingkat dokumen, misal jika berurusan dengan konten pihak ketiga atau berita dinamis yang berubah setiap hari. Maka Searching thesaurus digunakan.
    Searching thesaurus memanfaatkan istilah terkontrol pada pencarian bukan pada pengindexan. Misal user memasukkan query ke mesin pencari, Searching thesaurus dapat memetakan query tersebut ke dalam istilah terkontrol sebelum mengeksekusi query tersebut pada indeks teks lengkap.

 

  1. Struktur Thesaurus

Sebuah thesaurus biasanya paling sedikit terdiri dari dua bagian utama yaitu :
(1) Daftar deskriptor (rumusan) menurut abjad; dan
(2) Daftar istilah yang merupakan panduan suatu deskriptor.

Ø Istilah yang dipergunakan sebagai deskriptor untuk mengindeks dan menelusuri informasi, yaitu daftar istilah dalam bahasa indeks yang dikelompokkan secara alpabetis yang terdiri dari faset (kategori) yang mempunyai erat antara satu sama lain.
Contoh : PERPUSTAKAAN
: PERPUSTAKAAN NASIONAL.
: PERPUSTAKAAN PERGURUAN TINGGI.
: PERPUSTAKAAN SEKOLAH.
Ø Istilah-istilah yang merupakan panduan suatu deskriptor (lead in term) yang merupakan pintu masuk kosa kata yang dipakai sebagai deskriptor dan menunjuk hubungan hierarkhis dari masing-masing deskriptor.

  1. Penerapan Thesaurus

Thesaurus sangat terlihat peran sertanya dalam temu kembali informasi ketika dalam proses penelusuran informasi, lebih utamanya lagi yaitu mengenai input query dalam pencarian bahan koleksi yang menggunakan system komputerisasi. Melalui system komputerisasi, diperlukan adanya kekayaan kosa kata dalam hal pemasukan subjek mengenai bahan koleksi yang dibutuhkan. Contoh konkritnya yaitu ketika user ingin menemukan bahan koleksi mengenai ikan, ketika user hanya memasukkan query ikan saja maka akan didapatkan indeks-indeks hasil pencarian bertemakan ikan, termasuk ikan laut maupun tawar. Tapi jika ia memasukkan query ikan tawar ataupun ikan asin, tentunya akan didapatkan indeks-indeks yang berhubungan dengan ikan tawar atau ikan asin. Itulah salah satu implikasi kehadiran thesaurus terhadap penelusuran informasi yang telah menggunakan system komputerisasi.

 

DAFTAR PUSTAKA

 

Bandono, SIP.- 2010. THESAURUS SEBAGAI SARANA TEMU KEMBALI INFORMASI UNTUK MENINGKATKAN PELAYANAN KEPADA PENGGUNA DI PERPUSTAKAAN. Diakses 09 Juli 2018, dari https://bandonoisi.wordpress.com/2010/12/20/thesaurus-sebagai-sarana-temu-kembali-informasi-untuk-meningkatkan-pelayanan-kepada-pengguna-di-perpustakaan/

 

Rofiek Andi-2009-2017. Thesaurus Untuk Temu Kembali Informasi. Diakses 09 Juli 2018, dari https://www.spesifikasihp.xyz/2011/12/thesaurus-untuk-temu-kembali-informasi.html

 

Yusuf.S dkk – 2011. softnesslibrary.blogspot.com. Diakses 09 Juli 2018, dari

http://softnesslibrary.blogspot.com/2011/11/draft-tugas-ilmu-dokumentasi-tentang.html

 

Sahid H.N-2017.THESAURUS DALAM TEMU BALIK INFORMASI. Diakses 09 Juli 2018, dari http://hirupmotekar.com/2017/06/06/niam-habibiy-sahid-thesaurus-dalam-temu-balik-informasi/

 

Download File : Word

Download PPT : Power Point