TBI18-TI15C-P7-MODEL LATENT SEMANTIC INDEXING-EKO PRASETYO

Latent Semantik Indexing

 

Pengertian

Latent – Laten adalah teknik untuk menganalisis keyword-keyword yang ada di satu halaman.

Semantic – Semantic adalah teknik yang dilakukan mesin pencari untuk mencocokkan hubungan antara keyword di satu halaman dengan halaman lain.

Indexing – Indexing adalah Proses pengindeksan oleh search engine ke database mereka.

LSI adalah sebuah algoritma yang mirip dengan proses pemikiran yang sebenarnya “manusia” akan melakukan searching dalam rangka untuk menentukan apakah hasil dari permintaan mereka relevan dengan apa yang mereka cari

Latent Semantic Indexing atau disingkat LSI adalah teknik pengindeksan-analisis, mendaftar atau mengkategorikan kata kunci atau frasa tertentu dalam isi dari berbagai website, buku atau dokumen dengan sedemikian rupa sehingga mereka memiliki kontekstual dan konseptual yang sama atau terkait dengan maksud dan arti meskipun menggunakan kata yang berbeda di dalamnya.

 

Tujuan dari LSI

mendapatkan suatu pemodelan yang efektif untuk merepresentasikan hubungan antara kata kunci dan dokumen yang dicari. Dari sekumpulan kata kunci, yang tadinya tidak lengkap dan tidak sesuai, menjadi sekunpulan objek yang berhubungan.

 

Konsep dari LSI

  1. Text Operations pada Querydan Document Collection.
  2. Matrix Creation
  3. SVD Decomposision
  4. Query vertor creation
  5. Query vertor Mapping
  6. Ranking
  7. Hasil  ahir

 

Alur pada LSI

Dibagi 2 (dua) kolom, yaitu kolom sebelah kiri yaitu query dan kolom sebelah kanan kanan yaitu, koleksi dokumen. Pada proses sebelah kiri, query diproses melalui operasi teks, 17 kemudian vektor query dibentuk. Vektor query yang dibentuk dipetakan menjadi vektor query terpeta (mapped query vector). Dalam membentuk query terpeta, diperlukan hasil dekomposisi nilai singular dari koleksi dokumen. Pada koleksi dokumen, dilakukan operasi teks pada koleksi dokumen, kemudian matriks katadokumen (terms-documents matrix) dibentuk, selanjutnya dilakukan dekomposisi nilai singular (Singular Value Decomposition) pada matriks kata-dokumen. Hasil dekomposisi disimpan dalam collection index. Proses ranking dilakukan dengan menghitung relevansi antara vektor query terpeta dan collection index. Selanjutnya, hasil perhitungan relevansi ditampilkan ke pengguna.

 

Bagaimana LSI Bekerja

Google akan melihat kosa kata lain pada halaman Anda kemudian melakukan analisis statistik dari konteks dan sintaks dari kosa kata tersebut. Jika pengguna Google mencari ‘sejarah kunci keamanan’ maka Google akan mengambil kosakata lain dari halaman-halamannya diindeks ke rekening. Jika halaman Anda berisi kata-kata seperti ‘kunci,’ ‘tuas,’ dan ‘pintu’ maka akan mengasosiasikan kosakata ini dengan kunci keamanan.

Setelah mengambil faktor peringkat lainnya diperhitungkan, maka akan daftar halaman Anda di halaman hasil pencarian untuk kata kunci tersebut (sejarah kunci keamanan) peringkat sesuai dengan manfaat yang Google percaya akan menawarkan untuk pencari.

 

Penerapan

Latent Semantik Indexing tadinya dipergunakan pada AdSense agar iklan yang dipasang lebih terarah dengan kecocokan antara materi iklan dan konten halaman page yang ditumpanginya. Algoritma ini bukan hanya menganalisa konten halaman tetapi juga temanya.

Google mengaplikasikannya pada algoritma ranking, disusul oleh search engine lain. Metode yang dipakai menganalisa kata-kata yang natural dalam bahasa sehari-hari termasuk sinonim dan hubungan-hubungan lain dari kata-kata yang membangun konten kemudian dihubungkan dengan tema halaman secara keseluruhan.

 

Manfaat

Metode Latent Semantic Indexing (LSI), sangat bermanfaat untuk digunakan pada search engine, karena dengan metode ini search engine dapat mencari dokumen yang diinginkan oleh pengguna dengan lebih akurat. Hal ini terbukti pada search engine Google yang mampu menghasilkan pencarian yang akurat dengan pemanfaatan waktu yang lebih sedikit.

 

Referensi :

Pengertian Latent Semantic Indexing

http://kemalseo.blogspot.com/2013/12/pengertian-latent-semantic-indexing.html

TBI Latent Semantic Indexing : Dian Santosa

Download ppt