Review Jurnal International : Information Retrieval Techniques and Applications
Selama ribuan tahun orang menyadari pentingnya pengarsipan dan mencari informasi. Dengan munculnya komputer, menjadi mungkin untuk menyimpan sejumlah besar informasi. Information retrieval (IR) umumnya berkaitan dengan pencarian dan pengambilan informasi berbasis pengetahuan dari database.
Dalam tulisan ini, Dalam makalah Review ini, penulis mendeskripsikan berbagai metode pengindeksan untuk mengurangi ruang pencarian dan teknik pencarian yang berbeda untuk mengambil informasi.
Information retrieval (IR) model
Model IR menentukan rincian representasi dokumen, representasi kueri dan fungsi pengambilan. Di sini penulis Model IR fundamental dapat diklasifikasikan ke dalam 4 model yaitu :
- Boolean model, Model Boolean adalah model awal pencarian informasi. Menggunakan logika matematika George Boole, persyaratan query dan pertanyaan mereka. Kumpulan dokumen yang sesuai dapat digabungkan untuk membentuk kumpulan dokumen baru. Model Boolean memungkinkan penggunaanoperator aljabar Boolean, AND, OR dan NOT, untuk formulasi query.

- Vector space model, Gerard Salton dan rekan-rekannya menyarankan sebuah model berdasarkan kriteria Luhn’s similarity yang memiliki motivasi teoritis yang lebih kuat (Salton dan McGill 1983). Dalam Vector Space Model (VSM), dokumen dan kueri diwakili sebagai Vektor dan sudut antara keduanya. Vektor dihitung dengan menggunakan fungsi kosinus kesamaan. Kesamaan Fungsi kosinus dapat didefinisikan sebagai:
Vector Space Model (VSM) telah memperkenalkan skema bobot istilah yang dikenal dengan sebutan if-idf weighting. Bobot ini memiliki faktor frekwensi frekuensi (tf) yang mengukur frekuensi kemunculan istilah dalam teks dokumen atau kueri dan faktor frekuensi dokumen terbalik (idf) yang mengukur kebalikan dari jumlah dokumen yang berisi kueri atau istilah dokumen. - Probabilistic model, Sedangkan Maron dan Kuhns memperkenalkan peringkat berdasarkan kemungkinan relevansinya, Stephen Robertsonlah yang mengubah gagasan tersebut menjadi sebuah prinsip. Dia merumuskan prinsip peringkat probabilitas, yang dikaitkan dengan William Cooper.
- Inference network model, dalam model ini, pengambilan dokumen dimodelkan sebagai proses inferensi dalam jaringan inferensi. Sebagian besar teknik yang digunakan oleh sistem IR dapat diimplementasikan dengan model ini. Dalam implementasi model yang paling sederhana, sebuah dokumen memberi contoh sebuah istilah dengan kekuatan tertentu, dan kredit dari beberapa istilah terakumulasi diberi queri untuk menghitung nilai numerik yang setara dengan dokumen.Dari perspektif operasional, kekuatan instantiasi sebuah istilah untuk sebuah dokumen dapat dianggap sebagai bobot istilah dalam dokumen, dan peringkat dokumen dalam bentuk sederhana dari model ini menjadi serupa dengan rangking dalam model ruang vektor dan probabilistik. Model yang dijelaskan di atas. Kekuatan instantiasi istilah untuk dokumen tidak didefinisikan oleh model, dan setiap formulasi dapat digunakan.
INDEXING TECHNIQUES
Ada beberapa teknik pengindeksan pencarian informasi :
- Signature File, dalam metode file tanda tangan setiap dokumen menghasilkan string bit (“tanda tangan”) dengan menggunakan hashing pada kata-katanya dan pengkodean yang dilapiskan. Tanda tangan dokumen yang dihasilkan disimpan secara berurutan dalam file terpisah yang disebut file tanda tangan, yang jauh lebih kecil dari file aslinya, dan dapat dicari lebih cepat .
- Inversion Indices, setiap dokumen dapat diwakili oleh daftar kata kunci yang menggambarkan isi dokumen untuk tujuan pencarian. Pengambilan cepat bisa tercapai jika kita membalikkan kata kunci tersebut. Kata kunci disimpan, misalnya menurut abjad; Dalam file indeks untuk setiap kata kunci kami menyimpan daftar petunjuk ke dokumen kualifikasi dalam file posting. Metode ini diikuti oleh hampir semua sistem komersial .
SEARCHING TECHNIQUES
Ada berbagai algoritma pencarian, disini penulis membahas 3 yaitu :
- linear search algorithm, dalam algoritma pencarian linier adalah metode untuk menemukan elemen atau kata kunci tertentu dari daftar atau array yang memeriksa setiap elemen dalam daftar, satu per satu dan berurutan. Pencarian linier adalah algoritma pencarian yang paling sederhana. Salah satu kelemahan pencarian linier yang paling penting adalah kecepatan pencarian yang lambat dalam daftar pesanan. Pencarian ini juga dikenal sebagai sequential search.
- Brute force search, pencarian brute force adalah teknik pemecahan masalah yang sangat umum yang terdiri dari perhitungan secara sistematis semua kandidat yang mungkin untuk solusi dan memeriksa apakah masing-masing kandidat memenuhi pernyataan masalah. Algoritma brute force sederhana untuk diimplementasikan dan akan selalu mencari solusi jika ada.
- Binary search algorithm, algoritma pencarian biner, menemukan posisi elemen yang ditentukan dengan menggunakan nilai kunci dengan array yang diurutkan. Pada setiap langkah, algoritma membandingkan nilai kunci pencarian dengan nilai kunci elemen tengah dari array. Jika kunci cocok, maka elemen yang cocok telah ditemukan dan indeks, atau posisinya, dikembalikan. Jika tidak, jika kunci pencarian kurang dari kunci elemen tengah, maka algoritma akan mengulangi aksinya pada sub-array di sebelah kiri elemen tengah atau, jika tombol pencarian lebih besar, pada subarray ke kanan. Jika array yang tersisa untuk dicari kosong, maka kunci tidak dapat ditemukan dalam array dan indikasi “tidak ditemukan” khusus dikembalikan.
AREA OF Information retrieval (IR) APPLICATION
Sistem pencarian informasi (IR) pertama kali dikembangkan untuk membantu mengelola sejumlah besar informasi. Banyak universitas, perusahaan, dan perpustakaan umum sekarang menggunakan sistem IR untuk menyediakan akses ke buku, jurnal, dan dokumen lainnya. Pencarian informasi digunakan hari ini di banyak aplikasi. Aplikasi umum sistem pencarian informasi adalah sebagai berikut:
- Digital Library, perpustakaan digital adalah perpustakaan dimana koleksi disimpan dalam format digital dan dapat diakses oleh komputer. Konten digital dapat disimpan secara lokal, atau diakses dari jarak jauh melalui jaringan komputer. Perpustakaan digital adalah jenis sistem pencarian informasi.
- Search Engines, mesin pencari adalah salah satu aplikasi praktis teknik pencarian informasi untuk koleksi teks berskala besar. Mesin pencari web adalah contoh yang paling terkenal, namun banyak pencarian lainnya ada, seperti: Pencarian desktop, pencarian Enterprise, pencarian Federasi, pencarian Mobile, dan pencarian sosial.
- Media Search, sistem pengambilan gambar adalah sistem komputer untuk browsing, mencari dan mengambil gambar dari database gambar digital yang besar.
KESIMPULAN :
Di sini penulis menyimpulkan bahwa, pencarian informasi adalah proses pencarian dan pengambilan informasi berbasis pengetahuan dari kumpulan dokumen. jurnal ini telah membahas dasar-dasar pencarian informasi. Pada bagian pertama kita mendefinisikan sistem pencarian informasi dengan pengukuran dasarnya. Setelah itu penulis membahas model IR dan juga membahas tentang teknik pengindeksan dan teknik pencarian yang berbeda. Makalah ini juga mencakup area aplikasi IR.